Gespeichert in:
| Hauptverfasser: | Chu, KuanChao, Chen, Yi-Pei, Nakayama, Hideki |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2406.09972 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
LLM as a Scorer: The Impact of Output Order on Dialogue Evaluation
von: Chen, Yi-Pei, et al.
Veröffentlicht: (2024)
von: Chen, Yi-Pei, et al.
Veröffentlicht: (2024)
Exploring and Controlling Diversity in LLM-Agent Conversation
von: Chu, KuanChao, et al.
Veröffentlicht: (2024)
von: Chu, KuanChao, et al.
Veröffentlicht: (2024)
Cohesive Conversations: Enhancing Authenticity in Multi-Agent Simulated Dialogues
von: Chu, KuanChao, et al.
Veröffentlicht: (2024)
von: Chu, KuanChao, et al.
Veröffentlicht: (2024)
Enhanced Data Transfer Cooperating with Artificial Triplets for Scene Graph Generation
von: Chu, KuanChao, et al.
Veröffentlicht: (2024)
von: Chu, KuanChao, et al.
Veröffentlicht: (2024)
Recent Trends in Personalized Dialogue Generation: A Review of Datasets, Methodologies, and Evaluations
von: Chen, Yi-Pei, et al.
Veröffentlicht: (2024)
von: Chen, Yi-Pei, et al.
Veröffentlicht: (2024)
Post Persona Alignment for Multi-Session Dialogue Generation
von: Chen, Yi-Pei, et al.
Veröffentlicht: (2025)
von: Chen, Yi-Pei, et al.
Veröffentlicht: (2025)
Think Together and Work Better: Combining Humans' and LLMs' Think-Aloud Outcomes for Effective Text Evaluation
von: Chu, SeongYeub, et al.
Veröffentlicht: (2024)
von: Chu, SeongYeub, et al.
Veröffentlicht: (2024)
AnswerCarefully: A Dataset for Improving the Safety of Japanese LLM Output
von: Suzuki, Hisami, et al.
Veröffentlicht: (2025)
von: Suzuki, Hisami, et al.
Veröffentlicht: (2025)
PromptEmbedder:: Efficient and Transferable Text Embedding via Dual-LLM Soft Prompting
von: Tsai, Yu-Che, et al.
Veröffentlicht: (2026)
von: Tsai, Yu-Che, et al.
Veröffentlicht: (2026)
Extracting Prompts by Inverting LLM Outputs
von: Zhang, Collin, et al.
Veröffentlicht: (2024)
von: Zhang, Collin, et al.
Veröffentlicht: (2024)
FeedEval: Pedagogically Aligned Evaluation of LLM-Generated Essay Feedback
von: Chu, Seongyeub, et al.
Veröffentlicht: (2026)
von: Chu, Seongyeub, et al.
Veröffentlicht: (2026)
Evaluating Chinese Ambiguity Understanding in Large Language Models
von: Mo, Junwen, et al.
Veröffentlicht: (2026)
von: Mo, Junwen, et al.
Veröffentlicht: (2026)
Optimizing Prompts for Text-to-Image Generation
von: Hao, Yaru, et al.
Veröffentlicht: (2022)
von: Hao, Yaru, et al.
Veröffentlicht: (2022)
$p1$: Better Prompt Optimization with Fewer Prompts
von: Gao, Zhaolin, et al.
Veröffentlicht: (2026)
von: Gao, Zhaolin, et al.
Veröffentlicht: (2026)
The Devil is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation
von: Gao, Bingjie, et al.
Veröffentlicht: (2025)
von: Gao, Bingjie, et al.
Veröffentlicht: (2025)
Auto-Demo Prompting: Leveraging Generated Outputs as Demonstrations for Enhanced Batch Prompting
von: Feng, Longyu, et al.
Veröffentlicht: (2024)
von: Feng, Longyu, et al.
Veröffentlicht: (2024)
A Comprehensive Information-Decomposition Analysis of Large Vision-Language Models
von: Xiu, Lixin, et al.
Veröffentlicht: (2026)
von: Xiu, Lixin, et al.
Veröffentlicht: (2026)
LLM-GLOBE: A Benchmark Evaluating the Cultural Values Embedded in LLM Output
von: Karinshak, Elise, et al.
Veröffentlicht: (2024)
von: Karinshak, Elise, et al.
Veröffentlicht: (2024)
HPSS: Heuristic Prompting Strategy Search for LLM Evaluators
von: Wen, Bosi, et al.
Veröffentlicht: (2025)
von: Wen, Bosi, et al.
Veröffentlicht: (2025)
When "Better" Prompts Hurt: Evaluation-Driven Iteration for LLM Applications
von: Commey, Daniel
Veröffentlicht: (2026)
von: Commey, Daniel
Veröffentlicht: (2026)
Better by Comparison: Retrieval-Augmented Contrastive Reasoning for Automatic Prompt Optimization
von: Lee, Juhyeon, et al.
Veröffentlicht: (2025)
von: Lee, Juhyeon, et al.
Veröffentlicht: (2025)
Latent Space Chain-of-Embedding Enables Output-free LLM Self-Evaluation
von: Wang, Yiming, et al.
Veröffentlicht: (2024)
von: Wang, Yiming, et al.
Veröffentlicht: (2024)
Benchmarking LLM-as-a-Judge for Long-Form Output Evaluation
von: Chen, Junjie, et al.
Veröffentlicht: (2026)
von: Chen, Junjie, et al.
Veröffentlicht: (2026)
Towards Better Open-Ended Text Generation: A Multicriteria Evaluation Framework
von: Arias, Esteban Garces, et al.
Veröffentlicht: (2024)
von: Arias, Esteban Garces, et al.
Veröffentlicht: (2024)
MOPO: Multi-Objective Prompt Optimization for Affective Text Generation
von: Resendiz, Yarik Menchaca, et al.
Veröffentlicht: (2024)
von: Resendiz, Yarik Menchaca, et al.
Veröffentlicht: (2024)
UCSC at SemEval-2025 Task 3: Context, Models and Prompt Optimization for Automated Hallucination Detection in LLM Output
von: Huang, Sicong, et al.
Veröffentlicht: (2025)
von: Huang, Sicong, et al.
Veröffentlicht: (2025)
Universal Prompt Optimizer for Safe Text-to-Image Generation
von: Wu, Zongyu, et al.
Veröffentlicht: (2024)
von: Wu, Zongyu, et al.
Veröffentlicht: (2024)
Conan-embedding: General Text Embedding with More and Better Negative Samples
von: Li, Shiyu, et al.
Veröffentlicht: (2024)
von: Li, Shiyu, et al.
Veröffentlicht: (2024)
A Text-To-Text Alignment Algorithm for Better Evaluation of Modern Speech Recognition Systems
von: Borgholt, Lasse, et al.
Veröffentlicht: (2025)
von: Borgholt, Lasse, et al.
Veröffentlicht: (2025)
Meaning Typed Prompting: A Technique for Efficient, Reliable Structured Output Generation
von: Irugalbandara, Chandra
Veröffentlicht: (2024)
von: Irugalbandara, Chandra
Veröffentlicht: (2024)
Prompt Optimization and Evaluation for LLM Automated Red Teaming
von: Freenor, Michael, et al.
Veröffentlicht: (2025)
von: Freenor, Michael, et al.
Veröffentlicht: (2025)
PrahokBART: A Pre-trained Sequence-to-Sequence Model for Khmer Natural Language Generation
von: Kaing, Hour, et al.
Veröffentlicht: (2025)
von: Kaing, Hour, et al.
Veröffentlicht: (2025)
DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection
von: Yu, Xiao, et al.
Veröffentlicht: (2023)
von: Yu, Xiao, et al.
Veröffentlicht: (2023)
Perspective Dial: Measuring Perspective of Text and Guiding LLM Outputs
von: Kim, Taejin, et al.
Veröffentlicht: (2025)
von: Kim, Taejin, et al.
Veröffentlicht: (2025)
SelfPrompt: Autonomously Evaluating LLM Robustness via Domain-Constrained Knowledge Guidelines and Refined Adversarial Prompts
von: Pei, Aihua, et al.
Veröffentlicht: (2024)
von: Pei, Aihua, et al.
Veröffentlicht: (2024)
On the Implications of Verbose LLM Outputs: A Case Study in Translation Evaluation
von: Briakou, Eleftheria, et al.
Veröffentlicht: (2024)
von: Briakou, Eleftheria, et al.
Veröffentlicht: (2024)
A Course Shared Task on Evaluating LLM Output for Clinical Questions
von: Hou, Yufang, et al.
Veröffentlicht: (2024)
von: Hou, Yufang, et al.
Veröffentlicht: (2024)
Prompt Stability Matters: Evaluating and Optimizing Auto-Generated Prompt in General-Purpose Systems
von: Chen, Ke, et al.
Veröffentlicht: (2025)
von: Chen, Ke, et al.
Veröffentlicht: (2025)
Evaluating Prompt Engineering Strategies for Sentiment Control in AI-Generated Texts
von: Sahler, Kerstin, et al.
Veröffentlicht: (2026)
von: Sahler, Kerstin, et al.
Veröffentlicht: (2026)
AQAScore: Evaluating Semantic Alignment in Text-to-Audio Generation via Audio Question Answering
von: Kuan, Chun-Yi, et al.
Veröffentlicht: (2026)
von: Kuan, Chun-Yi, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
LLM as a Scorer: The Impact of Output Order on Dialogue Evaluation
von: Chen, Yi-Pei, et al.
Veröffentlicht: (2024) -
Exploring and Controlling Diversity in LLM-Agent Conversation
von: Chu, KuanChao, et al.
Veröffentlicht: (2024) -
Cohesive Conversations: Enhancing Authenticity in Multi-Agent Simulated Dialogues
von: Chu, KuanChao, et al.
Veröffentlicht: (2024) -
Enhanced Data Transfer Cooperating with Artificial Triplets for Scene Graph Generation
von: Chu, KuanChao, et al.
Veröffentlicht: (2024) -
Recent Trends in Personalized Dialogue Generation: A Review of Datasets, Methodologies, and Evaluations
von: Chen, Yi-Pei, et al.
Veröffentlicht: (2024)