Gespeichert in:
| Hauptverfasser: | Zhang, Yunxiang, Zhou, Kang, Xu, Zhichao, Ramnath, Kiran, Zhou, Yun, Woo, Sangmin, Ding, Haibo, Cheong, Lin Lee |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2601.17596 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Beyond Correctness: Rewarding Faithful Reasoning in Retrieval-Augmented Generation
von: Xu, Zhichao, et al.
Veröffentlicht: (2025)
von: Xu, Zhichao, et al.
Veröffentlicht: (2025)
Diffusion Language Model Inference with Monte Carlo Tree Search
von: Huang, Zheng, et al.
Veröffentlicht: (2025)
von: Huang, Zheng, et al.
Veröffentlicht: (2025)
Black-Box Visual Prompt Engineering for Mitigating Object Hallucination in Large Vision Language Models
von: Woo, Sangmin, et al.
Veröffentlicht: (2025)
von: Woo, Sangmin, et al.
Veröffentlicht: (2025)
An Empirical Study of Automating Agent Evaluation
von: Zhou, Kang, et al.
Veröffentlicht: (2026)
von: Zhou, Kang, et al.
Veröffentlicht: (2026)
CSPLADE: Learned Sparse Retrieval with Causal Language Models
von: Xu, Zhichao, et al.
Veröffentlicht: (2025)
von: Xu, Zhichao, et al.
Veröffentlicht: (2025)
A Systematic Survey of Automatic Prompt Optimization Techniques
von: Ramnath, Kiran, et al.
Veröffentlicht: (2025)
von: Ramnath, Kiran, et al.
Veröffentlicht: (2025)
Reinforcement Learning for LLM Post-Training: A Survey
von: Wang, Zhichao, et al.
Veröffentlicht: (2024)
von: Wang, Zhichao, et al.
Veröffentlicht: (2024)
Synthetic Sandbox for Training Machine Learning Engineering Agents
von: Zhou, Yuhang, et al.
Veröffentlicht: (2026)
von: Zhou, Yuhang, et al.
Veröffentlicht: (2026)
LAMA-UT: Language Agnostic Multilingual ASR through Orthography Unification and Language-Specific Transliteration
von: Lee, Sangmin, et al.
Veröffentlicht: (2024)
von: Lee, Sangmin, et al.
Veröffentlicht: (2024)
PromptPrism: A Linguistically-Inspired Taxonomy for Prompts
von: Jeoung, Sullam, et al.
Veröffentlicht: (2025)
von: Jeoung, Sullam, et al.
Veröffentlicht: (2025)
PAFT: A Parallel Training Paradigm for Effective LLM Fine-Tuning
von: Pentyala, Shiva Kumar, et al.
Veröffentlicht: (2024)
von: Pentyala, Shiva Kumar, et al.
Veröffentlicht: (2024)
MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering
von: Chan, Jun Shern, et al.
Veröffentlicht: (2024)
von: Chan, Jun Shern, et al.
Veröffentlicht: (2024)
BayesFlow: A Probability Inference Framework for Meta-Agent Assisted Workflow Generation
von: Yuan, Bo, et al.
Veröffentlicht: (2026)
von: Yuan, Bo, et al.
Veröffentlicht: (2026)
ML-Agent: Reinforcing LLM Agents for Autonomous Machine Learning Engineering
von: Liu, Zexi, et al.
Veröffentlicht: (2025)
von: Liu, Zexi, et al.
Veröffentlicht: (2025)
Advancing Multi-Agent RAG Systems with Minimalist Reinforcement Learning
von: Wu, Yihong, et al.
Veröffentlicht: (2025)
von: Wu, Yihong, et al.
Veröffentlicht: (2025)
Accelerating Large Language Model Inference via Early-Exiting Algorithms
von: Bae, Sangmin
Veröffentlicht: (2025)
von: Bae, Sangmin
Veröffentlicht: (2025)
SAGE-LD: Towards Scalable and Generalizable End-to-End Language Diarization via Simulated Data Augmentation
von: Lee, Sangmin, et al.
Veröffentlicht: (2025)
von: Lee, Sangmin, et al.
Veröffentlicht: (2025)
LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble
von: Lee, Yujeong, et al.
Veröffentlicht: (2024)
von: Lee, Yujeong, et al.
Veröffentlicht: (2024)
UniCoM: A Universal Code-Switching Speech Generator
von: Lee, Sangmin, et al.
Veröffentlicht: (2025)
von: Lee, Sangmin, et al.
Veröffentlicht: (2025)
Multi-Agent Visual-Language Reasoning for Comprehensive Highway Scene Understanding
von: Yang, Yunxiang, et al.
Veröffentlicht: (2025)
von: Yang, Yunxiang, et al.
Veröffentlicht: (2025)
Co-Learning: Code Learning for Multi-Agent Reinforcement Collaborative Framework with Conversational Natural Language Interfaces
von: Yu, Jiapeng, et al.
Veröffentlicht: (2024)
von: Yu, Jiapeng, et al.
Veröffentlicht: (2024)
Structured Prompting and Multi-Agent Knowledge Distillation for Traffic Video Interpretation and Risk Inference
von: Yang, Yunxiang, et al.
Veröffentlicht: (2025)
von: Yang, Yunxiang, et al.
Veröffentlicht: (2025)
Scaling Personality Control in LLMs with Big Five Scaler Prompts
von: Cho, Gunhee, et al.
Veröffentlicht: (2025)
von: Cho, Gunhee, et al.
Veröffentlicht: (2025)
FMBench: Adaptive Large Language Model Output Formatting
von: Wang, Yaoting, et al.
Veröffentlicht: (2026)
von: Wang, Yaoting, et al.
Veröffentlicht: (2026)
SLOT: Structuring the Output of Large Language Models
von: Wang, Darren Yow-Bang, et al.
Veröffentlicht: (2025)
von: Wang, Darren Yow-Bang, et al.
Veröffentlicht: (2025)
Symbolic Learning Enables Self-Evolving Agents
von: Zhou, Wangchunshu, et al.
Veröffentlicht: (2024)
von: Zhou, Wangchunshu, et al.
Veröffentlicht: (2024)
Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation
von: Khalifa, Muhammad, et al.
Veröffentlicht: (2026)
von: Khalifa, Muhammad, et al.
Veröffentlicht: (2026)
SERM: Self-Evolving Relevance Model with Agent-Driven Learning from Massive Query Streams
von: Wang, Chenglong, et al.
Veröffentlicht: (2026)
von: Wang, Chenglong, et al.
Veröffentlicht: (2026)
ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning
von: Wan, Ziyu, et al.
Veröffentlicht: (2025)
von: Wan, Ziyu, et al.
Veröffentlicht: (2025)
Learning to Use Tools via Cooperative and Interactive Agents
von: Shi, Zhengliang, et al.
Veröffentlicht: (2024)
von: Shi, Zhengliang, et al.
Veröffentlicht: (2024)
Learning Video Temporal Dynamics with Cross-Modal Attention for Robust Audio-Visual Speech Recognition
von: Kim, Sungnyun, et al.
Veröffentlicht: (2024)
von: Kim, Sungnyun, et al.
Veröffentlicht: (2024)
GOVERN: Gradient Orientation Vote Ensemble for Multi-Teacher Reinforced Distillation
von: Zhou, Wenjie, et al.
Veröffentlicht: (2024)
von: Zhou, Wenjie, et al.
Veröffentlicht: (2024)
Reinforcement World Model Learning for LLM-based Agents
von: Yu, Xiao, et al.
Veröffentlicht: (2026)
von: Yu, Xiao, et al.
Veröffentlicht: (2026)
Distillation versus Contrastive Learning: How to Train Your Rerankers
von: Xu, Zhichao, et al.
Veröffentlicht: (2025)
von: Xu, Zhichao, et al.
Veröffentlicht: (2025)
MMedAgent: Learning to Use Medical Tools with Multi-modal Agent
von: Li, Binxu, et al.
Veröffentlicht: (2024)
von: Li, Binxu, et al.
Veröffentlicht: (2024)
Learning to Retrieve from Agent Trajectories
von: Zhou, Yuqi, et al.
Veröffentlicht: (2026)
von: Zhou, Yuqi, et al.
Veröffentlicht: (2026)
MemReranker: Reasoning-Aware Reranking for Agent Memory Retrieval
von: Li, Chunyu, et al.
Veröffentlicht: (2026)
von: Li, Chunyu, et al.
Veröffentlicht: (2026)
Multi-Task Learning for Front-End Text Processing in TTS
von: Kang, Wonjune, et al.
Veröffentlicht: (2024)
von: Kang, Wonjune, et al.
Veröffentlicht: (2024)
Define-ML: An Approach to Ideate Machine Learning-Enabled Systems
von: Alonso, Silvio
Veröffentlicht: (2025)
von: Alonso, Silvio
Veröffentlicht: (2025)
Define-ML: An Approach to Ideate Machine Learning-Enabled Systems
von: Alonso, Silvio, et al.
Veröffentlicht: (2025)
von: Alonso, Silvio, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Beyond Correctness: Rewarding Faithful Reasoning in Retrieval-Augmented Generation
von: Xu, Zhichao, et al.
Veröffentlicht: (2025) -
Diffusion Language Model Inference with Monte Carlo Tree Search
von: Huang, Zheng, et al.
Veröffentlicht: (2025) -
Black-Box Visual Prompt Engineering for Mitigating Object Hallucination in Large Vision Language Models
von: Woo, Sangmin, et al.
Veröffentlicht: (2025) -
An Empirical Study of Automating Agent Evaluation
von: Zhou, Kang, et al.
Veröffentlicht: (2026) -
CSPLADE: Learned Sparse Retrieval with Causal Language Models
von: Xu, Zhichao, et al.
Veröffentlicht: (2025)