Gespeichert in:
| Hauptverfasser: | Cao, Yixin, Hong, Shibo, Li, Xinze, Ying, Jiahao, Ma, Yubo, Liang, Haiyuan, Liu, Yantao, Yao, Zijun, Wang, Xiaozhi, Huang, Dan, Zhang, Wenxuan, Huang, Lifu, Chen, Muhao, Hou, Lei, Sun, Qianru, Ma, Xingjun, Wu, Zuxuan, Kan, Min-Yen, Lo, David, Zhang, Qi, Ji, Heng, Jiang, Jing, Li, Juanzi, Sun, Aixin, Huang, Xuanjing, Chua, Tat-Seng, Jiang, Yu-Gang |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2504.18838 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Long Context vs. RAG for LLMs: An Evaluation and Revisits
von: Li, Xinze, et al.
Veröffentlicht: (2024)
von: Li, Xinze, et al.
Veröffentlicht: (2024)
Towards Verifiable Generation: A Benchmark for Knowledge-aware Language Model Attribution
von: Li, Xinze, et al.
Veröffentlicht: (2023)
von: Li, Xinze, et al.
Veröffentlicht: (2023)
Are Reasoning Models More Prone to Hallucination?
von: Yao, Zijun, et al.
Veröffentlicht: (2025)
von: Yao, Zijun, et al.
Veröffentlicht: (2025)
EMemBench: Interactive Benchmarking of Episodic Memory for VLM Agents
von: Li, Xinze, et al.
Veröffentlicht: (2026)
von: Li, Xinze, et al.
Veröffentlicht: (2026)
Steering the Verifiability of Multimodal AI Hallucinations
von: Pang, Jianhong, et al.
Veröffentlicht: (2026)
von: Pang, Jianhong, et al.
Veröffentlicht: (2026)
Large Language Model Is Not a Good Few-shot Information Extractor, but a Good Reranker for Hard Samples!
von: Ma, Yubo, et al.
Veröffentlicht: (2023)
von: Ma, Yubo, et al.
Veröffentlicht: (2023)
Skill-as-Pseudocode: Refactoring Skill Libraries to Pseudocode for LLM Agents
von: Li, Xinze, et al.
Veröffentlicht: (2026)
von: Li, Xinze, et al.
Veröffentlicht: (2026)
Downstream Transfer Attack: Adversarial Attacks on Downstream Models with Pre-trained Vision Transformers
von: Zheng, Weijie, et al.
Veröffentlicht: (2024)
von: Zheng, Weijie, et al.
Veröffentlicht: (2024)
ModelLock: Locking Your Model With a Spell
von: Gao, Yifeng, et al.
Veröffentlicht: (2024)
von: Gao, Yifeng, et al.
Veröffentlicht: (2024)
PairJudge RM: Perform Best-of-N Sampling with Knockout Tournament
von: Liu, Yantao, et al.
Veröffentlicht: (2025)
von: Liu, Yantao, et al.
Veröffentlicht: (2025)
RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style
von: Liu, Yantao, et al.
Veröffentlicht: (2024)
von: Liu, Yantao, et al.
Veröffentlicht: (2024)
Thinking with Blueprints: Assisting Vision-Language Models in Spatial Reasoning via Structured Object Representation
von: Ma, Weijian, et al.
Veröffentlicht: (2026)
von: Ma, Weijian, et al.
Veröffentlicht: (2026)
EffiEval: Efficient and Generalizable Model Evaluation via Capability Coverage Maximization
von: Wang, Yaoning, et al.
Veröffentlicht: (2025)
von: Wang, Yaoning, et al.
Veröffentlicht: (2025)
We Should Identify and Mitigate Third-Party Safety Risks in MCP-Powered Agent Systems
von: Fang, Junfeng, et al.
Veröffentlicht: (2025)
von: Fang, Junfeng, et al.
Veröffentlicht: (2025)
GIFT: Games as Informal Training for Generalizable LLMs
von: Lyu, Nuoyan, et al.
Veröffentlicht: (2026)
von: Lyu, Nuoyan, et al.
Veröffentlicht: (2026)
Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding
von: Zhang, Zhihan, et al.
Veröffentlicht: (2024)
von: Zhang, Zhihan, et al.
Veröffentlicht: (2024)
Enhancing Spectral Graph Neural Networks with LLM-Predicted Homophily
von: Lu, Kangkang, et al.
Veröffentlicht: (2025)
von: Lu, Kangkang, et al.
Veröffentlicht: (2025)
Integrate Temporal Graph Learning into LLM-based Temporal Knowledge Graph Model
von: Chang, He, et al.
Veröffentlicht: (2025)
von: Chang, He, et al.
Veröffentlicht: (2025)
LLMs-as-Instructors: Learning from Errors Toward Automating Model Improvement
von: Ying, Jiahao, et al.
Veröffentlicht: (2024)
von: Ying, Jiahao, et al.
Veröffentlicht: (2024)
Auxiliary Metrics Help Decoding Skill Neurons in the Wild
von: Zhao, Yixiu, et al.
Veröffentlicht: (2025)
von: Zhao, Yixiu, et al.
Veröffentlicht: (2025)
Compose Your Aesthetics: Empowering Text-to-Image Models with the Principles of Art
von: Jin, Zhe, et al.
Veröffentlicht: (2025)
von: Jin, Zhe, et al.
Veröffentlicht: (2025)
Contrastive Pre-training for Deep Session Data Understanding
von: Li, Zixuan, et al.
Veröffentlicht: (2024)
von: Li, Zixuan, et al.
Veröffentlicht: (2024)
Extending Visual Dynamics for Video-to-Music Generation
von: Liu, Xiaohao, et al.
Veröffentlicht: (2025)
von: Liu, Xiaohao, et al.
Veröffentlicht: (2025)
Zero-1-to-A: Zero-Shot One Image to Animatable Head Avatars Using Video Diffusion
von: Zhou, Zhenglin, et al.
Veröffentlicht: (2025)
von: Zhou, Zhenglin, et al.
Veröffentlicht: (2025)
Suppressing Forgery-Specific Shortcuts for Generalizable Deepfake Detection
von: Wang, Yihui, et al.
Veröffentlicht: (2026)
von: Wang, Yihui, et al.
Veröffentlicht: (2026)
Dynamic and Generalizable Process Reward Modeling
von: Yin, Zhangyue, et al.
Veröffentlicht: (2025)
von: Yin, Zhangyue, et al.
Veröffentlicht: (2025)
SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting
von: Ma, Yunshan, et al.
Veröffentlicht: (2023)
von: Ma, Yunshan, et al.
Veröffentlicht: (2023)
X-Shot: A Unified System to Handle Frequent, Few-shot and Zero-shot Learning Simultaneously in Classification
von: Xu, Hanzi, et al.
Veröffentlicht: (2024)
von: Xu, Hanzi, et al.
Veröffentlicht: (2024)
LLM2Rec: Large Language Models Are Powerful Embedding Models for Sequential Recommendation
von: He, Yingzhi, et al.
Veröffentlicht: (2025)
von: He, Yingzhi, et al.
Veröffentlicht: (2025)
An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes
von: Qi, Ji, et al.
Veröffentlicht: (2025)
von: Qi, Ji, et al.
Veröffentlicht: (2025)
Beyond Persuasion: Towards Conversational Recommender System with Credible Explanations
von: Qin, Peixin, et al.
Veröffentlicht: (2024)
von: Qin, Peixin, et al.
Veröffentlicht: (2024)
Shortcuts Everywhere and Nowhere: Exploring Multi-Trigger Backdoor Attacks
von: Li, Yige, et al.
Veröffentlicht: (2024)
von: Li, Yige, et al.
Veröffentlicht: (2024)
T2UE: Generating Unlearnable Examples from Text Descriptions
von: Ma, Xingjun, et al.
Veröffentlicht: (2025)
von: Ma, Xingjun, et al.
Veröffentlicht: (2025)
FACT-AUDIT: An Adaptive Multi-Agent Framework for Dynamic Fact-Checking Evaluation of Large Language Models
von: Lin, Hongzhan, et al.
Veröffentlicht: (2025)
von: Lin, Hongzhan, et al.
Veröffentlicht: (2025)
Plug-and-Play Policy Planner for Large Language Model Powered Dialogue Agents
von: Deng, Yang, et al.
Veröffentlicht: (2023)
von: Deng, Yang, et al.
Veröffentlicht: (2023)
WildReward: Learning Reward Models from In-the-Wild Human Interactions
von: Peng, Hao, et al.
Veröffentlicht: (2026)
von: Peng, Hao, et al.
Veröffentlicht: (2026)
Towards Understanding Safety Alignment: A Mechanistic Perspective from Safety Neurons
von: Chen, Jianhui, et al.
Veröffentlicht: (2024)
von: Chen, Jianhui, et al.
Veröffentlicht: (2024)
How to Enable Effective Cooperation Between Humans and NLP Models: A Survey of Principles, Formalizations, and Beyond
von: Huang, Chen, et al.
Veröffentlicht: (2025)
von: Huang, Chen, et al.
Veröffentlicht: (2025)
Aligning Teacher with Student Preferences for Tailored Training Data Generation
von: Liu, Yantao, et al.
Veröffentlicht: (2024)
von: Liu, Yantao, et al.
Veröffentlicht: (2024)
Evaluating Generative Language Models in Information Extraction as Subjective Question Correction
von: Fan, Yuchen, et al.
Veröffentlicht: (2024)
von: Fan, Yuchen, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Long Context vs. RAG for LLMs: An Evaluation and Revisits
von: Li, Xinze, et al.
Veröffentlicht: (2024) -
Towards Verifiable Generation: A Benchmark for Knowledge-aware Language Model Attribution
von: Li, Xinze, et al.
Veröffentlicht: (2023) -
Are Reasoning Models More Prone to Hallucination?
von: Yao, Zijun, et al.
Veröffentlicht: (2025) -
EMemBench: Interactive Benchmarking of Episodic Memory for VLM Agents
von: Li, Xinze, et al.
Veröffentlicht: (2026) -
Steering the Verifiability of Multimodal AI Hallucinations
von: Pang, Jianhong, et al.
Veröffentlicht: (2026)