:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Cao, Yixin, Hong, Shibo, Li, Xinze, Ying, Jiahao, Ma, Yubo, Liang, Haiyuan, Liu, Yantao, Yao, Zijun, Wang, Xiaozhi, Huang, Dan, Zhang, Wenxuan, Huang, Lifu, Chen, Muhao, Hou, Lei, Sun, Qianru, Ma, Xingjun, Wu, Zuxuan, Kan, Min-Yen, Lo, David, Zhang, Qi, Ji, Heng, Jiang, Jing, Li, Juanzi, Sun, Aixin, Huang, Xuanjing, Chua, Tat-Seng, Jiang, Yu-Gang
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Computation and Language
Online-Zugang:	https://arxiv.org/abs/2504.18838
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Long Context vs. RAG for LLMs: An Evaluation and Revisits
von: Li, Xinze, et al.
Veröffentlicht: (2024)

Towards Verifiable Generation: A Benchmark for Knowledge-aware Language Model Attribution
von: Li, Xinze, et al.
Veröffentlicht: (2023)

Are Reasoning Models More Prone to Hallucination?
von: Yao, Zijun, et al.
Veröffentlicht: (2025)

EMemBench: Interactive Benchmarking of Episodic Memory for VLM Agents
von: Li, Xinze, et al.
Veröffentlicht: (2026)

Steering the Verifiability of Multimodal AI Hallucinations
von: Pang, Jianhong, et al.
Veröffentlicht: (2026)

Large Language Model Is Not a Good Few-shot Information Extractor, but a Good Reranker for Hard Samples!
von: Ma, Yubo, et al.
Veröffentlicht: (2023)

Skill-as-Pseudocode: Refactoring Skill Libraries to Pseudocode for LLM Agents
von: Li, Xinze, et al.
Veröffentlicht: (2026)

Downstream Transfer Attack: Adversarial Attacks on Downstream Models with Pre-trained Vision Transformers
von: Zheng, Weijie, et al.
Veröffentlicht: (2024)

ModelLock: Locking Your Model With a Spell
von: Gao, Yifeng, et al.
Veröffentlicht: (2024)

PairJudge RM: Perform Best-of-N Sampling with Knockout Tournament
von: Liu, Yantao, et al.
Veröffentlicht: (2025)

RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style
von: Liu, Yantao, et al.
Veröffentlicht: (2024)

Thinking with Blueprints: Assisting Vision-Language Models in Spatial Reasoning via Structured Object Representation
von: Ma, Weijian, et al.
Veröffentlicht: (2026)

EffiEval: Efficient and Generalizable Model Evaluation via Capability Coverage Maximization
von: Wang, Yaoning, et al.
Veröffentlicht: (2025)

We Should Identify and Mitigate Third-Party Safety Risks in MCP-Powered Agent Systems
von: Fang, Junfeng, et al.
Veröffentlicht: (2025)

GIFT: Games as Informal Training for Generalizable LLMs
von: Lyu, Nuoyan, et al.
Veröffentlicht: (2026)

Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding
von: Zhang, Zhihan, et al.
Veröffentlicht: (2024)

Enhancing Spectral Graph Neural Networks with LLM-Predicted Homophily
von: Lu, Kangkang, et al.
Veröffentlicht: (2025)

Integrate Temporal Graph Learning into LLM-based Temporal Knowledge Graph Model
von: Chang, He, et al.
Veröffentlicht: (2025)

LLMs-as-Instructors: Learning from Errors Toward Automating Model Improvement
von: Ying, Jiahao, et al.
Veröffentlicht: (2024)

Auxiliary Metrics Help Decoding Skill Neurons in the Wild
von: Zhao, Yixiu, et al.
Veröffentlicht: (2025)

Compose Your Aesthetics: Empowering Text-to-Image Models with the Principles of Art
von: Jin, Zhe, et al.
Veröffentlicht: (2025)

Contrastive Pre-training for Deep Session Data Understanding
von: Li, Zixuan, et al.
Veröffentlicht: (2024)

Extending Visual Dynamics for Video-to-Music Generation
von: Liu, Xiaohao, et al.
Veröffentlicht: (2025)

Zero-1-to-A: Zero-Shot One Image to Animatable Head Avatars Using Video Diffusion
von: Zhou, Zhenglin, et al.
Veröffentlicht: (2025)

Suppressing Forgery-Specific Shortcuts for Generalizable Deepfake Detection
von: Wang, Yihui, et al.
Veröffentlicht: (2026)

Dynamic and Generalizable Process Reward Modeling
von: Yin, Zhangyue, et al.
Veröffentlicht: (2025)

SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting
von: Ma, Yunshan, et al.
Veröffentlicht: (2023)

X-Shot: A Unified System to Handle Frequent, Few-shot and Zero-shot Learning Simultaneously in Classification
von: Xu, Hanzi, et al.
Veröffentlicht: (2024)

LLM2Rec: Large Language Models Are Powerful Embedding Models for Sequential Recommendation
von: He, Yingzhi, et al.
Veröffentlicht: (2025)

An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes
von: Qi, Ji, et al.
Veröffentlicht: (2025)

Beyond Persuasion: Towards Conversational Recommender System with Credible Explanations
von: Qin, Peixin, et al.
Veröffentlicht: (2024)

Shortcuts Everywhere and Nowhere: Exploring Multi-Trigger Backdoor Attacks
von: Li, Yige, et al.
Veröffentlicht: (2024)

T2UE: Generating Unlearnable Examples from Text Descriptions
von: Ma, Xingjun, et al.
Veröffentlicht: (2025)

FACT-AUDIT: An Adaptive Multi-Agent Framework for Dynamic Fact-Checking Evaluation of Large Language Models
von: Lin, Hongzhan, et al.
Veröffentlicht: (2025)

Plug-and-Play Policy Planner for Large Language Model Powered Dialogue Agents
von: Deng, Yang, et al.
Veröffentlicht: (2023)

WildReward: Learning Reward Models from In-the-Wild Human Interactions
von: Peng, Hao, et al.
Veröffentlicht: (2026)

Towards Understanding Safety Alignment: A Mechanistic Perspective from Safety Neurons
von: Chen, Jianhui, et al.
Veröffentlicht: (2024)

How to Enable Effective Cooperation Between Humans and NLP Models: A Survey of Principles, Formalizations, and Beyond
von: Huang, Chen, et al.
Veröffentlicht: (2025)

Aligning Teacher with Student Preferences for Tailored Training Data Generation
von: Liu, Yantao, et al.
Veröffentlicht: (2024)

Evaluating Generative Language Models in Information Extraction as Subjective Question Correction
von: Fan, Yuchen, et al.
Veröffentlicht: (2024)