:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Yuan, Chenhan, Huang, Fei, Peng, Ru, Lu, Keming, Yu, Bowen, Zhou, Chang, Zhou, Jingren
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Computation and Language
Online-Zugang:	https://arxiv.org/abs/2408.10764
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Large Language Models are Superpositions of All Characters: Attaining Arbitrary Role-play via Self-Alignment
von: Lu, Keming, et al.
Veröffentlicht: (2024)

Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models
von: Dong, Guanting, et al.
Veröffentlicht: (2024)

Online Merging Optimizers for Boosting Rewards and Mitigating Tax in Alignment
von: Lu, Keming, et al.
Veröffentlicht: (2024)

How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition
von: Dong, Guanting, et al.
Veröffentlicht: (2023)

Speculative Contrastive Decoding
von: Yuan, Hongyi, et al.
Veröffentlicht: (2023)

Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models
von: Xiang, Hao, et al.
Veröffentlicht: (2024)

Language Confusion Gate: Language-Aware Decoding Through Model Self-Distillation
von: Zhang, Collin, et al.
Veröffentlicht: (2025)

AutoLogi: Automated Generation of Logic Puzzles for Evaluating Reasoning Abilities of Large Language Models
von: Zhu, Qin, et al.
Veröffentlicht: (2025)

CARE: Decoding Time Safety Alignment via Rollback and Introspection Intervention
von: Hu, Xiaomeng, et al.
Veröffentlicht: (2025)

EE-LLM: Large-Scale Training and Inference of Early-Exit Large Language Models with 3D Parallelism
von: Chen, Yanxi, et al.
Veröffentlicht: (2023)

ProcessBench: Identifying Process Errors in Mathematical Reasoning
von: Zheng, Chujie, et al.
Veröffentlicht: (2024)

A Unified View of Delta Parameter Editing in Post-Trained Large-Scale Models
von: Tang, Qiaoyu, et al.
Veröffentlicht: (2024)

Inspo: Writing with Crowds Alongside AI
von: Huang, Chieh-Yang, et al.
Veröffentlicht: (2023)

SPP: Sparsity-Preserved Parameter-Efficient Fine-Tuning for Large Language Models
von: Lu, Xudong, et al.
Veröffentlicht: (2024)

PruneVid: Visual Token Pruning for Efficient Video Large Language Models
von: Huang, Xiaohu, et al.
Veröffentlicht: (2024)

Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free
von: Qiu, Zihan, et al.
Veröffentlicht: (2025)

The Lessons of Developing Process Reward Models in Mathematical Reasoning
von: Zhang, Zhenru, et al.
Veröffentlicht: (2025)

Evidence-Augmented Policy Optimization with Reward Co-Evolution for Long-Context Reasoning
von: Guan, Xin, et al.
Veröffentlicht: (2026)

Efficient Pre-Training with Token Superposition
von: Peng, Bowen, et al.
Veröffentlicht: (2026)

AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator
von: Fan, Zhihao, et al.
Veröffentlicht: (2024)

Spatio-Temporal Token Pruning for Efficient High-Resolution GUI Agents
von: Xu, Zhou, et al.
Veröffentlicht: (2026)

Automated Profile Inference with Language Model Agents
von: Du, Yuntao, et al.
Veröffentlicht: (2025)

An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models
von: Chen, Liang, et al.
Veröffentlicht: (2024)

Provably Efficient Online RLHF with One-Pass Reward Modeling
von: Li, Long-Fei, et al.
Veröffentlicht: (2025)

Are Large Language Models True Healthcare Jacks-of-All-Trades? Benchmarking Across Health Professions Beyond Physician Exams
von: Luo, Zheheng, et al.
Veröffentlicht: (2024)

ReaLM: Reliable and Efficient Large Language Model Inference with Statistical Algorithm-Based Fault Tolerance
von: Xie, Tong, et al.
Veröffentlicht: (2025)

Theosis Within, Alongside, and Outside the Bible
von: John W. Martens
Veröffentlicht: (2026)

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective
von: Mao, Liyuan, et al.
Veröffentlicht: (2026)

AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension
von: Yang, Qian, et al.
Veröffentlicht: (2024)

RED: Unleashing Token-Level Rewards from Holistic Feedback via Reward Redistribution
von: Li, Jiahui, et al.
Veröffentlicht: (2024)

Provable Scaling Laws for the Test-Time Compute of Large Language Models
von: Chen, Yanxi, et al.
Veröffentlicht: (2024)

Beyond Next Token Prediction: Patch-Level Training for Large Language Models
von: Shao, Chenze, et al.
Veröffentlicht: (2024)

BridgeScope: A Universal Toolkit for Bridging Large Language Models and Databases
von: Weng, Lianggui, et al.
Veröffentlicht: (2025)

P-MMEval: A Parallel Multilingual Multitask Benchmark for Consistent Evaluation of LLMs
von: Zhang, Yidan, et al.
Veröffentlicht: (2024)

No Language is an Island: Unifying Chinese and English in Financial Large Language Models, Instruction Data, and Benchmarks
von: Hu, Gang, et al.
Veröffentlicht: (2024)

BadToken: Token-level Backdoor Attacks to Multi-modal Large Language Models
von: Yuan, Zenghui, et al.
Veröffentlicht: (2025)

Multi-Token Residual Prediction
von: Xu, Yufeng, et al.
Veröffentlicht: (2026)

A Survey on Self-Evolution of Large Language Models
von: Tao, Zhengwei, et al.
Veröffentlicht: (2024)

Inference-Time Decontamination: Reusing Leaked Benchmarks for Large Language Model Evaluation
von: Zhu, Qin, et al.
Veröffentlicht: (2024)

Language Models can Evaluate Themselves via Probability Discrepancy
von: Xia, Tingyu, et al.
Veröffentlicht: (2024)