Gespeichert in:
| Hauptverfasser: | Yuan, Chenhan, Huang, Fei, Peng, Ru, Lu, Keming, Yu, Bowen, Zhou, Chang, Zhou, Jingren |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2408.10764 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Large Language Models are Superpositions of All Characters: Attaining Arbitrary Role-play via Self-Alignment
von: Lu, Keming, et al.
Veröffentlicht: (2024)
von: Lu, Keming, et al.
Veröffentlicht: (2024)
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models
von: Dong, Guanting, et al.
Veröffentlicht: (2024)
von: Dong, Guanting, et al.
Veröffentlicht: (2024)
Online Merging Optimizers for Boosting Rewards and Mitigating Tax in Alignment
von: Lu, Keming, et al.
Veröffentlicht: (2024)
von: Lu, Keming, et al.
Veröffentlicht: (2024)
How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition
von: Dong, Guanting, et al.
Veröffentlicht: (2023)
von: Dong, Guanting, et al.
Veröffentlicht: (2023)
Speculative Contrastive Decoding
von: Yuan, Hongyi, et al.
Veröffentlicht: (2023)
von: Yuan, Hongyi, et al.
Veröffentlicht: (2023)
Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models
von: Xiang, Hao, et al.
Veröffentlicht: (2024)
von: Xiang, Hao, et al.
Veröffentlicht: (2024)
Language Confusion Gate: Language-Aware Decoding Through Model Self-Distillation
von: Zhang, Collin, et al.
Veröffentlicht: (2025)
von: Zhang, Collin, et al.
Veröffentlicht: (2025)
AutoLogi: Automated Generation of Logic Puzzles for Evaluating Reasoning Abilities of Large Language Models
von: Zhu, Qin, et al.
Veröffentlicht: (2025)
von: Zhu, Qin, et al.
Veröffentlicht: (2025)
CARE: Decoding Time Safety Alignment via Rollback and Introspection Intervention
von: Hu, Xiaomeng, et al.
Veröffentlicht: (2025)
von: Hu, Xiaomeng, et al.
Veröffentlicht: (2025)
EE-LLM: Large-Scale Training and Inference of Early-Exit Large Language Models with 3D Parallelism
von: Chen, Yanxi, et al.
Veröffentlicht: (2023)
von: Chen, Yanxi, et al.
Veröffentlicht: (2023)
ProcessBench: Identifying Process Errors in Mathematical Reasoning
von: Zheng, Chujie, et al.
Veröffentlicht: (2024)
von: Zheng, Chujie, et al.
Veröffentlicht: (2024)
A Unified View of Delta Parameter Editing in Post-Trained Large-Scale Models
von: Tang, Qiaoyu, et al.
Veröffentlicht: (2024)
von: Tang, Qiaoyu, et al.
Veröffentlicht: (2024)
Inspo: Writing with Crowds Alongside AI
von: Huang, Chieh-Yang, et al.
Veröffentlicht: (2023)
von: Huang, Chieh-Yang, et al.
Veröffentlicht: (2023)
SPP: Sparsity-Preserved Parameter-Efficient Fine-Tuning for Large Language Models
von: Lu, Xudong, et al.
Veröffentlicht: (2024)
von: Lu, Xudong, et al.
Veröffentlicht: (2024)
PruneVid: Visual Token Pruning for Efficient Video Large Language Models
von: Huang, Xiaohu, et al.
Veröffentlicht: (2024)
von: Huang, Xiaohu, et al.
Veröffentlicht: (2024)
Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free
von: Qiu, Zihan, et al.
Veröffentlicht: (2025)
von: Qiu, Zihan, et al.
Veröffentlicht: (2025)
The Lessons of Developing Process Reward Models in Mathematical Reasoning
von: Zhang, Zhenru, et al.
Veröffentlicht: (2025)
von: Zhang, Zhenru, et al.
Veröffentlicht: (2025)
Evidence-Augmented Policy Optimization with Reward Co-Evolution for Long-Context Reasoning
von: Guan, Xin, et al.
Veröffentlicht: (2026)
von: Guan, Xin, et al.
Veröffentlicht: (2026)
Efficient Pre-Training with Token Superposition
von: Peng, Bowen, et al.
Veröffentlicht: (2026)
von: Peng, Bowen, et al.
Veröffentlicht: (2026)
AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator
von: Fan, Zhihao, et al.
Veröffentlicht: (2024)
von: Fan, Zhihao, et al.
Veröffentlicht: (2024)
Spatio-Temporal Token Pruning for Efficient High-Resolution GUI Agents
von: Xu, Zhou, et al.
Veröffentlicht: (2026)
von: Xu, Zhou, et al.
Veröffentlicht: (2026)
Automated Profile Inference with Language Model Agents
von: Du, Yuntao, et al.
Veröffentlicht: (2025)
von: Du, Yuntao, et al.
Veröffentlicht: (2025)
An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models
von: Chen, Liang, et al.
Veröffentlicht: (2024)
von: Chen, Liang, et al.
Veröffentlicht: (2024)
Provably Efficient Online RLHF with One-Pass Reward Modeling
von: Li, Long-Fei, et al.
Veröffentlicht: (2025)
von: Li, Long-Fei, et al.
Veröffentlicht: (2025)
Are Large Language Models True Healthcare Jacks-of-All-Trades? Benchmarking Across Health Professions Beyond Physician Exams
von: Luo, Zheheng, et al.
Veröffentlicht: (2024)
von: Luo, Zheheng, et al.
Veröffentlicht: (2024)
ReaLM: Reliable and Efficient Large Language Model Inference with Statistical Algorithm-Based Fault Tolerance
von: Xie, Tong, et al.
Veröffentlicht: (2025)
von: Xie, Tong, et al.
Veröffentlicht: (2025)
Theosis Within, Alongside, and Outside the Bible
von: John W. Martens
Veröffentlicht: (2026)
von: John W. Martens
Veröffentlicht: (2026)
Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective
von: Mao, Liyuan, et al.
Veröffentlicht: (2026)
von: Mao, Liyuan, et al.
Veröffentlicht: (2026)
AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension
von: Yang, Qian, et al.
Veröffentlicht: (2024)
von: Yang, Qian, et al.
Veröffentlicht: (2024)
RED: Unleashing Token-Level Rewards from Holistic Feedback via Reward Redistribution
von: Li, Jiahui, et al.
Veröffentlicht: (2024)
von: Li, Jiahui, et al.
Veröffentlicht: (2024)
Provable Scaling Laws for the Test-Time Compute of Large Language Models
von: Chen, Yanxi, et al.
Veröffentlicht: (2024)
von: Chen, Yanxi, et al.
Veröffentlicht: (2024)
Beyond Next Token Prediction: Patch-Level Training for Large Language Models
von: Shao, Chenze, et al.
Veröffentlicht: (2024)
von: Shao, Chenze, et al.
Veröffentlicht: (2024)
BridgeScope: A Universal Toolkit for Bridging Large Language Models and Databases
von: Weng, Lianggui, et al.
Veröffentlicht: (2025)
von: Weng, Lianggui, et al.
Veröffentlicht: (2025)
P-MMEval: A Parallel Multilingual Multitask Benchmark for Consistent Evaluation of LLMs
von: Zhang, Yidan, et al.
Veröffentlicht: (2024)
von: Zhang, Yidan, et al.
Veröffentlicht: (2024)
No Language is an Island: Unifying Chinese and English in Financial Large Language Models, Instruction Data, and Benchmarks
von: Hu, Gang, et al.
Veröffentlicht: (2024)
von: Hu, Gang, et al.
Veröffentlicht: (2024)
BadToken: Token-level Backdoor Attacks to Multi-modal Large Language Models
von: Yuan, Zenghui, et al.
Veröffentlicht: (2025)
von: Yuan, Zenghui, et al.
Veröffentlicht: (2025)
Multi-Token Residual Prediction
von: Xu, Yufeng, et al.
Veröffentlicht: (2026)
von: Xu, Yufeng, et al.
Veröffentlicht: (2026)
A Survey on Self-Evolution of Large Language Models
von: Tao, Zhengwei, et al.
Veröffentlicht: (2024)
von: Tao, Zhengwei, et al.
Veröffentlicht: (2024)
Inference-Time Decontamination: Reusing Leaked Benchmarks for Large Language Model Evaluation
von: Zhu, Qin, et al.
Veröffentlicht: (2024)
von: Zhu, Qin, et al.
Veröffentlicht: (2024)
Language Models can Evaluate Themselves via Probability Discrepancy
von: Xia, Tingyu, et al.
Veröffentlicht: (2024)
von: Xia, Tingyu, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Large Language Models are Superpositions of All Characters: Attaining Arbitrary Role-play via Self-Alignment
von: Lu, Keming, et al.
Veröffentlicht: (2024) -
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models
von: Dong, Guanting, et al.
Veröffentlicht: (2024) -
Online Merging Optimizers for Boosting Rewards and Mitigating Tax in Alignment
von: Lu, Keming, et al.
Veröffentlicht: (2024) -
How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition
von: Dong, Guanting, et al.
Veröffentlicht: (2023) -
Speculative Contrastive Decoding
von: Yuan, Hongyi, et al.
Veröffentlicht: (2023)