Enregistré dans:
| Auteurs principaux: | Wang, Shuai, Ding, Liang, Shen, Li, Luo, Yong, Du, Bo, Tao, Dacheng |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2401.06628 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Revisiting Knowledge Distillation for Autoregressive Language Models
par: Zhong, Qihuang, et autres
Publié: (2024)
par: Zhong, Qihuang, et autres
Publié: (2024)
ROSE Doesn't Do That: Boosting the Safety of Instruction-Tuned Large Language Models with Reverse Prompt Contrastive Decoding
par: Zhong, Qihuang, et autres
Publié: (2024)
par: Zhong, Qihuang, et autres
Publié: (2024)
A Multi-Language Object-Oriented Programming Benchmark for Large Language Models
par: Wang, Shuai, et autres
Publié: (2025)
par: Wang, Shuai, et autres
Publié: (2025)
Retrieval-Augmented Perception: High-Resolution Image Perception Meets Visual RAG
par: Wang, Wenbin, et autres
Publié: (2025)
par: Wang, Wenbin, et autres
Publié: (2025)
Revisiting Catastrophic Forgetting in Large Language Model Tuning
par: Li, Hongyu, et autres
Publié: (2024)
par: Li, Hongyu, et autres
Publié: (2024)
Better, Faster: Harnessing Self-Improvement in Large Reasoning Models
par: Zhong, Qihuang, et autres
Publié: (2026)
par: Zhong, Qihuang, et autres
Publié: (2026)
E2S2: Encoding-Enhanced Sequence-to-Sequence Pretraining for Language Understanding and Generation
par: Zhong, Qihuang, et autres
Publié: (2022)
par: Zhong, Qihuang, et autres
Publié: (2022)
WisdoM: Improving Multimodal Sentiment Analysis by Fusing Contextual World Knowledge
par: Wang, Wenbin, et autres
Publié: (2024)
par: Wang, Wenbin, et autres
Publié: (2024)
FusionBench: A Unified Library and Comprehensive Benchmark for Deep Model Fusion
par: Tang, Anke, et autres
Publié: (2024)
par: Tang, Anke, et autres
Publié: (2024)
PANDA: Prompt Transfer Meets Knowledge Distillation for Efficient Model Adaptation
par: Zhong, Qihuang, et autres
Publié: (2022)
par: Zhong, Qihuang, et autres
Publié: (2022)
Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language Models
par: Lu, Qingyu, et autres
Publié: (2023)
par: Lu, Qingyu, et autres
Publié: (2023)
Learning from Imperfect Data: Towards Efficient Knowledge Distillation of Autoregressive Language Models for Text-to-SQL
par: Zhong, Qihuang, et autres
Publié: (2024)
par: Zhong, Qihuang, et autres
Publié: (2024)
JustLogic: A Comprehensive Benchmark for Evaluating Deductive Reasoning in Large Language Models
par: Chen, Michael K., et autres
Publié: (2025)
par: Chen, Michael K., et autres
Publié: (2025)
Reason-KE++: Aligning the Process, Not Just the Outcome, for Faithful LLM Knowledge Editing
par: Wu, Yuchen, et autres
Publié: (2025)
par: Wu, Yuchen, et autres
Publié: (2025)
Robust Knowledge Editing via Explicit Reasoning Chains for Distractor-Resilient Multi-Hop QA
par: Wu, Yuchen, et autres
Publié: (2025)
par: Wu, Yuchen, et autres
Publié: (2025)
Model Hemorrhage and the Robustness Limits of Large Language Models
par: Ma, Ziyang, et autres
Publié: (2025)
par: Ma, Ziyang, et autres
Publié: (2025)
Towards Reliable Medical LLMs: Benchmarking and Enhancing Confidence Estimation of Large Language Models in Medical Consultation
par: Ren, Zhiyao, et autres
Publié: (2026)
par: Ren, Zhiyao, et autres
Publié: (2026)
CodeApex: A Bilingual Programming Evaluation Benchmark for Large Language Models
par: Fu, Lingyue, et autres
Publié: (2023)
par: Fu, Lingyue, et autres
Publié: (2023)
Edit Once, Update Everywhere: A Simple Framework for Cross-Lingual Knowledge Synchronization in LLMs
par: Wu, Yuchen, et autres
Publié: (2025)
par: Wu, Yuchen, et autres
Publié: (2025)
Learn from Downstream and Be Yourself in Multimodal Large Language Model Fine-Tuning
par: Huang, Wenke, et autres
Publié: (2024)
par: Huang, Wenke, et autres
Publié: (2024)
Aligning Large Language Models from Self-Reference AI Feedback with one General Principle
par: Bao, Rong, et autres
Publié: (2024)
par: Bao, Rong, et autres
Publié: (2024)
Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning
par: Xia, Tianle, et autres
Publié: (2024)
par: Xia, Tianle, et autres
Publié: (2024)
Uncertainty Aware Learning for Language Model Alignment
par: Wang, Yikun, et autres
Publié: (2024)
par: Wang, Yikun, et autres
Publié: (2024)
Resolving Knowledge Conflicts in Domain-specific Data Selection: A Case Study on Medical Instruction-tuning
par: Zhong, Qihuang, et autres
Publié: (2025)
par: Zhong, Qihuang, et autres
Publié: (2025)
KaFT: Knowledge-aware Fine-tuning for Boosting LLMs' Domain-specific Question-Answering Performance
par: Zhong, Qihuang, et autres
Publié: (2025)
par: Zhong, Qihuang, et autres
Publié: (2025)
A Survey on Knowledge Distillation of Large Language Models
par: Xu, Xiaohan, et autres
Publié: (2024)
par: Xu, Xiaohan, et autres
Publié: (2024)
Diversifying the Mixture-of-Experts Representation for Language Models with Orthogonal Optimizer
par: Liu, Boan, et autres
Publié: (2023)
par: Liu, Boan, et autres
Publié: (2023)
Building Accurate Translation-Tailored LLMs with Language Aware Instruction Tuning
par: Zan, Changtong, et autres
Publié: (2024)
par: Zan, Changtong, et autres
Publié: (2024)
The Bitter Lesson of Diffusion Language Models for Agentic Workflows: A Comprehensive Reality Check
par: Lu, Qingyu, et autres
Publié: (2026)
par: Lu, Qingyu, et autres
Publié: (2026)
Leveraging Large Language Models for NLG Evaluation: Advances and Challenges
par: Li, Zhen, et autres
Publié: (2024)
par: Li, Zhen, et autres
Publié: (2024)
Entropy-Guided Watermarking for LLMs: A Test-Time Framework for Robust and Traceable Text Generation
par: Cai, Shizhan, et autres
Publié: (2025)
par: Cai, Shizhan, et autres
Publié: (2025)
LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit
par: Gong, Ruihao, et autres
Publié: (2024)
par: Gong, Ruihao, et autres
Publié: (2024)
CFinBench: A Comprehensive Chinese Financial Benchmark for Large Language Models
par: Nie, Ying, et autres
Publié: (2024)
par: Nie, Ying, et autres
Publié: (2024)
Exploring and Enhancing the Transfer of Distribution in Knowledge Distillation for Autoregressive Language Models
par: Rao, Jun, et autres
Publié: (2024)
par: Rao, Jun, et autres
Publié: (2024)
MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models
par: Wei, Zihao, et autres
Publié: (2024)
par: Wei, Zihao, et autres
Publié: (2024)
Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments
par: Lu, Qingyu, et autres
Publié: (2025)
par: Lu, Qingyu, et autres
Publié: (2025)
Detoxifying Large Language Models via Autoregressive Reward Guided Representation Editing
par: Xiao, Yisong, et autres
Publié: (2025)
par: Xiao, Yisong, et autres
Publié: (2025)
Beyond Benchmarking: A New Paradigm for Evaluation and Assessment of Large Language Models
par: Liu, Jin, et autres
Publié: (2024)
par: Liu, Jin, et autres
Publié: (2024)
MQM-APE: Toward High-Quality Error Annotation Predictors with Automatic Post-Editing in LLM Translation Evaluators
par: Lu, Qingyu, et autres
Publié: (2024)
par: Lu, Qingyu, et autres
Publié: (2024)
Panacea: Mitigating Harmful Fine-tuning for Large Language Models via Post-fine-tuning Perturbation
par: Wang, Yibo, et autres
Publié: (2025)
par: Wang, Yibo, et autres
Publié: (2025)
Documents similaires
-
Revisiting Knowledge Distillation for Autoregressive Language Models
par: Zhong, Qihuang, et autres
Publié: (2024) -
ROSE Doesn't Do That: Boosting the Safety of Instruction-Tuned Large Language Models with Reverse Prompt Contrastive Decoding
par: Zhong, Qihuang, et autres
Publié: (2024) -
A Multi-Language Object-Oriented Programming Benchmark for Large Language Models
par: Wang, Shuai, et autres
Publié: (2025) -
Retrieval-Augmented Perception: High-Resolution Image Perception Meets Visual RAG
par: Wang, Wenbin, et autres
Publié: (2025) -
Revisiting Catastrophic Forgetting in Large Language Model Tuning
par: Li, Hongyu, et autres
Publié: (2024)