Salvato in:
| Autore principale: | Shen, Ming |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2402.06094 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning
di: Pang, Jinlong, et al.
Pubblicazione: (2025)
di: Pang, Jinlong, et al.
Pubblicazione: (2025)
SED-SFT: Selectively Encouraging Diversity in Supervised Fine-Tuning
di: Chen, Yijie, et al.
Pubblicazione: (2026)
di: Chen, Yijie, et al.
Pubblicazione: (2026)
Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models
di: Liu, Ziche, et al.
Pubblicazione: (2024)
di: Liu, Ziche, et al.
Pubblicazione: (2024)
From Instance Selection to Fixed-Pool Data Recipe Search for Supervised Fine-Tuning
di: Wu, Haodong, et al.
Pubblicazione: (2026)
di: Wu, Haodong, et al.
Pubblicazione: (2026)
Selective Self-to-Supervised Fine-Tuning for Generalization in Large Language Models
di: Gupta, Sonam, et al.
Pubblicazione: (2025)
di: Gupta, Sonam, et al.
Pubblicazione: (2025)
Rethinking Supervised Fine-Tuning: Emphasizing Key Answer Tokens for Improved LLM Accuracy
di: Shi, Xiaofeng, et al.
Pubblicazione: (2025)
di: Shi, Xiaofeng, et al.
Pubblicazione: (2025)
Data Repetition Beats Data Scaling in Long-CoT Supervised Fine-Tuning
di: Kopiczko, Dawid J., et al.
Pubblicazione: (2026)
di: Kopiczko, Dawid J., et al.
Pubblicazione: (2026)
Anchored Supervised Fine-Tuning
di: Zhu, He, et al.
Pubblicazione: (2025)
di: Zhu, He, et al.
Pubblicazione: (2025)
One-Token Rollout: Guiding Supervised Fine-Tuning of LLMs with Policy Gradient
di: Ming, Rui, et al.
Pubblicazione: (2025)
di: Ming, Rui, et al.
Pubblicazione: (2025)
Proximal Supervised Fine-Tuning
di: Zhu, Wenhong, et al.
Pubblicazione: (2025)
di: Zhu, Wenhong, et al.
Pubblicazione: (2025)
Skill-Aware Data Selection and Fine-Tuning for Data-Efficient Reasoning Distillation
di: Zhang, Lechen, et al.
Pubblicazione: (2026)
di: Zhang, Lechen, et al.
Pubblicazione: (2026)
Supervised In-Context Fine-Tuning for Generative Sequence Labeling
di: Dukić, David, et al.
Pubblicazione: (2025)
di: Dukić, David, et al.
Pubblicazione: (2025)
UFT: Unifying Supervised and Reinforcement Fine-Tuning
di: Liu, Mingyang, et al.
Pubblicazione: (2025)
di: Liu, Mingyang, et al.
Pubblicazione: (2025)
Mind the Gap: Data Rewriting for Stable Off-Policy Supervised Fine-Tuning
di: Zhao, Shiwan, et al.
Pubblicazione: (2025)
di: Zhao, Shiwan, et al.
Pubblicazione: (2025)
On the Role of Reasoning Patterns in the Generalization Discrepancy of Long Chain-of-Thought Supervised Fine-Tuning
di: Li, Zhaoyi, et al.
Pubblicazione: (2026)
di: Li, Zhaoyi, et al.
Pubblicazione: (2026)
Leveraging Web-Crawled Data for High-Quality Fine-Tuning
di: Zhou, Jing, et al.
Pubblicazione: (2024)
di: Zhou, Jing, et al.
Pubblicazione: (2024)
Fine-Tuning LLMs for Report Summarization: Analysis on Supervised and Unsupervised Data
di: Rallapalli, Swati, et al.
Pubblicazione: (2025)
di: Rallapalli, Swati, et al.
Pubblicazione: (2025)
Dynamic Jointly Batch Selection for Data Efficient Machine Translation Fine-Tuning
di: Ghanizadeh, Mohammad Amin, et al.
Pubblicazione: (2025)
di: Ghanizadeh, Mohammad Amin, et al.
Pubblicazione: (2025)
Supervised Fine-Tuning Needs to Unlock the Potential of Token Priority
di: Shen, Zhanming, et al.
Pubblicazione: (2026)
di: Shen, Zhanming, et al.
Pubblicazione: (2026)
Towards Pedagogical LLMs with Supervised Fine Tuning for Computing Education
di: Vassar, Alexandra, et al.
Pubblicazione: (2024)
di: Vassar, Alexandra, et al.
Pubblicazione: (2024)
Semantic Loss Guided Data Efficient Supervised Fine Tuning for Safe Responses in LLMs
di: Lu, Yuxiao, et al.
Pubblicazione: (2024)
di: Lu, Yuxiao, et al.
Pubblicazione: (2024)
Rethinking Weight Decay for Robust Fine-Tuning of Foundation Models
di: Tian, Junjiao, et al.
Pubblicazione: (2024)
di: Tian, Junjiao, et al.
Pubblicazione: (2024)
Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models
di: Ding, Yi, et al.
Pubblicazione: (2025)
di: Ding, Yi, et al.
Pubblicazione: (2025)
Selection of LLM Fine-Tuning Data based on Orthogonal Rules
di: Li, Xiaomin, et al.
Pubblicazione: (2024)
di: Li, Xiaomin, et al.
Pubblicazione: (2024)
Selective Reflection-Tuning: Student-Selected Data Recycling for LLM Instruction-Tuning
di: Li, Ming, et al.
Pubblicazione: (2024)
di: Li, Ming, et al.
Pubblicazione: (2024)
Supervised Fine-Tuning as Inverse Reinforcement Learning
di: Sun, Hao
Pubblicazione: (2024)
di: Sun, Hao
Pubblicazione: (2024)
Rethinking Reinforcement Fine-Tuning in LVLM: Convergence, Reward Decomposition, and Generalization
di: Adams, Carter, et al.
Pubblicazione: (2026)
di: Adams, Carter, et al.
Pubblicazione: (2026)
Supervised Fine-Tuning LLMs to Behave as Pedagogical Agents in Programming Education
di: Ross, Emily, et al.
Pubblicazione: (2025)
di: Ross, Emily, et al.
Pubblicazione: (2025)
Towards Efficient Medical Reasoning with Minimal Fine-Tuning Data
di: Zhuang, Xinlin, et al.
Pubblicazione: (2025)
di: Zhuang, Xinlin, et al.
Pubblicazione: (2025)
TACOS: Open Tagging and Comparative Scoring for Instruction Fine-Tuning Data Selection
di: He, Xixiang, et al.
Pubblicazione: (2025)
di: He, Xixiang, et al.
Pubblicazione: (2025)
FisherSFT: Data-Efficient Supervised Fine-Tuning of Language Models Using Information Gain
di: Deb, Rohan, et al.
Pubblicazione: (2025)
di: Deb, Rohan, et al.
Pubblicazione: (2025)
GraphGen: Enhancing Supervised Fine-Tuning for LLMs with Knowledge-Driven Synthetic Data Generation
di: Chen, Zihong, et al.
Pubblicazione: (2025)
di: Chen, Zihong, et al.
Pubblicazione: (2025)
Improving Translation Quality by Selecting Better Data for LLM Fine-Tuning: A Comparative Analysis
di: de Mello, Felipe Ribeiro Fujita, et al.
Pubblicazione: (2025)
di: de Mello, Felipe Ribeiro Fujita, et al.
Pubblicazione: (2025)
CC-Tuning: A Cross-Lingual Connection Mechanism for Improving Joint Multilingual Supervised Fine-Tuning
di: Ye, Yangfan, et al.
Pubblicazione: (2025)
di: Ye, Yangfan, et al.
Pubblicazione: (2025)
Filter-then-Weight: Online Data Selection and Reweighting for LLM Fine-Tuning
di: Wang, Fangxin, et al.
Pubblicazione: (2026)
di: Wang, Fangxin, et al.
Pubblicazione: (2026)
EVALALIGN: Supervised Fine-Tuning Multimodal LLMs with Human-Aligned Data for Evaluating Text-to-Image Models
di: Tan, Zhiyu, et al.
Pubblicazione: (2024)
di: Tan, Zhiyu, et al.
Pubblicazione: (2024)
Blending Supervised and Reinforcement Fine-Tuning with Prefix Sampling
di: Huang, Zeyu, et al.
Pubblicazione: (2025)
di: Huang, Zeyu, et al.
Pubblicazione: (2025)
Injecting New Knowledge into Large Language Models via Supervised Fine-Tuning
di: Mecklenburg, Nick, et al.
Pubblicazione: (2024)
di: Mecklenburg, Nick, et al.
Pubblicazione: (2024)
Rethinking Parameter Sharing for LLM Fine-Tuning with Multiple LoRAs
di: Ban, Hao, et al.
Pubblicazione: (2025)
di: Ban, Hao, et al.
Pubblicazione: (2025)
Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning
di: Wang, Shaobo, et al.
Pubblicazione: (2025)
di: Wang, Shaobo, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning
di: Pang, Jinlong, et al.
Pubblicazione: (2025) -
SED-SFT: Selectively Encouraging Diversity in Supervised Fine-Tuning
di: Chen, Yijie, et al.
Pubblicazione: (2026) -
Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models
di: Liu, Ziche, et al.
Pubblicazione: (2024) -
From Instance Selection to Fixed-Pool Data Recipe Search for Supervised Fine-Tuning
di: Wu, Haodong, et al.
Pubblicazione: (2026) -
Selective Self-to-Supervised Fine-Tuning for Generalization in Large Language Models
di: Gupta, Sonam, et al.
Pubblicazione: (2025)