:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autore principale:	Shen, Ming
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computation and Language
Accesso online:	https://arxiv.org/abs/2402.06094
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning
di: Pang, Jinlong, et al.
Pubblicazione: (2025)

SED-SFT: Selectively Encouraging Diversity in Supervised Fine-Tuning
di: Chen, Yijie, et al.
Pubblicazione: (2026)

Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models
di: Liu, Ziche, et al.
Pubblicazione: (2024)

From Instance Selection to Fixed-Pool Data Recipe Search for Supervised Fine-Tuning
di: Wu, Haodong, et al.
Pubblicazione: (2026)

Selective Self-to-Supervised Fine-Tuning for Generalization in Large Language Models
di: Gupta, Sonam, et al.
Pubblicazione: (2025)

Rethinking Supervised Fine-Tuning: Emphasizing Key Answer Tokens for Improved LLM Accuracy
di: Shi, Xiaofeng, et al.
Pubblicazione: (2025)

Data Repetition Beats Data Scaling in Long-CoT Supervised Fine-Tuning
di: Kopiczko, Dawid J., et al.
Pubblicazione: (2026)

Anchored Supervised Fine-Tuning
di: Zhu, He, et al.
Pubblicazione: (2025)

One-Token Rollout: Guiding Supervised Fine-Tuning of LLMs with Policy Gradient
di: Ming, Rui, et al.
Pubblicazione: (2025)

Proximal Supervised Fine-Tuning
di: Zhu, Wenhong, et al.
Pubblicazione: (2025)

Skill-Aware Data Selection and Fine-Tuning for Data-Efficient Reasoning Distillation
di: Zhang, Lechen, et al.
Pubblicazione: (2026)

Supervised In-Context Fine-Tuning for Generative Sequence Labeling
di: Dukić, David, et al.
Pubblicazione: (2025)

UFT: Unifying Supervised and Reinforcement Fine-Tuning
di: Liu, Mingyang, et al.
Pubblicazione: (2025)

Mind the Gap: Data Rewriting for Stable Off-Policy Supervised Fine-Tuning
di: Zhao, Shiwan, et al.
Pubblicazione: (2025)

On the Role of Reasoning Patterns in the Generalization Discrepancy of Long Chain-of-Thought Supervised Fine-Tuning
di: Li, Zhaoyi, et al.
Pubblicazione: (2026)

Leveraging Web-Crawled Data for High-Quality Fine-Tuning
di: Zhou, Jing, et al.
Pubblicazione: (2024)

Fine-Tuning LLMs for Report Summarization: Analysis on Supervised and Unsupervised Data
di: Rallapalli, Swati, et al.
Pubblicazione: (2025)

Dynamic Jointly Batch Selection for Data Efficient Machine Translation Fine-Tuning
di: Ghanizadeh, Mohammad Amin, et al.
Pubblicazione: (2025)

Supervised Fine-Tuning Needs to Unlock the Potential of Token Priority
di: Shen, Zhanming, et al.
Pubblicazione: (2026)

Towards Pedagogical LLMs with Supervised Fine Tuning for Computing Education
di: Vassar, Alexandra, et al.
Pubblicazione: (2024)

Semantic Loss Guided Data Efficient Supervised Fine Tuning for Safe Responses in LLMs
di: Lu, Yuxiao, et al.
Pubblicazione: (2024)

Rethinking Weight Decay for Robust Fine-Tuning of Foundation Models
di: Tian, Junjiao, et al.
Pubblicazione: (2024)

Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models
di: Ding, Yi, et al.
Pubblicazione: (2025)

Selection of LLM Fine-Tuning Data based on Orthogonal Rules
di: Li, Xiaomin, et al.
Pubblicazione: (2024)

Selective Reflection-Tuning: Student-Selected Data Recycling for LLM Instruction-Tuning
di: Li, Ming, et al.
Pubblicazione: (2024)

Supervised Fine-Tuning as Inverse Reinforcement Learning
di: Sun, Hao
Pubblicazione: (2024)

Rethinking Reinforcement Fine-Tuning in LVLM: Convergence, Reward Decomposition, and Generalization
di: Adams, Carter, et al.
Pubblicazione: (2026)

Supervised Fine-Tuning LLMs to Behave as Pedagogical Agents in Programming Education
di: Ross, Emily, et al.
Pubblicazione: (2025)

Towards Efficient Medical Reasoning with Minimal Fine-Tuning Data
di: Zhuang, Xinlin, et al.
Pubblicazione: (2025)

TACOS: Open Tagging and Comparative Scoring for Instruction Fine-Tuning Data Selection
di: He, Xixiang, et al.
Pubblicazione: (2025)

FisherSFT: Data-Efficient Supervised Fine-Tuning of Language Models Using Information Gain
di: Deb, Rohan, et al.
Pubblicazione: (2025)

GraphGen: Enhancing Supervised Fine-Tuning for LLMs with Knowledge-Driven Synthetic Data Generation
di: Chen, Zihong, et al.
Pubblicazione: (2025)

Improving Translation Quality by Selecting Better Data for LLM Fine-Tuning: A Comparative Analysis
di: de Mello, Felipe Ribeiro Fujita, et al.
Pubblicazione: (2025)

CC-Tuning: A Cross-Lingual Connection Mechanism for Improving Joint Multilingual Supervised Fine-Tuning
di: Ye, Yangfan, et al.
Pubblicazione: (2025)

Filter-then-Weight: Online Data Selection and Reweighting for LLM Fine-Tuning
di: Wang, Fangxin, et al.
Pubblicazione: (2026)

EVALALIGN: Supervised Fine-Tuning Multimodal LLMs with Human-Aligned Data for Evaluating Text-to-Image Models
di: Tan, Zhiyu, et al.
Pubblicazione: (2024)

Blending Supervised and Reinforcement Fine-Tuning with Prefix Sampling
di: Huang, Zeyu, et al.
Pubblicazione: (2025)

Injecting New Knowledge into Large Language Models via Supervised Fine-Tuning
di: Mecklenburg, Nick, et al.
Pubblicazione: (2024)

Rethinking Parameter Sharing for LLM Fine-Tuning with Multiple LoRAs
di: Ban, Hao, et al.
Pubblicazione: (2025)

Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning
di: Wang, Shaobo, et al.
Pubblicazione: (2025)