Enregistré dans:
| Auteurs principaux: | Klypa, Roman, Cherednichenko, Oleksandr |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2605.00195 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Preserving Diversity in Supervised Fine-Tuning of Large Language Models
par: Li, Ziniu, et autres
Publié: (2024)
par: Li, Ziniu, et autres
Publié: (2024)
Multimodal Alignment and Preference Optimization for Zero-Shot Conditional RNA Generation
par: Klypa, Roman, et autres
Publié: (2026)
par: Klypa, Roman, et autres
Publié: (2026)
BAnG: Bidirectional Anchored Generation for Conditional RNA Design
par: Klypa, Roman, et autres
Publié: (2025)
par: Klypa, Roman, et autres
Publié: (2025)
SFT-GO: Supervised Fine-Tuning with Group Optimization for Large Language Models
par: Kim, Gyuhak, et autres
Publié: (2025)
par: Kim, Gyuhak, et autres
Publié: (2025)
The Effectiveness of Approximate Regularized Replay for Efficient Supervised Fine-Tuning of Large Language Models
par: Riemer, Matthew, et autres
Publié: (2025)
par: Riemer, Matthew, et autres
Publié: (2025)
RoSTE: An Efficient Quantization-Aware Supervised Fine-Tuning Approach for Large Language Models
par: Wei, Quan, et autres
Publié: (2025)
par: Wei, Quan, et autres
Publié: (2025)
Large Language Models for Sequential Decision-Making: Improving In-Context Learning via Supervised Fine-Tuning
par: Zhang, Minmin, et autres
Publié: (2026)
par: Zhang, Minmin, et autres
Publié: (2026)
Anchored Supervised Fine-Tuning
par: Zhu, He, et autres
Publié: (2025)
par: Zhu, He, et autres
Publié: (2025)
Self-Generative Adversarial Fine-Tuning for Large Language Models
par: Wu, Shiguang, et autres
Publié: (2026)
par: Wu, Shiguang, et autres
Publié: (2026)
Decentralized Low-Rank Fine-Tuning of Large Language Models
par: Ghiasvand, Sajjad, et autres
Publié: (2025)
par: Ghiasvand, Sajjad, et autres
Publié: (2025)
Sparse Gradient Compression for Fine-Tuning Large Language Models
par: Yang, David H., et autres
Publié: (2025)
par: Yang, David H., et autres
Publié: (2025)
Linearization Explains Fine-Tuning in Large Language Models
par: Afzal, Zahra Rahimi, et autres
Publié: (2026)
par: Afzal, Zahra Rahimi, et autres
Publié: (2026)
Dissecting Fine-Tuning Unlearning in Large Language Models
par: Hong, Yihuai, et autres
Publié: (2024)
par: Hong, Yihuai, et autres
Publié: (2024)
Closed-Loop Supervised Fine-Tuning of Tokenized Traffic Models
par: Zhang, Zhejun, et autres
Publié: (2024)
par: Zhang, Zhejun, et autres
Publié: (2024)
Unlock the Correlation between Supervised Fine-Tuning and Reinforcement Learning in Training Code Large Language Models
par: Chen, Jie, et autres
Publié: (2024)
par: Chen, Jie, et autres
Publié: (2024)
Continual Fine-Tuning of Large Language Models via Program Memory
par: Le, Hung, et autres
Publié: (2026)
par: Le, Hung, et autres
Publié: (2026)
Proximal Supervised Fine-Tuning
par: Zhu, Wenhong, et autres
Publié: (2025)
par: Zhu, Wenhong, et autres
Publié: (2025)
Aligning Large Language Model Agents with Rational and Moral Preferences: A Supervised Fine-Tuning Approach
par: Lu, Wei, et autres
Publié: (2025)
par: Lu, Wei, et autres
Publié: (2025)
Rotation-Preserving Supervised Fine-Tuning
par: Jin, Hangzhan, et autres
Publié: (2026)
par: Jin, Hangzhan, et autres
Publié: (2026)
Differentially Private Subspace Fine-Tuning for Large Language Models
par: Zheng, Lele, et autres
Publié: (2026)
par: Zheng, Lele, et autres
Publié: (2026)
On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models
par: Wang, Shumin, et autres
Publié: (2026)
par: Wang, Shumin, et autres
Publié: (2026)
Personalized Collaborative Fine-Tuning for On-Device Large Language Models
par: Wagner, Nicolas, et autres
Publié: (2024)
par: Wagner, Nicolas, et autres
Publié: (2024)
How Multilingual Are Large Language Models Fine-Tuned for Translation?
par: Richburg, Aquia, et autres
Publié: (2024)
par: Richburg, Aquia, et autres
Publié: (2024)
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning
par: Hong, Joey, et autres
Publié: (2024)
par: Hong, Joey, et autres
Publié: (2024)
Boosting Large Language Models with Mask Fine-Tuning
par: Zhang, Mingyuan, et autres
Publié: (2025)
par: Zhang, Mingyuan, et autres
Publié: (2025)
Scaling Sparse Fine-Tuning to Large Language Models
par: Ansell, Alan, et autres
Publié: (2024)
par: Ansell, Alan, et autres
Publié: (2024)
Erasing the Bias: Fine-Tuning Foundation Models for Semi-Supervised Learning
par: Gan, Kai, et autres
Publié: (2024)
par: Gan, Kai, et autres
Publié: (2024)
Hyperbolic Fine-Tuning for Large Language Models
par: Yang, Menglin, et autres
Publié: (2024)
par: Yang, Menglin, et autres
Publié: (2024)
Generalizing Machine Learning Evaluation through the Integration of Shannon Entropy and Rough Set Theory
par: Cherednichenko, Olga, et autres
Publié: (2024)
par: Cherednichenko, Olga, et autres
Publié: (2024)
Tangent Space Fine-Tuning for Directional Preference Alignment in Large Language Models
par: Erdogan, Mete
Publié: (2026)
par: Erdogan, Mete
Publié: (2026)
Resource-Efficient Federated Fine-Tuning Large Language Models for Heterogeneous Data
par: Liu, Jun, et autres
Publié: (2025)
par: Liu, Jun, et autres
Publié: (2025)
FisherSFT: Data-Efficient Supervised Fine-Tuning of Language Models Using Information Gain
par: Deb, Rohan, et autres
Publié: (2025)
par: Deb, Rohan, et autres
Publié: (2025)
Aligning Large Language Models via Fine-grained Supervision
par: Xu, Dehong, et autres
Publié: (2024)
par: Xu, Dehong, et autres
Publié: (2024)
UFT: Unifying Supervised and Reinforcement Fine-Tuning
par: Liu, Mingyang, et autres
Publié: (2025)
par: Liu, Mingyang, et autres
Publié: (2025)
Fine-Tuning Large Language Models to Appropriately Abstain with Semantic Entropy
par: Tjandra, Benedict Aaron, et autres
Publié: (2024)
par: Tjandra, Benedict Aaron, et autres
Publié: (2024)
Communication-Efficient and Tensorized Federated Fine-Tuning of Large Language Models
par: Ghiasvand, Sajjad, et autres
Publié: (2024)
par: Ghiasvand, Sajjad, et autres
Publié: (2024)
Crafting Efficient Fine-Tuning Strategies for Large Language Models
par: Oliver, Michael, et autres
Publié: (2024)
par: Oliver, Michael, et autres
Publié: (2024)
Improving Large Language Models with Concept-Aware Fine-Tuning
par: Chen, Michael K., et autres
Publié: (2025)
par: Chen, Michael K., et autres
Publié: (2025)
Accurate and Efficient Fine-Tuning of Quantized Large Language Models Through Optimal Balance
par: Shen, Ao, et autres
Publié: (2024)
par: Shen, Ao, et autres
Publié: (2024)
Safety Fine-Tuning at (Almost) No Cost: A Baseline for Vision Large Language Models
par: Zong, Yongshuo, et autres
Publié: (2024)
par: Zong, Yongshuo, et autres
Publié: (2024)
Documents similaires
-
Preserving Diversity in Supervised Fine-Tuning of Large Language Models
par: Li, Ziniu, et autres
Publié: (2024) -
Multimodal Alignment and Preference Optimization for Zero-Shot Conditional RNA Generation
par: Klypa, Roman, et autres
Publié: (2026) -
BAnG: Bidirectional Anchored Generation for Conditional RNA Design
par: Klypa, Roman, et autres
Publié: (2025) -
SFT-GO: Supervised Fine-Tuning with Group Optimization for Large Language Models
par: Kim, Gyuhak, et autres
Publié: (2025) -
The Effectiveness of Approximate Regularized Replay for Efficient Supervised Fine-Tuning of Large Language Models
par: Riemer, Matthew, et autres
Publié: (2025)