Enregistré dans:
| Auteurs principaux: | Yang, Zongzhen, Qi, Binhang, Sun, Hailong, Long, Wenrui, Zhao, Ruobing, Gao, Xiang |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2503.01874 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
NeMo: A Neuron-Level Modularizing-While-Training Approach for Decomposing DNN Models
par: Bi, Xiaohan, et autres
Publié: (2025)
par: Bi, Xiaohan, et autres
Publié: (2025)
CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging
par: Sun, Wenju, et autres
Publié: (2025)
par: Sun, Wenju, et autres
Publié: (2025)
One Size Does Not Fit All: A Distribution-Aware Sparsification for More Precise Model Merging
par: Luo, Yingfeng, et autres
Publié: (2025)
par: Luo, Yingfeng, et autres
Publié: (2025)
Merging Smarter, Generalizing Better: Enhancing Model Merging on OOD Data
par: Zhang, Bingjie, et autres
Publié: (2025)
par: Zhang, Bingjie, et autres
Publié: (2025)
Mix Data or Merge Models? Balancing the Helpfulness, Honesty, and Harmlessness of Large Language Model via Model Merging
par: Yang, Jinluan, et autres
Publié: (2025)
par: Yang, Jinluan, et autres
Publié: (2025)
Task Arithmetic in Trust Region: A Training-Free Model Merging Approach to Navigate Knowledge Conflicts
par: Sun, Wenju, et autres
Publié: (2025)
par: Sun, Wenju, et autres
Publié: (2025)
VADE: Variance-Aware Dynamic Sampling via Online Sample-Level Difficulty Estimation for Multimodal RL
par: Hu, Zengjie, et autres
Publié: (2025)
par: Hu, Zengjie, et autres
Publié: (2025)
Model Merging in the Essential Subspace
par: Li, Longhua, et autres
Publié: (2026)
par: Li, Longhua, et autres
Publié: (2026)
Sparsity-Aware Evolution for Model Merging
par: Zhang, Huan, et autres
Publié: (2026)
par: Zhang, Huan, et autres
Publié: (2026)
Graph Sparsification via Mixture of Graphs
par: Zhang, Guibin, et autres
Publié: (2024)
par: Zhang, Guibin, et autres
Publié: (2024)
Adaptive Redundancy Regulation for Balanced Multimodal Information Refinement
par: Yang, Zhe, et autres
Publié: (2025)
par: Yang, Zhe, et autres
Publié: (2025)
SPICE: Submodular Penalized Information-Conflict Selection for Efficient Large Language Model Training
par: Chang, Powei, et autres
Publié: (2026)
par: Chang, Powei, et autres
Publié: (2026)
BD-Merging: Bias-Aware Dynamic Model Merging with Evidence-Guided Contrastive Learning
par: Xie, Yuhan, et autres
Publié: (2026)
par: Xie, Yuhan, et autres
Publié: (2026)
Multi-Level Collaboration in Model Merging
par: Li, Qi, et autres
Publié: (2025)
par: Li, Qi, et autres
Publié: (2025)
PSNE: Efficient Spectral Sparsification Algorithms for Scaling Network Embedding
par: Lin, Longlong, et autres
Publié: (2024)
par: Lin, Longlong, et autres
Publié: (2024)
AtmosSci-Bench: Evaluating the Recent Advance of Large Language Model for Atmospheric Science
par: Li, Chenyue, et autres
Publié: (2025)
par: Li, Chenyue, et autres
Publié: (2025)
SQL-GEN: Bridging the Dialect Gap for Text-to-SQL Via Synthetic Data And Model Merging
par: Pourreza, Mohammadreza, et autres
Publié: (2024)
par: Pourreza, Mohammadreza, et autres
Publié: (2024)
PSO-Merging: Merging Models Based on Particle Swarm Optimization
par: Zhang, Kehao, et autres
Publié: (2025)
par: Zhang, Kehao, et autres
Publié: (2025)
GLASS: Global-Local Aggregation for Inference-time Sparsification of LLMs
par: Sattarifard, Amirmohsen, et autres
Publié: (2025)
par: Sattarifard, Amirmohsen, et autres
Publié: (2025)
SAL: Selective Adaptive Learning for Backpropagation-Free Training with Sparsification
par: Liu, Fanping, et autres
Publié: (2026)
par: Liu, Fanping, et autres
Publié: (2026)
MIN-Merging: Merge the Important Neurons for Model Merging
par: Liang, Yunfei
Publié: (2025)
par: Liang, Yunfei
Publié: (2025)
Tunable MAGMAX: Preference-Aware Model Merging for Continual Learning
par: Hiroshima, Kei, et autres
Publié: (2026)
par: Hiroshima, Kei, et autres
Publié: (2026)
Conflict-Aware Adversarial Training
par: Xue, Zhiyu, et autres
Publié: (2024)
par: Xue, Zhiyu, et autres
Publié: (2024)
GraSS: Scalable Data Attribution with Gradient Sparsification and Sparse Projection
par: Hu, Pingbang, et autres
Publié: (2025)
par: Hu, Pingbang, et autres
Publié: (2025)
Training-free Heterogeneous Model Merging
par: Xu, Zhengqi, et autres
Publié: (2024)
par: Xu, Zhengqi, et autres
Publié: (2024)
Parameter Competition Balancing for Model Merging
par: Du, Guodong, et autres
Publié: (2024)
par: Du, Guodong, et autres
Publié: (2024)
Toward a Holistic Approach to Continual Model Merging
par: Phan, Hoang, et autres
Publié: (2025)
par: Phan, Hoang, et autres
Publié: (2025)
MergeIT: From Selection to Merging for Efficient Instruction Tuning
par: Cai, Hongyi, et autres
Publié: (2025)
par: Cai, Hongyi, et autres
Publié: (2025)
MergeMix: Optimizing Mid-Training Data Mixtures via Learnable Model Merging
par: Wang, Jiapeng, et autres
Publié: (2026)
par: Wang, Jiapeng, et autres
Publié: (2026)
Diffusion-Modeled Reinforcement Learning for Carbon and Risk-Aware Microgrid Optimization
par: Zhao, Yunyi, et autres
Publié: (2025)
par: Zhao, Yunyi, et autres
Publié: (2025)
Symmetry-Aware Graph Metanetwork Autoencoders: Model Merging through Parameter Canonicalization
par: Boufalis, Odysseas, et autres
Publié: (2025)
par: Boufalis, Odysseas, et autres
Publié: (2025)
Mediator: Memory-efficient LLM Merging with Less Parameter Conflicts and Uncertainty Based Routing
par: Lai, Kunfeng, et autres
Publié: (2025)
par: Lai, Kunfeng, et autres
Publié: (2025)
Clustering Properties of Self-Supervised Learning
par: Weng, Xi, et autres
Publié: (2025)
par: Weng, Xi, et autres
Publié: (2025)
Reliable Conflictive Multi-View Learning
par: Xu, Cai, et autres
Publié: (2024)
par: Xu, Cai, et autres
Publié: (2024)
Shapley-Value-Based Graph Sparsification for GNN Inference
par: Akkas, Selahattin, et autres
Publié: (2025)
par: Akkas, Selahattin, et autres
Publié: (2025)
CuDIP: Enhancing Theorem Proving in LLMs via Curriculum Learning-based Direct Preference Optimization
par: Shi, Shuming, et autres
Publié: (2025)
par: Shi, Shuming, et autres
Publié: (2025)
Multi-level Conflict-Aware Network for Multi-modal Sentiment Analysis
par: Gao, Yubo, et autres
Publié: (2025)
par: Gao, Yubo, et autres
Publié: (2025)
FW-Merging: Scaling Model Merging with Frank-Wolfe Optimization
par: Chen, Hao Mark, et autres
Publié: (2025)
par: Chen, Hao Mark, et autres
Publié: (2025)
Bayesian Model Merging
par: Li, Kaiyang, et autres
Publié: (2026)
par: Li, Kaiyang, et autres
Publié: (2026)
On the Opportunities of (Re)-Exploring Atmospheric Science by Foundation Models: A Case Study
par: Zhang, Lujia, et autres
Publié: (2024)
par: Zhang, Lujia, et autres
Publié: (2024)
Documents similaires
-
NeMo: A Neuron-Level Modularizing-While-Training Approach for Decomposing DNN Models
par: Bi, Xiaohan, et autres
Publié: (2025) -
CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging
par: Sun, Wenju, et autres
Publié: (2025) -
One Size Does Not Fit All: A Distribution-Aware Sparsification for More Precise Model Merging
par: Luo, Yingfeng, et autres
Publié: (2025) -
Merging Smarter, Generalizing Better: Enhancing Model Merging on OOD Data
par: Zhang, Bingjie, et autres
Publié: (2025) -
Mix Data or Merge Models? Balancing the Helpfulness, Honesty, and Harmlessness of Large Language Model via Model Merging
par: Yang, Jinluan, et autres
Publié: (2025)