Gespeichert in:
| Hauptverfasser: | Le, Hung, Venkatesh, Svetha |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2605.13162 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Reasoning Under 1 Billion: Memory-Augmented Reinforcement Learning for Large Language Models
von: Le, Hung, et al.
Veröffentlicht: (2025)
von: Le, Hung, et al.
Veröffentlicht: (2025)
SPaCe: Unlocking Sample-Efficient Large Language Models Training With Self-Pace Curriculum Learning
von: Do, Dai, et al.
Veröffentlicht: (2025)
von: Do, Dai, et al.
Veröffentlicht: (2025)
Uncertainty-Guided Checkpoint Selection for Reinforcement Finetuning of Large Language Models
von: Nguyen, Manh, et al.
Veröffentlicht: (2025)
von: Nguyen, Manh, et al.
Veröffentlicht: (2025)
Stable Hadamard Memory: Revitalizing Memory-Augmented Agents for Reinforcement Learning
von: Le, Hung, et al.
Veröffentlicht: (2024)
von: Le, Hung, et al.
Veröffentlicht: (2024)
Enhancing Length Extrapolation in Sequential Models with Pointer-Augmented Neural Memory
von: Le, Hung, et al.
Veröffentlicht: (2024)
von: Le, Hung, et al.
Veröffentlicht: (2024)
Variable-Agnostic Causal Exploration for Reinforcement Learning
von: Nguyen, Minh Hoang, et al.
Veröffentlicht: (2024)
von: Nguyen, Minh Hoang, et al.
Veröffentlicht: (2024)
Beyond Surprise: Improving Exploration Through Surprise Novelty
von: Le, Hung, et al.
Veröffentlicht: (2023)
von: Le, Hung, et al.
Veröffentlicht: (2023)
Multi-Reference Preference Optimization for Large Language Models
von: Le, Hung, et al.
Veröffentlicht: (2024)
von: Le, Hung, et al.
Veröffentlicht: (2024)
Large Language Models Prompting With Episodic Memory
von: Do, Dai, et al.
Veröffentlicht: (2024)
von: Do, Dai, et al.
Veröffentlicht: (2024)
Bayesian Optimistic Optimisation with Exponentially Decaying Regret
von: Tran-The, Hung, et al.
Veröffentlicht: (2021)
von: Tran-The, Hung, et al.
Veröffentlicht: (2021)
Trading Convergence Rate with Computational Budget in High Dimensional Bayesian Optimization
von: Tran-The, Hung, et al.
Veröffentlicht: (2019)
von: Tran-The, Hung, et al.
Veröffentlicht: (2019)
Generating Realistic Tabular Data with Large Language Models
von: Nguyen, Dang, et al.
Veröffentlicht: (2024)
von: Nguyen, Dang, et al.
Veröffentlicht: (2024)
Regret Bounds for Expected Improvement Algorithms in Gaussian Process Bandit Optimization
von: Tran-The, Hung, et al.
Veröffentlicht: (2022)
von: Tran-The, Hung, et al.
Veröffentlicht: (2022)
Adaptive Acquisition Selection for Bayesian Optimization with Large Language Models
von: Ngo, Giang, et al.
Veröffentlicht: (2026)
von: Ngo, Giang, et al.
Veröffentlicht: (2026)
Federated Domain Generalization with Latent Space Inversion
von: Palakkadavath, Ragja, et al.
Veröffentlicht: (2025)
von: Palakkadavath, Ragja, et al.
Veröffentlicht: (2025)
Sub-linear Regret Bounds for Bayesian Optimisation in Unknown Search Spaces
von: Tran-The, Hung, et al.
Veröffentlicht: (2020)
von: Tran-The, Hung, et al.
Veröffentlicht: (2020)
Large Language Models for Imbalanced Classification: Diversity makes the difference
von: Nguyen, Dang, et al.
Veröffentlicht: (2025)
von: Nguyen, Dang, et al.
Veröffentlicht: (2025)
Novel Kernel Models and Exact Representor Theory for Neural Networks Beyond the Over-Parameterized Regime
von: Shilton, Alistair, et al.
Veröffentlicht: (2024)
von: Shilton, Alistair, et al.
Veröffentlicht: (2024)
Revisiting the Dataset Bias Problem from a Statistical Perspective
von: Do, Kien, et al.
Veröffentlicht: (2024)
von: Do, Kien, et al.
Veröffentlicht: (2024)
Score-based Integrated Gradient for Root Cause Explanations of Outliers
von: Nguyen, Phuoc, et al.
Veröffentlicht: (2026)
von: Nguyen, Phuoc, et al.
Veröffentlicht: (2026)
Enhanced Bayesian Optimization via Preferential Modeling of Abstract Properties
von: A V, Arun Kumar, et al.
Veröffentlicht: (2024)
von: A V, Arun Kumar, et al.
Veröffentlicht: (2024)
Finding the Trigger: Causal Abductive Reasoning on Video Events
von: Le, Thao Minh, et al.
Veröffentlicht: (2025)
von: Le, Thao Minh, et al.
Veröffentlicht: (2025)
ChargeFlow: Flow-Matching Refinement of Charge-Conditioned Electron Densities
von: Nguyen, Tri Minh, et al.
Veröffentlicht: (2026)
von: Nguyen, Tri Minh, et al.
Veröffentlicht: (2026)
FedKRSO: Communication and Memory Efficient Federated Fine-Tuning of Large Language Models
von: Yang, Guohao, et al.
Veröffentlicht: (2026)
von: Yang, Guohao, et al.
Veröffentlicht: (2026)
Efficient Symmetry-Aware Materials Generation via Hierarchical Generative Flow Networks
von: Nguyen, Tri Minh, et al.
Veröffentlicht: (2024)
von: Nguyen, Tri Minh, et al.
Veröffentlicht: (2024)
Simultaneous Computation and Memory Efficient Zeroth-Order Optimizer for Fine-Tuning Large Language Models
von: Wang, Fei, et al.
Veröffentlicht: (2024)
von: Wang, Fei, et al.
Veröffentlicht: (2024)
Antibody: Strengthening Defense Against Harmful Fine-Tuning for Large Language Models via Attenuating Harmful Gradient Influence
von: Nguyen, Quoc Minh, et al.
Veröffentlicht: (2026)
von: Nguyen, Quoc Minh, et al.
Veröffentlicht: (2026)
Composite Concept Extraction through Backdooring
von: Ghosh, Banibrata, et al.
Veröffentlicht: (2024)
von: Ghosh, Banibrata, et al.
Veröffentlicht: (2024)
Self-Generative Adversarial Fine-Tuning for Large Language Models
von: Wu, Shiguang, et al.
Veröffentlicht: (2026)
von: Wu, Shiguang, et al.
Veröffentlicht: (2026)
Diversity in Large Language Models under Supervised Fine-Tuning
von: Klypa, Roman, et al.
Veröffentlicht: (2026)
von: Klypa, Roman, et al.
Veröffentlicht: (2026)
Decentralized Low-Rank Fine-Tuning of Large Language Models
von: Ghiasvand, Sajjad, et al.
Veröffentlicht: (2025)
von: Ghiasvand, Sajjad, et al.
Veröffentlicht: (2025)
Sparse Gradient Compression for Fine-Tuning Large Language Models
von: Yang, David H., et al.
Veröffentlicht: (2025)
von: Yang, David H., et al.
Veröffentlicht: (2025)
ZO2: Scalable Zeroth-Order Fine-Tuning for Extremely Large Language Models with Limited GPU Memory
von: Wang, Liangyu, et al.
Veröffentlicht: (2025)
von: Wang, Liangyu, et al.
Veröffentlicht: (2025)
FLAME: Towards Federated Fine-Tuning Large Language Models Through Adaptive SMoE
von: Le, Khiem, et al.
Veröffentlicht: (2025)
von: Le, Khiem, et al.
Veröffentlicht: (2025)
LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning
von: Pan, Rui, et al.
Veröffentlicht: (2024)
von: Pan, Rui, et al.
Veröffentlicht: (2024)
Multi-Level Safety Continual Projection for Fine-Tuned Large Language Models without Retraining
von: Han, Bing, et al.
Veröffentlicht: (2025)
von: Han, Bing, et al.
Veröffentlicht: (2025)
Linearization Explains Fine-Tuning in Large Language Models
von: Afzal, Zahra Rahimi, et al.
Veröffentlicht: (2026)
von: Afzal, Zahra Rahimi, et al.
Veröffentlicht: (2026)
Dissecting Fine-Tuning Unlearning in Large Language Models
von: Hong, Yihuai, et al.
Veröffentlicht: (2024)
von: Hong, Yihuai, et al.
Veröffentlicht: (2024)
Security Vulnerability Detection with Multitask Self-Instructed Fine-Tuning of Large Language Models
von: Yang, Aidan Z. H., et al.
Veröffentlicht: (2024)
von: Yang, Aidan Z. H., et al.
Veröffentlicht: (2024)
Differentially Private Subspace Fine-Tuning for Large Language Models
von: Zheng, Lele, et al.
Veröffentlicht: (2026)
von: Zheng, Lele, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
Reasoning Under 1 Billion: Memory-Augmented Reinforcement Learning for Large Language Models
von: Le, Hung, et al.
Veröffentlicht: (2025) -
SPaCe: Unlocking Sample-Efficient Large Language Models Training With Self-Pace Curriculum Learning
von: Do, Dai, et al.
Veröffentlicht: (2025) -
Uncertainty-Guided Checkpoint Selection for Reinforcement Finetuning of Large Language Models
von: Nguyen, Manh, et al.
Veröffentlicht: (2025) -
Stable Hadamard Memory: Revitalizing Memory-Augmented Agents for Reinforcement Learning
von: Le, Hung, et al.
Veröffentlicht: (2024) -
Enhancing Length Extrapolation in Sequential Models with Pointer-Augmented Neural Memory
von: Le, Hung, et al.
Veröffentlicht: (2024)