Gespeichert in:
| 1. Verfasser: | Tucci, Mauro |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2508.09787 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training
von: Xi, Haocheng, et al.
Veröffentlicht: (2024)
von: Xi, Haocheng, et al.
Veröffentlicht: (2024)
Federated Semi-Supervised Graph Neural Networks with Prototype-Guided Pseudo-Labeling for Privacy-Preserving Gestational Diabetes Mellitus Prediction
von: Daniela, G. Victor, et al.
Veröffentlicht: (2026)
von: Daniela, G. Victor, et al.
Veröffentlicht: (2026)
InverseScope: Scalable Activation Inversion for Interpreting Large Language Models
von: Luo, Yifan, et al.
Veröffentlicht: (2025)
von: Luo, Yifan, et al.
Veröffentlicht: (2025)
Dual-Prototype Disentanglement: A Context-Aware Enhancement Framework for Time Series Forecasting
von: Yang, Haonan, et al.
Veröffentlicht: (2026)
von: Yang, Haonan, et al.
Veröffentlicht: (2026)
Dual-LoRA and Quality-Enhanced Pseudo Replay for Multimodal Continual Food Learning
von: Wu, Xinlan, et al.
Veröffentlicht: (2025)
von: Wu, Xinlan, et al.
Veröffentlicht: (2025)
Proto-EVFL: Enhanced Vertical Federated Learning via Dual Prototype with Extremely Unaligned Data
von: Guo, Wei, et al.
Veröffentlicht: (2025)
von: Guo, Wei, et al.
Veröffentlicht: (2025)
Error-margin Analysis for Hidden Neuron Activation Labels
von: Dalal, Abhilekha, et al.
Veröffentlicht: (2024)
von: Dalal, Abhilekha, et al.
Veröffentlicht: (2024)
Trust Region Reward Optimization and Proximal Inverse Reward Optimization Algorithm
von: Chen, Yang, et al.
Veröffentlicht: (2025)
von: Chen, Yang, et al.
Veröffentlicht: (2025)
Joint Training Across Multiple Activation Sparsity Regimes
von: Wang, Haotian
Veröffentlicht: (2026)
von: Wang, Haotian
Veröffentlicht: (2026)
Post-Training Statistical Calibration for Higher Activation Sparsity
von: Chua, Vui Seng, et al.
Veröffentlicht: (2024)
von: Chua, Vui Seng, et al.
Veröffentlicht: (2024)
CSPO: Cross-Market Synergistic Stock Price Movement Forecasting with Pseudo-volatility Optimization
von: Lin, Sida, et al.
Veröffentlicht: (2025)
von: Lin, Sida, et al.
Veröffentlicht: (2025)
From Associations to Activations: Comparing Behavioral and Hidden-State Semantic Geometry in LLMs
von: Schiekiera, Louis, et al.
Veröffentlicht: (2026)
von: Schiekiera, Louis, et al.
Veröffentlicht: (2026)
Learning of Population Dynamics: Inverse Optimization Meets JKO Scheme
von: Persiianov, Mikhail, et al.
Veröffentlicht: (2025)
von: Persiianov, Mikhail, et al.
Veröffentlicht: (2025)
Gradient-Direction Sensitivity Reveals Linear-Centroid Coupling Hidden by Optimizer Trajectories
von: Xu, Yongzhong
Veröffentlicht: (2026)
von: Xu, Yongzhong
Veröffentlicht: (2026)
Embedding Hidden Adversarial Capabilities in Pre-Trained Diffusion Models
von: Beerens, Lucas, et al.
Veröffentlicht: (2025)
von: Beerens, Lucas, et al.
Veröffentlicht: (2025)
Emergent Low-Rank Training Dynamics in MLPs with Smooth Activations
von: Xu, Alec S., et al.
Veröffentlicht: (2026)
von: Xu, Alec S., et al.
Veröffentlicht: (2026)
Activation Sensitivity as a Unifying Principle for Post-Training Quantization
von: Xu, Bruce Changlong
Veröffentlicht: (2026)
von: Xu, Bruce Changlong
Veröffentlicht: (2026)
Contrastive Conceptor Activation Steering (COAST): Unlocking Vision-Language-Action Models through Hidden States
von: Miao, Miranda Muqing, et al.
Veröffentlicht: (2026)
von: Miao, Miranda Muqing, et al.
Veröffentlicht: (2026)
Activation Oracles: Training and Evaluating LLMs as General-Purpose Activation Explainers
von: Karvonen, Adam, et al.
Veröffentlicht: (2025)
von: Karvonen, Adam, et al.
Veröffentlicht: (2025)
SNOO: Step-K Nesterov Outer Optimizer - The Surprising Effectiveness of Nesterov Momentum Applied to Pseudo-Gradients
von: Kallusky, Dominik, et al.
Veröffentlicht: (2025)
von: Kallusky, Dominik, et al.
Veröffentlicht: (2025)
The Optimiser Hidden in Plain Sight: Training with the Loss Landscape's Induced Metric
von: Harvey, Thomas R.
Veröffentlicht: (2025)
von: Harvey, Thomas R.
Veröffentlicht: (2025)
To Think or Not to Think: The Hidden Cost of Meta-Training with Excessive CoT Examples
von: Kothapalli, Vignesh, et al.
Veröffentlicht: (2025)
von: Kothapalli, Vignesh, et al.
Veröffentlicht: (2025)
DualOptim: Enhancing Efficacy and Stability in Machine Unlearning with Dual Optimizers
von: Zhong, Xuyang, et al.
Veröffentlicht: (2025)
von: Zhong, Xuyang, et al.
Veröffentlicht: (2025)
A Dual Perspective on Decision-Focused Learning: Scalable Training via Dual-Guided Surrogates
von: Rodriguez-Diaz, Paula, et al.
Veröffentlicht: (2025)
von: Rodriguez-Diaz, Paula, et al.
Veröffentlicht: (2025)
Prototype Augmented Hypernetworks for Continual Learning
von: De La Fuente, Neil, et al.
Veröffentlicht: (2025)
von: De La Fuente, Neil, et al.
Veröffentlicht: (2025)
Comprehensive Evaluation of Prototype Neural Networks
von: Schlinge, Philipp, et al.
Veröffentlicht: (2025)
von: Schlinge, Philipp, et al.
Veröffentlicht: (2025)
Hyperspherical Forward-Forward with Prototypical Representations
von: Sarode, Shalini, et al.
Veröffentlicht: (2026)
von: Sarode, Shalini, et al.
Veröffentlicht: (2026)
Improving Inverse Folding for Peptide Design with Diversity-regularized Direct Preference Optimization
von: Park, Ryan, et al.
Veröffentlicht: (2024)
von: Park, Ryan, et al.
Veröffentlicht: (2024)
SP2RINT: Spatially-Decoupled Physics-Inspired Progressive Inverse Optimization for Scalable, PDE-Constrained Meta-Optical Neural Network Training
von: Ma, Pingchuan, et al.
Veröffentlicht: (2025)
von: Ma, Pingchuan, et al.
Veröffentlicht: (2025)
Online Pseudo-Zeroth-Order Training of Neuromorphic Spiking Neural Networks
von: Xiao, Mingqing, et al.
Veröffentlicht: (2024)
von: Xiao, Mingqing, et al.
Veröffentlicht: (2024)
Developing Training Procedures for Piecewise-linear Spline Activation Functions in Neural Networks
von: Patty, William H
Veröffentlicht: (2025)
von: Patty, William H
Veröffentlicht: (2025)
Unveiling the Backdoor Mechanism Hidden Behind Catastrophic Overfitting in Fast Adversarial Training
von: Zhao, Mengnan, et al.
Veröffentlicht: (2026)
von: Zhao, Mengnan, et al.
Veröffentlicht: (2026)
Activation-Descent Regularization for Input Optimization of ReLU Networks
von: Yu, Hongzhan, et al.
Veröffentlicht: (2024)
von: Yu, Hongzhan, et al.
Veröffentlicht: (2024)
Federated Offline Policy Optimization with Dual Regularization
von: Yue, Sheng, et al.
Veröffentlicht: (2024)
von: Yue, Sheng, et al.
Veröffentlicht: (2024)
Learning with Hidden Factorial Structure
von: Arnal, Charles, et al.
Veröffentlicht: (2024)
von: Arnal, Charles, et al.
Veröffentlicht: (2024)
Optimizing ML Training with Metagradient Descent
von: Engstrom, Logan, et al.
Veröffentlicht: (2025)
von: Engstrom, Logan, et al.
Veröffentlicht: (2025)
Interpretable Prototype-based Graph Information Bottleneck
von: Seo, Sangwoo, et al.
Veröffentlicht: (2023)
von: Seo, Sangwoo, et al.
Veröffentlicht: (2023)
Predefined Prototypes for Intra-Class Separation and Disentanglement
von: Almudévar, Antonio, et al.
Veröffentlicht: (2024)
von: Almudévar, Antonio, et al.
Veröffentlicht: (2024)
Trust Region Inverse Reinforcement Learning: Explicit Dual Ascent using Local Policy Updates
von: Diwan, Anish, et al.
Veröffentlicht: (2026)
von: Diwan, Anish, et al.
Veröffentlicht: (2026)
CoLA: Compute-Efficient Pre-Training of LLMs via Low-Rank Activation
von: Liu, Ziyue, et al.
Veröffentlicht: (2025)
von: Liu, Ziyue, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training
von: Xi, Haocheng, et al.
Veröffentlicht: (2024) -
Federated Semi-Supervised Graph Neural Networks with Prototype-Guided Pseudo-Labeling for Privacy-Preserving Gestational Diabetes Mellitus Prediction
von: Daniela, G. Victor, et al.
Veröffentlicht: (2026) -
InverseScope: Scalable Activation Inversion for Interpreting Large Language Models
von: Luo, Yifan, et al.
Veröffentlicht: (2025) -
Dual-Prototype Disentanglement: A Context-Aware Enhancement Framework for Time Series Forecasting
von: Yang, Haonan, et al.
Veröffentlicht: (2026) -
Dual-LoRA and Quality-Enhanced Pseudo Replay for Multimodal Continual Food Learning
von: Wu, Xinlan, et al.
Veröffentlicht: (2025)