Enregistré dans:
| Auteurs principaux: | Chekalina, Viktoriia, Moskovskiy, Daniil, Cherniuk, Daria, Kurkin, Maxim, Kuznetsov, Andrey, Frolov, Evgeny |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2505.17974 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Addressing Hallucinations in Language Models with Knowledge Graph Embeddings as an Additional Modality
par: Chekalina, Viktoriia, et autres
Publié: (2024)
par: Chekalina, Viktoriia, et autres
Publié: (2024)
DyKAF: Dynamical Kronecker Approximation of the Fisher Information Matrix for Gradient Preconditioning
par: Yudin, Nikolay, et autres
Publié: (2025)
par: Yudin, Nikolay, et autres
Publié: (2025)
CoRoVA: Compressed Representations for Vector-Augmented Code Completion
par: Cherniuk, Daria, et autres
Publié: (2025)
par: Cherniuk, Daria, et autres
Publié: (2025)
LoTR: Low Tensor Rank Weight Adaptation
par: Bershatsky, Daniel, et autres
Publié: (2024)
par: Bershatsky, Daniel, et autres
Publié: (2024)
Knowledge Graph Completion with Mixed Geometry Tensor Factorization
par: Yusupov, Viacheslav, et autres
Publié: (2025)
par: Yusupov, Viacheslav, et autres
Publié: (2025)
<think> So let's replace this phrase with insult... </think> Lessons learned from generation of toxic texts with LLMs
par: Pletenev, Sergey, et autres
Publié: (2025)
par: Pletenev, Sergey, et autres
Publié: (2025)
ERC-SVD: Error-Controlled SVD for Large Language Model Compression
par: Bai, Haolei, et autres
Publié: (2025)
par: Bai, Haolei, et autres
Publié: (2025)
NoReGeo: Non-Reasoning Geometry Benchmark
par: Abdullaeva, Irina, et autres
Publié: (2026)
par: Abdullaeva, Irina, et autres
Publié: (2026)
Quantization of Large Language Models with an Overdetermined Basis
par: Merkulov, Daniil, et autres
Publié: (2024)
par: Merkulov, Daniil, et autres
Publié: (2024)
SparseGrad: A Selective Method for Efficient Fine-tuning of MLP Layers
par: Chekalina, Viktoriia, et autres
Publié: (2024)
par: Chekalina, Viktoriia, et autres
Publié: (2024)
Dynamic Low-rank Approximation of Full-Matrix Preconditioner for Training Generalized Linear Models
par: Matveeva, Tatyana, et autres
Publié: (2025)
par: Matveeva, Tatyana, et autres
Publié: (2025)
Dataless Weight Disentanglement in Task Arithmetic via Kronecker-Factored Approximate Curvature
par: Porrello, Angelo, et autres
Publié: (2026)
par: Porrello, Angelo, et autres
Publié: (2026)
Fisher Mask Nodes for Language Model Merging
par: K, Thennal D, et autres
Publié: (2024)
par: K, Thennal D, et autres
Publié: (2024)
The Approximate Fisher Influence Function: Faster Estimation of Data Influence in Statistical Models
par: Lev, Omri, et autres
Publié: (2024)
par: Lev, Omri, et autres
Publié: (2024)
RTD-Lite: Scalable Topological Analysis for Comparing Weighted Graphs in Learning Tasks
par: Tulchinskii, Eduard, et autres
Publié: (2025)
par: Tulchinskii, Eduard, et autres
Publié: (2025)
Fisher Information-based Efficient Curriculum Federated Learning with Large Language Models
par: Liu, Ji, et autres
Publié: (2024)
par: Liu, Ji, et autres
Publié: (2024)
Fisher Flow Matching for Generative Modeling over Discrete Data
par: Davis, Oscar, et autres
Publié: (2024)
par: Davis, Oscar, et autres
Publié: (2024)
Weighted Stochastic Differential Equation to Implement Wasserstein-Fisher-Rao Gradient Flow
par: Rahimi, Herlock
Publié: (2025)
par: Rahimi, Herlock
Publié: (2025)
Run LoRA Run: Faster and Lighter LoRA Implementations
par: Cherniuk, Daria, et autres
Publié: (2023)
par: Cherniuk, Daria, et autres
Publié: (2023)
AlignMerge - Alignment-Preserving Large Language Model Merging via Fisher-Guided Geometric Constraints
par: Roy, Aniruddha, et autres
Publié: (2025)
par: Roy, Aniruddha, et autres
Publié: (2025)
OmniFusion Technical Report
par: Goncharova, Elizaveta, et autres
Publié: (2024)
par: Goncharova, Elizaveta, et autres
Publié: (2024)
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression
par: Ding, Xuan, et autres
Publié: (2025)
par: Ding, Xuan, et autres
Publié: (2025)
KFCPO: Kronecker-Factored Approximated Constrained Policy Optimization
par: Lim, Joonyoung, et autres
Publié: (2025)
par: Lim, Joonyoung, et autres
Publié: (2025)
Beyond Variance: Knowledge-Aware LLM Compression via Fisher-Aligned Subspace Diagnostics
par: Shihab, Ibne Farabi, et autres
Publié: (2026)
par: Shihab, Ibne Farabi, et autres
Publié: (2026)
Rank-1 Approximation of Inverse Fisher for Natural Policy Gradients in Deep Reinforcement Learning
par: Huo, Yingxiao, et autres
Publié: (2026)
par: Huo, Yingxiao, et autres
Publié: (2026)
AA-SVD : Anchored and Adaptive SVD for Large Language Model Compression
par: Sinha, Atul Kumar, et autres
Publié: (2026)
par: Sinha, Atul Kumar, et autres
Publié: (2026)
FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation
par: Wu, Zhuguanyu, et autres
Publié: (2025)
par: Wu, Zhuguanyu, et autres
Publié: (2025)
Compressing Quantum Fisher Information
par: Tang, Rui Jie, et autres
Publié: (2026)
par: Tang, Rui Jie, et autres
Publié: (2026)
End-to-End Graph-Sequential Representation Learning for Accurate Recommendations
par: Baikalov, Vladimir, et autres
Publié: (2024)
par: Baikalov, Vladimir, et autres
Publié: (2024)
Position-Aware Sequential Attention for Accurate Next Item Recommendations
par: Nabiev, Timur, et autres
Publié: (2026)
par: Nabiev, Timur, et autres
Publié: (2026)
Intrinsic Structure as a Proxy for Saliency: SVD-Based Weight Preservation for Mixed-Precision Quantization in Large Language Models
par: Landge, Shashank, et autres
Publié: (2025)
par: Landge, Shashank, et autres
Publié: (2025)
On the Computation of the Fisher Information in Continual Learning
par: van de Ven, Gido M.
Publié: (2025)
par: van de Ven, Gido M.
Publié: (2025)
Singular Value Decomposition on Kronecker Adaptation for Large Language Model
par: Chong, Yee Hin, et autres
Publié: (2025)
par: Chong, Yee Hin, et autres
Publié: (2025)
Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension
par: Gong, Wenbo, et autres
Publié: (2025)
par: Gong, Wenbo, et autres
Publié: (2025)
Kronecker Factorization Improves Efficiency and Interpretability of Sparse Autoencoders
par: Kurochkin, Vadim, et autres
Publié: (2025)
par: Kurochkin, Vadim, et autres
Publié: (2025)
Scalable Whole Slide Image Representation Using K-Mean Clustering and Fisher Vector Aggregation
par: Gupta, Ravi Kant, et autres
Publié: (2025)
par: Gupta, Ravi Kant, et autres
Publié: (2025)
Fishers for Free? Approximating the Fisher Information Matrix by Recycling the Squared Gradient Accumulator
par: Li, YuXin, et autres
Publié: (2025)
par: Li, YuXin, et autres
Publié: (2025)
Fisher-Bingham-like normalizing flows on the sphere
par: Glüsenkamp, Thorsten
Publié: (2025)
par: Glüsenkamp, Thorsten
Publié: (2025)
Adaptive Variance-Penalized Continual Learning with Fisher Regularization
par: Sarkar, Krisanu
Publié: (2025)
par: Sarkar, Krisanu
Publié: (2025)
Beyond the Mean: Fisher-Orthogonal Projection for Natural Gradient Descent in Large Batch Training
par: Lu, Yishun, et autres
Publié: (2025)
par: Lu, Yishun, et autres
Publié: (2025)
Documents similaires
-
Addressing Hallucinations in Language Models with Knowledge Graph Embeddings as an Additional Modality
par: Chekalina, Viktoriia, et autres
Publié: (2024) -
DyKAF: Dynamical Kronecker Approximation of the Fisher Information Matrix for Gradient Preconditioning
par: Yudin, Nikolay, et autres
Publié: (2025) -
CoRoVA: Compressed Representations for Vector-Augmented Code Completion
par: Cherniuk, Daria, et autres
Publié: (2025) -
LoTR: Low Tensor Rank Weight Adaptation
par: Bershatsky, Daniel, et autres
Publié: (2024) -
Knowledge Graph Completion with Mixed Geometry Tensor Factorization
par: Yusupov, Viacheslav, et autres
Publié: (2025)