:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Chekalina, Viktoriia, Moskovskiy, Daniil, Cherniuk, Daria, Kurkin, Maxim, Kuznetsov, Andrey, Frolov, Evgeny
Format:	Preprint
Publié:	2025
Sujets:	Machine Learning Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2505.17974
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Addressing Hallucinations in Language Models with Knowledge Graph Embeddings as an Additional Modality
par: Chekalina, Viktoriia, et autres
Publié: (2024)

DyKAF: Dynamical Kronecker Approximation of the Fisher Information Matrix for Gradient Preconditioning
par: Yudin, Nikolay, et autres
Publié: (2025)

CoRoVA: Compressed Representations for Vector-Augmented Code Completion
par: Cherniuk, Daria, et autres
Publié: (2025)

LoTR: Low Tensor Rank Weight Adaptation
par: Bershatsky, Daniel, et autres
Publié: (2024)

Knowledge Graph Completion with Mixed Geometry Tensor Factorization
par: Yusupov, Viacheslav, et autres
Publié: (2025)

<think> So let's replace this phrase with insult... </think> Lessons learned from generation of toxic texts with LLMs
par: Pletenev, Sergey, et autres
Publié: (2025)

ERC-SVD: Error-Controlled SVD for Large Language Model Compression
par: Bai, Haolei, et autres
Publié: (2025)

NoReGeo: Non-Reasoning Geometry Benchmark
par: Abdullaeva, Irina, et autres
Publié: (2026)

Quantization of Large Language Models with an Overdetermined Basis
par: Merkulov, Daniil, et autres
Publié: (2024)

SparseGrad: A Selective Method for Efficient Fine-tuning of MLP Layers
par: Chekalina, Viktoriia, et autres
Publié: (2024)

Dynamic Low-rank Approximation of Full-Matrix Preconditioner for Training Generalized Linear Models
par: Matveeva, Tatyana, et autres
Publié: (2025)

Dataless Weight Disentanglement in Task Arithmetic via Kronecker-Factored Approximate Curvature
par: Porrello, Angelo, et autres
Publié: (2026)

Fisher Mask Nodes for Language Model Merging
par: K, Thennal D, et autres
Publié: (2024)

The Approximate Fisher Influence Function: Faster Estimation of Data Influence in Statistical Models
par: Lev, Omri, et autres
Publié: (2024)

RTD-Lite: Scalable Topological Analysis for Comparing Weighted Graphs in Learning Tasks
par: Tulchinskii, Eduard, et autres
Publié: (2025)

Fisher Information-based Efficient Curriculum Federated Learning with Large Language Models
par: Liu, Ji, et autres
Publié: (2024)

Fisher Flow Matching for Generative Modeling over Discrete Data
par: Davis, Oscar, et autres
Publié: (2024)

Weighted Stochastic Differential Equation to Implement Wasserstein-Fisher-Rao Gradient Flow
par: Rahimi, Herlock
Publié: (2025)

Run LoRA Run: Faster and Lighter LoRA Implementations
par: Cherniuk, Daria, et autres
Publié: (2023)

AlignMerge - Alignment-Preserving Large Language Model Merging via Fisher-Guided Geometric Constraints
par: Roy, Aniruddha, et autres
Publié: (2025)

OmniFusion Technical Report
par: Goncharova, Elizaveta, et autres
Publié: (2024)

DipSVD: Dual-importance Protected SVD for Efficient LLM Compression
par: Ding, Xuan, et autres
Publié: (2025)

KFCPO: Kronecker-Factored Approximated Constrained Policy Optimization
par: Lim, Joonyoung, et autres
Publié: (2025)

Beyond Variance: Knowledge-Aware LLM Compression via Fisher-Aligned Subspace Diagnostics
par: Shihab, Ibne Farabi, et autres
Publié: (2026)

Rank-1 Approximation of Inverse Fisher for Natural Policy Gradients in Deep Reinforcement Learning
par: Huo, Yingxiao, et autres
Publié: (2026)

AA-SVD : Anchored and Adaptive SVD for Large Language Model Compression
par: Sinha, Atul Kumar, et autres
Publié: (2026)

FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation
par: Wu, Zhuguanyu, et autres
Publié: (2025)

Compressing Quantum Fisher Information
par: Tang, Rui Jie, et autres
Publié: (2026)

End-to-End Graph-Sequential Representation Learning for Accurate Recommendations
par: Baikalov, Vladimir, et autres
Publié: (2024)

Position-Aware Sequential Attention for Accurate Next Item Recommendations
par: Nabiev, Timur, et autres
Publié: (2026)

Intrinsic Structure as a Proxy for Saliency: SVD-Based Weight Preservation for Mixed-Precision Quantization in Large Language Models
par: Landge, Shashank, et autres
Publié: (2025)

On the Computation of the Fisher Information in Continual Learning
par: van de Ven, Gido M.
Publié: (2025)

Singular Value Decomposition on Kronecker Adaptation for Large Language Model
par: Chong, Yee Hin, et autres
Publié: (2025)

Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension
par: Gong, Wenbo, et autres
Publié: (2025)

Kronecker Factorization Improves Efficiency and Interpretability of Sparse Autoencoders
par: Kurochkin, Vadim, et autres
Publié: (2025)

Scalable Whole Slide Image Representation Using K-Mean Clustering and Fisher Vector Aggregation
par: Gupta, Ravi Kant, et autres
Publié: (2025)

Fishers for Free? Approximating the Fisher Information Matrix by Recycling the Squared Gradient Accumulator
par: Li, YuXin, et autres
Publié: (2025)

Fisher-Bingham-like normalizing flows on the sphere
par: Glüsenkamp, Thorsten
Publié: (2025)

Adaptive Variance-Penalized Continual Learning with Fisher Regularization
par: Sarkar, Krisanu
Publié: (2025)

Beyond the Mean: Fisher-Orthogonal Projection for Natural Gradient Descent in Large Batch Training
par: Lu, Yishun, et autres
Publié: (2025)