Gespeichert in:
| Hauptverfasser: | Redman, William T., Wang, Zhangyang, Ingrosso, Alessandro, Goldt, Sebastian |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2412.06545 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Why Neural Network Can Discover Symbolic Structures with Gradient-based Training: An Algebraic and Geometric Foundation for Neurosymbolic Reasoning
von: Wang, Peihao, et al.
Veröffentlicht: (2025)
von: Wang, Peihao, et al.
Veröffentlicht: (2025)
Insights into the Lottery Ticket Hypothesis and Iterative Magnitude Pruning
von: Saleem, Tausifa Jan, et al.
Veröffentlicht: (2024)
von: Saleem, Tausifa Jan, et al.
Veröffentlicht: (2024)
Sparse Weight Averaging with Multiple Particles for Iterative Magnitude Pruning
von: Choi, Moonseok, et al.
Veröffentlicht: (2023)
von: Choi, Moonseok, et al.
Veröffentlicht: (2023)
Is Complexity Required for Neural Network Pruning? A Case Study on Global Magnitude Pruning
von: Gupta, Manas, et al.
Veröffentlicht: (2022)
von: Gupta, Manas, et al.
Veröffentlicht: (2022)
Sliding down the stairs: how correlated latent variables accelerate learning with neural networks
von: Bardone, Lorenzo, et al.
Veröffentlicht: (2024)
von: Bardone, Lorenzo, et al.
Veröffentlicht: (2024)
Improving the Effective Receptive Field of Message-Passing Neural Networks
von: Finder, Shahaf E., et al.
Veröffentlicht: (2025)
von: Finder, Shahaf E., et al.
Veröffentlicht: (2025)
Two failure modes of deep transformers and how to avoid them: a unified theory of signal propagation at initialisation
von: Giorlandino, Alessio, et al.
Veröffentlicht: (2025)
von: Giorlandino, Alessio, et al.
Veröffentlicht: (2025)
Generalization Dynamics of Linear Diffusion Models
von: Merger, Claudia, et al.
Veröffentlicht: (2025)
von: Merger, Claudia, et al.
Veröffentlicht: (2025)
Memorisation, convergence and generalisation in generative models
von: Maillard, Antoine, et al.
Veröffentlicht: (2026)
von: Maillard, Antoine, et al.
Veröffentlicht: (2026)
FedMap: Iterative Magnitude-Based Pruning for Communication-Efficient Federated Learning
von: Herzog, Alexander, et al.
Veröffentlicht: (2024)
von: Herzog, Alexander, et al.
Veröffentlicht: (2024)
Spiking Layer-Adaptive Magnitude-based Pruning
von: Wang, Junqiao, et al.
Veröffentlicht: (2026)
von: Wang, Junqiao, et al.
Veröffentlicht: (2026)
Advancing IIoT with Over-the-Air Federated Learning: The Role of Iterative Magnitude Pruning
von: Khan, Fazal Muhammad Ali, et al.
Veröffentlicht: (2024)
von: Khan, Fazal Muhammad Ali, et al.
Veröffentlicht: (2024)
Mapping of attention mechanisms to a generalized Potts model
von: Rende, Riccardo, et al.
Veröffentlicht: (2023)
von: Rende, Riccardo, et al.
Veröffentlicht: (2023)
ICE-Pruning: An Iterative Cost-Efficient Pruning Pipeline for Deep Neural Networks
von: Hu, Wenhao, et al.
Veröffentlicht: (2025)
von: Hu, Wenhao, et al.
Veröffentlicht: (2025)
Factual recall in linear associative memories: sharp asymptotics and mechanistic insights
von: Giorlandino, Alessio, et al.
Veröffentlicht: (2026)
von: Giorlandino, Alessio, et al.
Veröffentlicht: (2026)
A Fourier perspective on the learning dynamics of neural networks: from sample complexities to mechanistic insights
von: Ricci, Fabiola, et al.
Veröffentlicht: (2026)
von: Ricci, Fabiola, et al.
Veröffentlicht: (2026)
Feature learning from non-Gaussian inputs: the case of Independent Component Analysis in high dimensions
von: Ricci, Fabiola, et al.
Veröffentlicht: (2025)
von: Ricci, Fabiola, et al.
Veröffentlicht: (2025)
Learning from higher-order statistics, efficiently: hypothesis tests, random features, and neural networks
von: Székely, Eszter, et al.
Veröffentlicht: (2023)
von: Székely, Eszter, et al.
Veröffentlicht: (2023)
IPPRO: Importance-based Pruning with PRojective Offset for Magnitude-indifferent Structural Pruning
von: Jung, Jaeheun, et al.
Veröffentlicht: (2025)
von: Jung, Jaeheun, et al.
Veröffentlicht: (2025)
LoopBench: Discovering Emergent Symmetry Breaking Strategies with LLM Swarms
von: Parsaee, Ali, et al.
Veröffentlicht: (2025)
von: Parsaee, Ali, et al.
Veröffentlicht: (2025)
From Weight Perturbation to Feature Attribution for Explaining Fully Connected Neural Networks
von: Lymperopoulos, Thodoris, et al.
Veröffentlicht: (2026)
von: Lymperopoulos, Thodoris, et al.
Veröffentlicht: (2026)
Magnitude-based Neuron Pruning for Backdoor Defens
von: Li, Nan, et al.
Veröffentlicht: (2024)
von: Li, Nan, et al.
Veröffentlicht: (2024)
Matrix Completion via Nonsmooth Regularization of Fully Connected Neural Networks
von: Faramarzi, Sajad, et al.
Veröffentlicht: (2024)
von: Faramarzi, Sajad, et al.
Veröffentlicht: (2024)
AlphaPruning: Using Heavy-Tailed Self Regularization Theory for Improved Layer-wise Pruning of Large Language Models
von: Lu, Haiquan, et al.
Veröffentlicht: (2024)
von: Lu, Haiquan, et al.
Veröffentlicht: (2024)
New Approximation Results and Optimal Estimation for Fully Connected Deep Neural Networks
von: Tang, Zhaoji
Veröffentlicht: (2025)
von: Tang, Zhaoji
Veröffentlicht: (2025)
Combining Relevance and Magnitude for Resource-Aware DNN Pruning
von: Chiasserini, Carla Fabiana, et al.
Veröffentlicht: (2024)
von: Chiasserini, Carla Fabiana, et al.
Veröffentlicht: (2024)
RAPNet: A Receptive-Field Adaptive Convolutional Neural Network for Pansharpening
von: Tang, Tao, et al.
Veröffentlicht: (2025)
von: Tang, Tao, et al.
Veröffentlicht: (2025)
Depth Degeneracy in Neural Networks: Vanishing Angles in Fully Connected ReLU Networks on Initialization
von: Jakub, Cameron, et al.
Veröffentlicht: (2023)
von: Jakub, Cameron, et al.
Veröffentlicht: (2023)
Shortcut Solutions Learned by Transformers Impair Continual Compositional Reasoning
von: Redman, William T., et al.
Veröffentlicht: (2026)
von: Redman, William T., et al.
Veröffentlicht: (2026)
Iterative Inference in a Chess-Playing Neural Network
von: Sandmann, Elias, et al.
Veröffentlicht: (2025)
von: Sandmann, Elias, et al.
Veröffentlicht: (2025)
Magnitude Pruning of Large Pretrained Transformer Models with a Mixture Gaussian Prior
von: Zhang, Mingxuan, et al.
Veröffentlicht: (2024)
von: Zhang, Mingxuan, et al.
Veröffentlicht: (2024)
The RL Perceptron: Generalisation Dynamics of Policy Learning in High Dimensions
von: Patel, Nishil, et al.
Veröffentlicht: (2023)
von: Patel, Nishil, et al.
Veröffentlicht: (2023)
Training Fully Connected Neural Networks is $\exists\mathbb{R}$-Complete
von: Bertschinger, Daniel, et al.
Veröffentlicht: (2022)
von: Bertschinger, Daniel, et al.
Veröffentlicht: (2022)
Synthesizing real-world distributions from high-dimensional Gaussian Noise with Fully Connected Neural Network
von: Komorniczak, Joanna
Veröffentlicht: (2026)
von: Komorniczak, Joanna
Veröffentlicht: (2026)
Neural Networks with Sparse Activation Induced by Large Bias: Tighter Analysis with Bias-Generalized NTK
von: Yang, Hongru, et al.
Veröffentlicht: (2023)
von: Yang, Hongru, et al.
Veröffentlicht: (2023)
Spectral Pruning for Recurrent Neural Networks
von: Furuya, Takashi, et al.
Veröffentlicht: (2021)
von: Furuya, Takashi, et al.
Veröffentlicht: (2021)
Connecting Parameter Magnitudes and Hessian Eigenspaces at Scale using Sketched Methods
von: Fernandez, Andres, et al.
Veröffentlicht: (2025)
von: Fernandez, Andres, et al.
Veröffentlicht: (2025)
The impact of memory on learning sequence-to-sequence tasks
von: Seif, Alireza, et al.
Veröffentlicht: (2022)
von: Seif, Alireza, et al.
Veröffentlicht: (2022)
Junk DNA Hypothesis: Pruning Small Pre-Trained Weights Irreversibly and Monotonically Impairs "Difficult" Downstream Tasks in LLMs
von: Yin, Lu, et al.
Veröffentlicht: (2023)
von: Yin, Lu, et al.
Veröffentlicht: (2023)
Learning to Discover Iterative Spectral Algorithms
von: Liu, Zihang, et al.
Veröffentlicht: (2026)
von: Liu, Zihang, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
Why Neural Network Can Discover Symbolic Structures with Gradient-based Training: An Algebraic and Geometric Foundation for Neurosymbolic Reasoning
von: Wang, Peihao, et al.
Veröffentlicht: (2025) -
Insights into the Lottery Ticket Hypothesis and Iterative Magnitude Pruning
von: Saleem, Tausifa Jan, et al.
Veröffentlicht: (2024) -
Sparse Weight Averaging with Multiple Particles for Iterative Magnitude Pruning
von: Choi, Moonseok, et al.
Veröffentlicht: (2023) -
Is Complexity Required for Neural Network Pruning? A Case Study on Global Magnitude Pruning
von: Gupta, Manas, et al.
Veröffentlicht: (2022) -
Sliding down the stairs: how correlated latent variables accelerate learning with neural networks
von: Bardone, Lorenzo, et al.
Veröffentlicht: (2024)