Enregistré dans:
| Auteurs principaux: | Postmus, Joris, Abreu, Steven |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2410.16314 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Mamba-PTQ: Outlier Channels in Recurrent Large Language Models
par: Pierro, Alessandro, et autres
Publié: (2024)
par: Pierro, Alessandro, et autres
Publié: (2024)
CODE-CL: Conceptor-Based Gradient Projection for Deep Continual Learning
par: Apolinario, Marco Paul E., et autres
Publié: (2024)
par: Apolinario, Marco Paul E., et autres
Publié: (2024)
Expanded Gating Ranges Improve Activation Functions
par: Huang, Allen Hao
Publié: (2024)
par: Huang, Allen Hao
Publié: (2024)
Neuromorphic Principles for Efficient Large Language Models on Intel Loihi 2
par: Abreu, Steven, et autres
Publié: (2025)
par: Abreu, Steven, et autres
Publié: (2025)
ActNAS : Generating Efficient YOLO Models using Activation NAS
par: Sah, Sudhakar, et autres
Publié: (2024)
par: Sah, Sudhakar, et autres
Publié: (2024)
Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity
par: Pierro, Alessandro, et autres
Publié: (2025)
par: Pierro, Alessandro, et autres
Publié: (2025)
Microscaling Floating Point Formats for Large Language Models
par: Cococcioni, Marco, et autres
Publié: (2025)
par: Cococcioni, Marco, et autres
Publié: (2025)
Controlling Recurrent Neural Networks by Conceptors
par: Jaeger, Herbert
Publié: (2014)
par: Jaeger, Herbert
Publié: (2014)
Q-S5: Towards Quantized State Space Models
par: Abreu, Steven, et autres
Publié: (2024)
par: Abreu, Steven, et autres
Publié: (2024)
Exploring the Improvement of Evolutionary Computation via Large Language Models
par: Cai, Jinyu, et autres
Publié: (2024)
par: Cai, Jinyu, et autres
Publié: (2024)
Adaptive Activation Functions for Predictive Modeling with Sparse Experimental Data
par: Pourkamali-Anaraki, Farhad, et autres
Publié: (2024)
par: Pourkamali-Anaraki, Farhad, et autres
Publié: (2024)
PAIR: A Novel Large Language Model-Guided Selection Strategy for Evolutionary Algorithms
par: Ali, Shady, et autres
Publié: (2025)
par: Ali, Shady, et autres
Publié: (2025)
Data-Driven Discovery of Interpretable Kalman Filter Variants through Large Language Models and Genetic Programming
par: Saketos, Vasileios, et autres
Publié: (2025)
par: Saketos, Vasileios, et autres
Publié: (2025)
Toward Preference-aligned Large Language Models via Residual-based Model Steering
par: La Cava, Lucio, et autres
Publié: (2025)
par: La Cava, Lucio, et autres
Publié: (2025)
Deriving Activation Functions Using Integration
par: Huang, Allen Hao, et autres
Publié: (2024)
par: Huang, Allen Hao, et autres
Publié: (2024)
MAEO: Multiobjective Animorphic Ensemble Optimization for Scalable Large-scale Engineering Applications
par: Erdem, Omer F., et autres
Publié: (2026)
par: Erdem, Omer F., et autres
Publié: (2026)
ReLU-KAN: New Kolmogorov-Arnold Networks that Only Need Matrix Addition, Dot Multiplication, and ReLU
par: Qiu, Qi, et autres
Publié: (2024)
par: Qiu, Qi, et autres
Publié: (2024)
LLaMEA-BO: A Large Language Model Evolutionary Algorithm for Automatically Generating Bayesian Optimization Algorithms
par: Li, Wenhu, et autres
Publié: (2025)
par: Li, Wenhu, et autres
Publié: (2025)
Topology-Aware Activation Functions in Neural Networks
par: Snopov, Pavel, et autres
Publié: (2025)
par: Snopov, Pavel, et autres
Publié: (2025)
Large Language Models for Tuning Evolution Strategies
par: Kramer, Oliver
Publié: (2024)
par: Kramer, Oliver
Publié: (2024)
Activation Functions for "A Feedforward Unitary Equivariant Neural Network"
par: Ma, Pui-Wai
Publié: (2024)
par: Ma, Pui-Wai
Publié: (2024)
APALU: A Trainable, Adaptive Activation Function for Deep Learning Networks
par: Subramanian, Barathi, et autres
Publié: (2024)
par: Subramanian, Barathi, et autres
Publié: (2024)
A More Accurate Approximation of Activation Function with Few Spikes Neurons
par: Jeong, Dayena, et autres
Publié: (2024)
par: Jeong, Dayena, et autres
Publié: (2024)
Linearly Constrained Weights: Reducing Activation Shift for Faster Training of Neural Networks
par: Kutsuna, Takuro
Publié: (2024)
par: Kutsuna, Takuro
Publié: (2024)
Large Language Models As Evolution Strategies
par: Lange, Robert Tjarko, et autres
Publié: (2024)
par: Lange, Robert Tjarko, et autres
Publié: (2024)
Learnable Activation Functions in Physics-Informed Neural Networks for Solving Partial Differential Equations
par: Farea, Afrah, et autres
Publié: (2024)
par: Farea, Afrah, et autres
Publié: (2024)
Evolving Multi-Channel Confidence-Aware Activation Functions for Missing Data with Channel Propagation
par: Sani, Naeem Shahabi, et autres
Publié: (2026)
par: Sani, Naeem Shahabi, et autres
Publié: (2026)
Symbolic Regression with Multimodal Large Language Models and Kolmogorov Arnold Networks
par: Harvey, Thomas R., et autres
Publié: (2025)
par: Harvey, Thomas R., et autres
Publié: (2025)
Discovering Continuous-Time Memory-Based Symbolic Policies using Genetic Programming
par: de Vries, Sigur, et autres
Publié: (2024)
par: de Vries, Sigur, et autres
Publié: (2024)
Zorro: A Flexible and Differentiable Parametric Family of Activation Functions That Extends ReLU and GELU
par: Roodschild, Matias, et autres
Publié: (2024)
par: Roodschild, Matias, et autres
Publié: (2024)
GRASP: GRouped Activation Shared Parameterization for Parameter-Efficient Fine-Tuning and Robust Inference of Transformers
par: Bal, Malyaban, et autres
Publié: (2025)
par: Bal, Malyaban, et autres
Publié: (2025)
Small Molecule Optimization with Large Language Models
par: Guevorguian, Philipp, et autres
Publié: (2024)
par: Guevorguian, Philipp, et autres
Publié: (2024)
Improved Forward-Forward Contrastive Learning
par: R, Gananath
Publié: (2024)
par: R, Gananath
Publié: (2024)
Improving Language Plasticity via Pretraining with Active Forgetting
par: Chen, Yihong, et autres
Publié: (2023)
par: Chen, Yihong, et autres
Publié: (2023)
Generative Design through Quality-Diversity Data Synthesis and Language Models
par: Gaier, Adam, et autres
Publié: (2024)
par: Gaier, Adam, et autres
Publié: (2024)
DGPO: RL-Steered Graph Diffusion for Neural Architecture Generation
par: Liuliakov, Aleksei, et autres
Publié: (2026)
par: Liuliakov, Aleksei, et autres
Publié: (2026)
Pruner-Zero: Evolving Symbolic Pruning Metric from scratch for Large Language Models
par: Dong, Peijie, et autres
Publié: (2024)
par: Dong, Peijie, et autres
Publié: (2024)
Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models
par: Majumdar, Somshubra, et autres
Publié: (2024)
par: Majumdar, Somshubra, et autres
Publié: (2024)
NNGPT: Rethinking AutoML with Large Language Models
par: Kochnev, Roman, et autres
Publié: (2025)
par: Kochnev, Roman, et autres
Publié: (2025)
Improved Robustness and Hyperparameter Selection in the Dense Associative Memory
par: McAlister, Hayden, et autres
Publié: (2024)
par: McAlister, Hayden, et autres
Publié: (2024)
Documents similaires
-
Mamba-PTQ: Outlier Channels in Recurrent Large Language Models
par: Pierro, Alessandro, et autres
Publié: (2024) -
CODE-CL: Conceptor-Based Gradient Projection for Deep Continual Learning
par: Apolinario, Marco Paul E., et autres
Publié: (2024) -
Expanded Gating Ranges Improve Activation Functions
par: Huang, Allen Hao
Publié: (2024) -
Neuromorphic Principles for Efficient Large Language Models on Intel Loihi 2
par: Abreu, Steven, et autres
Publié: (2025) -
ActNAS : Generating Efficient YOLO Models using Activation NAS
par: Sah, Sudhakar, et autres
Publié: (2024)