Gespeichert in:
| Hauptverfasser: | Arora, Simran, Timalsina, Aman, Singhal, Aaryan, Spector, Benjamin, Eyuboglu, Sabri, Zhao, Xinyi, Rao, Ashish, Rudra, Atri, Ré, Christopher |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2407.05483 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Simple linear attention language models balance the recall-throughput tradeoff
von: Arora, Simran, et al.
Veröffentlicht: (2024)
von: Arora, Simran, et al.
Veröffentlicht: (2024)
ThunderKittens: Simple, Fast, and Adorable AI Kernels
von: Spector, Benjamin F., et al.
Veröffentlicht: (2024)
von: Spector, Benjamin F., et al.
Veröffentlicht: (2024)
Towards Learning High-Precision Least Squares Algorithms with Sequence Models
von: Liu, Jerry, et al.
Veröffentlicht: (2025)
von: Liu, Jerry, et al.
Veröffentlicht: (2025)
LoLCATs: On Low-Rank Linearizing of Large Language Models
von: Zhang, Michael, et al.
Veröffentlicht: (2024)
von: Zhang, Michael, et al.
Veröffentlicht: (2024)
Cartridges: Lightweight and general-purpose long context representations via self-study
von: Eyuboglu, Sabri, et al.
Veröffentlicht: (2025)
von: Eyuboglu, Sabri, et al.
Veröffentlicht: (2025)
Language Models Enable Simple Systems for Generating Structured Views of Heterogeneous Data Lakes
von: Arora, Simran, et al.
Veröffentlicht: (2023)
von: Arora, Simran, et al.
Veröffentlicht: (2023)
ParallelKittens: Systematic and Practical Simplification of Multi-GPU AI Kernels
von: Sul, Stuart H., et al.
Veröffentlicht: (2025)
von: Sul, Stuart H., et al.
Veröffentlicht: (2025)
Constructing Efficient Fact-Storing MLPs for Transformers
von: Dugan, Owen, et al.
Veröffentlicht: (2025)
von: Dugan, Owen, et al.
Veröffentlicht: (2025)
Minions: Cost-efficient Collaboration Between On-device and Cloud Language Models
von: Narayan, Avanika, et al.
Veröffentlicht: (2025)
von: Narayan, Avanika, et al.
Veröffentlicht: (2025)
Explaining vague language
von: Égré, Paul, et al.
Veröffentlicht: (2024)
von: Égré, Paul, et al.
Veröffentlicht: (2024)
Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT
von: Saad-Falcon, Jon, et al.
Veröffentlicht: (2024)
von: Saad-Falcon, Jon, et al.
Veröffentlicht: (2024)
Counting Clinical Trials: New Evidence on Pharmaceutical Sector Productivity
von: Durvasula, Maya M., et al.
Veröffentlicht: (2024)
von: Durvasula, Maya M., et al.
Veröffentlicht: (2024)
Adaptive Rank Allocation: Speeding Up Modern Transformers with RaNA Adapters
von: Garcia, Roberto, et al.
Veröffentlicht: (2025)
von: Garcia, Roberto, et al.
Veröffentlicht: (2025)
Late Time Acceleration with Observational Constraints in Modified Theories of Gravity
von: Arora, Simran
Veröffentlicht: (2023)
von: Arora, Simran
Veröffentlicht: (2023)
Revisiting associative recall in modern recurrent models
von: Okpekpe, Destiny, et al.
Veröffentlicht: (2025)
von: Okpekpe, Destiny, et al.
Veröffentlicht: (2025)
The unregulated plant‐based ‘milk’ industry: A threat to nutrition, health and safety?
von: Simran Kaur Arora
Veröffentlicht: (2024)
von: Simran Kaur Arora
Veröffentlicht: (2024)
BWLer: Barycentric Weight Layer Elucidates a Precision-Conditioning Tradeoff for PINNs
von: Liu, Jerry, et al.
Veröffentlicht: (2025)
von: Liu, Jerry, et al.
Veröffentlicht: (2025)
KernelBench: Can LLMs Write Efficient GPU Kernels?
von: Ouyang, Anne, et al.
Veröffentlicht: (2025)
von: Ouyang, Anne, et al.
Veröffentlicht: (2025)
Bayesian and Machine-Learning Analyses of Nonminimal $f(Q)$ Gravity and $H_0$ Tension
von: Arora, Simran, et al.
Veröffentlicht: (2025)
von: Arora, Simran, et al.
Veröffentlicht: (2025)
Towards Testable Type-III Leptogenesis in Non-Standard Early Universe Scenarios
von: Arora, Simran, et al.
Veröffentlicht: (2026)
von: Arora, Simran, et al.
Veröffentlicht: (2026)
Interacting bosonic dark energy and fermionic dark matter in Einstein scalar Gauss-Bonnet gravity
von: Arora, Simran, et al.
Veröffentlicht: (2025)
von: Arora, Simran, et al.
Veröffentlicht: (2025)
Revisiting kink-like parametrization and constraints using OHD/Pantheon+/BAO samples
von: Arora, Simran, et al.
Veröffentlicht: (2023)
von: Arora, Simran, et al.
Veröffentlicht: (2023)
A sparse resolution of the DiPerna-Majda gap problem for $2$D Euler equations
von: Domínguez, Oscar, et al.
Veröffentlicht: (2024)
von: Domínguez, Oscar, et al.
Veröffentlicht: (2024)
Time Slip as a Perceptual Construct: A Scientific and Probabilistic Analysis Rejecting Temporal Reversal
von: maan, Aaryan
Veröffentlicht: (2026)
von: maan, Aaryan
Veröffentlicht: (2026)
Teleportation Limits: A Unified Quantum-Classical and Consciousness-Based Framework for Physical and Identity Constraints
von: maan, Aaryan
Veröffentlicht: (2026)
von: maan, Aaryan
Veröffentlicht: (2026)
Temporal Recurrence of Pandemics: A 101-Year Cycle Hypothesis
von: Aaryan khan
Veröffentlicht: (2025)
von: Aaryan khan
Veröffentlicht: (2025)
KinetiDiff: Docking-Guided Diffusion for De Novo ACVR1 Inhibitor Design in Fibrodysplasia Ossificans Progressiva
von: Patel, Aaryan
Veröffentlicht: (2026)
von: Patel, Aaryan
Veröffentlicht: (2026)
HipKittens: Fast and Furious AMD Kernels
von: Hu, William, et al.
Veröffentlicht: (2025)
von: Hu, William, et al.
Veröffentlicht: (2025)
How Does RL Post-training Induce Skill Composition? A Case Study on Countdown
von: Park, Simon, et al.
Veröffentlicht: (2025)
von: Park, Simon, et al.
Veröffentlicht: (2025)
Embedding Generalized CP Symmetry in One Zero Texture Neutrino Mass Models
von: Priya, et al.
Veröffentlicht: (2025)
von: Priya, et al.
Veröffentlicht: (2025)
Constraining Spatial Curvature with Priors from Swampland Conjectures
von: Arora, Simran, et al.
Veröffentlicht: (2026)
von: Arora, Simran, et al.
Veröffentlicht: (2026)
Evaluation of mechanical, permeation, and degradation properties of poly(hydroxybutyrate) blends for sustainable packaging
von: Simran Ahuja, et al.
Veröffentlicht: (2024)
von: Simran Ahuja, et al.
Veröffentlicht: (2024)
The eV-Scale Sterile Neutrino and Neutrinoless Double Beta Decay
von: Priya, et al.
Veröffentlicht: (2026)
von: Priya, et al.
Veröffentlicht: (2026)
Optimistic Verifiable Training by Controlling Hardware Nondeterminism
von: Srivastava, Megha, et al.
Veröffentlicht: (2024)
von: Srivastava, Megha, et al.
Veröffentlicht: (2024)
Breaking and making genes: the genesis of novel traits in plants
von: Fiza Hamid, et al.
Veröffentlicht: (2025)
von: Fiza Hamid, et al.
Veröffentlicht: (2025)
Just rephrase it! Uncertainty estimation in closed-source language models via multiple rephrased queries
von: Yang, Adam, et al.
Veröffentlicht: (2024)
von: Yang, Adam, et al.
Veröffentlicht: (2024)
Democracy and Financial Development: Drivers or Detractors of Environmental Sustainability in G20 Countries
von: Kemal Eyuboglu, et al.
Veröffentlicht: (2025)
von: Kemal Eyuboglu, et al.
Veröffentlicht: (2025)
Democracies use more renewable energy
von: Umut Uzar, et al.
Veröffentlicht: (2024)
von: Umut Uzar, et al.
Veröffentlicht: (2024)
Real-time Control of Electric Autonomous Mobility-on-Demand Systems via Graph Reinforcement Learning
von: Singhal, Aaryan, et al.
Veröffentlicht: (2023)
von: Singhal, Aaryan, et al.
Veröffentlicht: (2023)
Interacting Models of Dark Energy and Dark Matter in Einstein scalar Gauss Bonnet Gravity
von: Hussain, Saddam, et al.
Veröffentlicht: (2024)
von: Hussain, Saddam, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Simple linear attention language models balance the recall-throughput tradeoff
von: Arora, Simran, et al.
Veröffentlicht: (2024) -
ThunderKittens: Simple, Fast, and Adorable AI Kernels
von: Spector, Benjamin F., et al.
Veröffentlicht: (2024) -
Towards Learning High-Precision Least Squares Algorithms with Sequence Models
von: Liu, Jerry, et al.
Veröffentlicht: (2025) -
LoLCATs: On Low-Rank Linearizing of Large Language Models
von: Zhang, Michael, et al.
Veröffentlicht: (2024) -
Cartridges: Lightweight and general-purpose long context representations via self-study
von: Eyuboglu, Sabri, et al.
Veröffentlicht: (2025)