Gespeichert in:
| Hauptverfasser: | Zhao, Xinyu, Karagodin, Nikita, Hassani, Hamed, Hersek, Sinan, Liang, Paul Pu, Polyanskiy, Yury |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2605.06870 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Clustering in Causal Attention Masking
von: Karagodin, Nikita, et al.
Veröffentlicht: (2024)
von: Karagodin, Nikita, et al.
Veröffentlicht: (2024)
Normalization in Attention Dynamics
von: Karagodin, Nikita, et al.
Veröffentlicht: (2025)
von: Karagodin, Nikita, et al.
Veröffentlicht: (2025)
SoundSculpt: Direction and Semantics Driven Ambisonic Target Sound Extraction
von: Chen, Tuochao, et al.
Veröffentlicht: (2025)
von: Chen, Tuochao, et al.
Veröffentlicht: (2025)
Information-theoretic Generalization Analysis for VQ-VAEs: A Role of Latent Variables
von: Futami, Futoshi, et al.
Veröffentlicht: (2025)
von: Futami, Futoshi, et al.
Veröffentlicht: (2025)
The Sample Complexity of Approximate Rejection Sampling with Applications to Smoothed Online Learning
von: Block, Adam, et al.
Veröffentlicht: (2023)
von: Block, Adam, et al.
Veröffentlicht: (2023)
High-Rate Quantized Matrix Multiplication II
von: Ordentlich, Or, et al.
Veröffentlicht: (2026)
von: Ordentlich, Or, et al.
Veröffentlicht: (2026)
Is Dimensionality a Barrier for Retrieval Models?
von: Bangachev, Kiril, et al.
Veröffentlicht: (2026)
von: Bangachev, Kiril, et al.
Veröffentlicht: (2026)
Optimal Quantization for Matrix Multiplication
von: Ordentlich, Or, et al.
Veröffentlicht: (2024)
von: Ordentlich, Or, et al.
Veröffentlicht: (2024)
Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
von: Polyanskiy, Yury, et al.
Veröffentlicht: (2025)
von: Polyanskiy, Yury, et al.
Veröffentlicht: (2025)
Mutual Information Collapse Explains Disentanglement Failure in $β$-VAEs
von: Vu, Minh, et al.
Veröffentlicht: (2026)
von: Vu, Minh, et al.
Veröffentlicht: (2026)
Price of universality in vector quantization is at most 0.11 bit
von: Harbuzova, Alina, et al.
Veröffentlicht: (2026)
von: Harbuzova, Alina, et al.
Veröffentlicht: (2026)
Solving Empirical Bayes via Transformers
von: Teh, Anzo, et al.
Veröffentlicht: (2025)
von: Teh, Anzo, et al.
Veröffentlicht: (2025)
A Testable Certificate for Constant Collapse in Teacher-Guided VAEs
von: Zhang, Zegu, et al.
Veröffentlicht: (2026)
von: Zhang, Zegu, et al.
Veröffentlicht: (2026)
Representation Alignment Rests on Linear Structure
von: Bangachev, Kiril, et al.
Veröffentlicht: (2026)
von: Bangachev, Kiril, et al.
Veröffentlicht: (2026)
On the Minimax Regret of Sequential Probability Assignment via Square-Root Entropy
von: Jia, Zeyu, et al.
Veröffentlicht: (2025)
von: Jia, Zeyu, et al.
Veröffentlicht: (2025)
A Gapped Scale-Sensitive Dimension and Lower Bounds for Offset Rademacher Complexity
von: Jia, Zeyu, et al.
Veröffentlicht: (2025)
von: Jia, Zeyu, et al.
Veröffentlicht: (2025)
Feature Learning in Linear-Width Two-Layer Networks: Two vs. One Step of Gradient Descent
von: Moniri, Behrad, et al.
Veröffentlicht: (2026)
von: Moniri, Behrad, et al.
Veröffentlicht: (2026)
On the Mechanisms of Weak-to-Strong Generalization: A Theoretical Perspective
von: Moniri, Behrad, et al.
Veröffentlicht: (2025)
von: Moniri, Behrad, et al.
Veröffentlicht: (2025)
YuriiFormer: A Suite of Nesterov-Accelerated Transformers
von: Zimin, Aleksandr, et al.
Veröffentlicht: (2026)
von: Zimin, Aleksandr, et al.
Veröffentlicht: (2026)
SoftVQ-VAE: Efficient 1-Dimensional Continuous Tokenizer
von: Chen, Hao, et al.
Veröffentlicht: (2024)
von: Chen, Hao, et al.
Veröffentlicht: (2024)
WaterSIC: information-theoretically (near) optimal linear layer quantization
von: Lifar, Egor, et al.
Veröffentlicht: (2026)
von: Lifar, Egor, et al.
Veröffentlicht: (2026)
Improved Variational Inference in Discrete VAEs using Error Correcting Codes
von: Martínez-García, María, et al.
Veröffentlicht: (2024)
von: Martínez-García, María, et al.
Veröffentlicht: (2024)
The curse of overparametrization in adversarial training: Precise analysis of robust generalization for random features regression
von: Hassani, Hamed, et al.
Veröffentlicht: (2022)
von: Hassani, Hamed, et al.
Veröffentlicht: (2022)
Asymptotics of Linear Regression with Linearly Dependent Data
von: Moniri, Behrad, et al.
Veröffentlicht: (2024)
von: Moniri, Behrad, et al.
Veröffentlicht: (2024)
Universal priors: solving empirical Bayes via Bayesian inference and pretraining
von: Cannella, Nick, et al.
Veröffentlicht: (2026)
von: Cannella, Nick, et al.
Veröffentlicht: (2026)
Toward Architecture-Agnostic Local Control of Posterior Collapse in VAEs
von: Song, Hyunsoo, et al.
Veröffentlicht: (2025)
von: Song, Hyunsoo, et al.
Veröffentlicht: (2025)
Arch-VQ: Discrete Architecture Representation Learning with Autoregressive Priors
von: Poddenige, Deshani Geethika, et al.
Veröffentlicht: (2025)
von: Poddenige, Deshani Geethika, et al.
Veröffentlicht: (2025)
Synchronization of mean-field models on the circle
von: Polyanskiy, Yury, et al.
Veröffentlicht: (2025)
von: Polyanskiy, Yury, et al.
Veröffentlicht: (2025)
NestQuant: Nested Lattice Quantization for Matrix Products and LLMs
von: Savkin, Semyon, et al.
Veröffentlicht: (2025)
von: Savkin, Semyon, et al.
Veröffentlicht: (2025)
Signal-Plus-Noise Decomposition of Nonlinear Spiked Random Matrix Models
von: Moniri, Behrad, et al.
Veröffentlicht: (2024)
von: Moniri, Behrad, et al.
Veröffentlicht: (2024)
Conformal Inference under High-Dimensional Covariate Shifts via Likelihood-Ratio Regularization
von: Joshi, Sunay, et al.
Veröffentlicht: (2025)
von: Joshi, Sunay, et al.
Veröffentlicht: (2025)
Deep Incomplete Multi-view Learning via Cyclic Permutation of VAEs
von: Gao, Xin, et al.
Veröffentlicht: (2025)
von: Gao, Xin, et al.
Veröffentlicht: (2025)
The emergence of clusters in self-attention dynamics
von: Geshkovski, Borjan, et al.
Veröffentlicht: (2023)
von: Geshkovski, Borjan, et al.
Veröffentlicht: (2023)
Global Minimizers of Sigmoid Contrastive Loss
von: Bangachev, Kiril, et al.
Veröffentlicht: (2025)
von: Bangachev, Kiril, et al.
Veröffentlicht: (2025)
Atoms as Language: VQ-Atom: Semantic Discretization for Molecular Representation Learning
von: Kimura, Takayuki
Veröffentlicht: (2026)
von: Kimura, Takayuki
Veröffentlicht: (2026)
High-dimensional Asymptotics of VAEs: Threshold of Posterior Collapse and Dataset-Size Dependence of Rate-Distortion Curve
von: Ichikawa, Yuma, et al.
Veröffentlicht: (2023)
von: Ichikawa, Yuma, et al.
Veröffentlicht: (2023)
Watermark Smoothing Attacks against Language Models
von: Chang, Hongyan, et al.
Veröffentlicht: (2024)
von: Chang, Hongyan, et al.
Veröffentlicht: (2024)
Generative Modeling of Regular and Irregular Time Series Data via Koopman VAEs
von: Naiman, Ilan, et al.
Veröffentlicht: (2023)
von: Naiman, Ilan, et al.
Veröffentlicht: (2023)
Improving the Generation of VAEs with High Dimensional Latent Spaces by the use of Hyperspherical Coordinates
von: Ascarate, Alejandro, et al.
Veröffentlicht: (2025)
von: Ascarate, Alejandro, et al.
Veröffentlicht: (2025)
Measure-to-measure Regression with Transformers
von: Vandergrift, Matthew, et al.
Veröffentlicht: (2026)
von: Vandergrift, Matthew, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
Clustering in Causal Attention Masking
von: Karagodin, Nikita, et al.
Veröffentlicht: (2024) -
Normalization in Attention Dynamics
von: Karagodin, Nikita, et al.
Veröffentlicht: (2025) -
SoundSculpt: Direction and Semantics Driven Ambisonic Target Sound Extraction
von: Chen, Tuochao, et al.
Veröffentlicht: (2025) -
Information-theoretic Generalization Analysis for VQ-VAEs: A Role of Latent Variables
von: Futami, Futoshi, et al.
Veröffentlicht: (2025) -
The Sample Complexity of Approximate Rejection Sampling with Applications to Smoothed Online Learning
von: Block, Adam, et al.
Veröffentlicht: (2023)