:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Author:	Badger, Benjamin L.
Format:	Preprint
Published:	2024
Subjects:	Computation and Language Machine Learning
Online Access:	https://arxiv.org/abs/2409.01482
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

Structured Recurrent Mixers for Massively Parallelized Sequence Generation
by: Badger, Benjamin L.
Published: (2026)

Toeplitz MLP Mixers are Low Complexity, Information-Rich Sequence Models
by: Badger, Benjamin L., et al.
Published: (2026)

Language Model Memory and Memory Models for Language
by: Badger, Benjamin L.
Published: (2026)

Know Your Limits: Entropy Estimation Modeling for Compression and Generalization
by: Badger, Benjamin L., et al.
Published: (2025)

Free Energy Mixer
by: Lu, Jiecheng, et al.
Published: (2026)

Cubit: Token Mixer with Kernel Ridge Regression
by: Zheng, Chuanyang, et al.
Published: (2026)

LLM-Mixer: Multiscale Mixing in LLMs for Time Series Forecasting
by: Kowsher, Md, et al.
Published: (2024)

Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines
by: Li, Yuchen, et al.
Published: (2024)

Faithfulness Measurable Masked Language Models
by: Madsen, Andreas, et al.
Published: (2023)

Representation Deficiency in Masked Language Modeling
by: Meng, Yu, et al.
Published: (2023)

Adaptive Guidance for Retrieval-Augmented Masked Diffusion Models
by: Kim, Jaemin, et al.
Published: (2026)

Contextual Text Denoising with Masked Language Models
by: Sun, Yifu, et al.
Published: (2019)

Scaling Beyond Masked Diffusion Language Models
by: Sahoo, Subham Sekhar, et al.
Published: (2026)

Unlocking the Potentials of Retrieval-Augmented Generation for Diffusion Language Models
by: Yu, Chuanyue, et al.
Published: (2026)

Generating Synthetic Free-text Medical Records with Low Re-identification Risk using Masked Language Modeling
by: Belkadi, Samuel, et al.
Published: (2024)

Towards Probabilistically-Sound Beam Search with Masked Language Models
by: Brooks, Creston, et al.
Published: (2024)

Diffusion-State Policy Optimization for Masked Diffusion Language Models
by: Oba, Daisuke, et al.
Published: (2026)

DOS: Dependency-Oriented Sampler for Masked Diffusion Language Models
by: Zhou, Xueyu, et al.
Published: (2026)

Reconsidering Positional Supervision in Masked Diffusion Language Model Training
by: Ye, Mengyu, et al.
Published: (2026)

Retrieval-Reasoning Large Language Model-based Synthetic Clinical Trial Generation
by: Xu, Zerui, et al.
Published: (2024)

Phantom: General Backdoor Attacks on Retrieval Augmented Language Generation
by: Chaudhari, Harsh, et al.
Published: (2024)

Soft-Masked Diffusion Language Models
by: Hersche, Michael, et al.
Published: (2025)

Robust Infidelity: When Faithfulness Measures on Masked Language Models Are Misleading
by: Crothers, Evan, et al.
Published: (2023)

ExLM: Rethinking the Impact of [MASK] Tokens in Masked Language Models
by: Zheng, Kangjie, et al.
Published: (2025)

Iterative Mask Filling: An Effective Text Augmentation Method Using Masked Language Modeling
by: Kesgin, Himmet Toprak, et al.
Published: (2024)

Parallelism and Generation Order in Masked Diffusion Language Models: Limits Today, Potential Tomorrow
by: Zhong, Yangyang, et al.
Published: (2026)

Masked Language Modeling Becomes Conditional Density Estimation for Tabular Data Synthesis
by: An, Seunghwan, et al.
Published: (2024)

Tree Reward-Aligned Search for TReASURe in Masked Diffusion Language Models
by: Yu, Zichao, et al.
Published: (2025)

Fisher Mask Nodes for Language Model Merging
by: K, Thennal D, et al.
Published: (2024)

Simple and Effective Masked Diffusion Language Models
by: Sahoo, Subham Sekhar, et al.
Published: (2024)

On the Reasoning Abilities of Masked Diffusion Language Models
by: Svete, Anej, et al.
Published: (2025)

DisGeM: Distractor Generation for Multiple Choice Questions with Span Masking
by: Cavusoglu, Devrim, et al.
Published: (2024)

Causal Graph Discovery with Retrieval-Augmented Generation based Large Language Models
by: Zhang, Yuzhe, et al.
Published: (2024)

Not All Denoising Steps Are Equal: Model Scheduling for Faster Masked Diffusion Language Models
by: Sedykh, Ivan, et al.
Published: (2026)

Promptriever: Instruction-Trained Retrievers Can Be Prompted Like Language Models
by: Weller, Orion, et al.
Published: (2024)

Centered Masking for Language-Image Pre-Training
by: Liang, Mingliang, et al.
Published: (2024)

Understanding and Accelerating the Training of Masked Diffusion Language Models
by: Hong, Chunsan, et al.
Published: (2026)

Boosting Large Language Models with Mask Fine-Tuning
by: Zhang, Mingyuan, et al.
Published: (2025)

Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models
by: Chen, Changyu, et al.
Published: (2024)

BitFit: Simple Parameter-efficient Fine-tuning for Transformer-based Masked Language-models
by: Ben-Zaken, Elad, et al.
Published: (2021)