:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Chang, Tyler A., Bergen, Benjamin K.
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Computation and Language
Online-Zugang:	https://arxiv.org/abs/2504.15471
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Explaining and Mitigating Crosslingual Tokenizer Inequities
von: Arnett, Catherine, et al.
Veröffentlicht: (2025)

Characterizing Learning Curves During Language Model Pre-Training: Learning, Forgetting, and Stability
von: Chang, Tyler A., et al.
Veröffentlicht: (2023)

Goldfish: Monolingual Language Models for 350 Languages
von: Chang, Tyler A., et al.
Veröffentlicht: (2024)

A Bit of a Problem: Measurement Disparities in Dataset Sizes Across Languages
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)

On the Acquisition of Shared Grammatical Representations in Bilingual Language Models
von: Arnett, Catherine, et al.
Veröffentlicht: (2025)

Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers
von: Jang, Eugene, et al.
Veröffentlicht: (2024)

Revenge of the Fallen? Recurrent Models Match Transformers at Predicting Human Language Comprehension Metrics
von: Michaelov, James A., et al.
Veröffentlicht: (2024)

Learning and Transferring Sparse Contextual Bigrams with Linear Transformers
von: Ren, Yunwei, et al.
Veröffentlicht: (2024)

Large Language Models Pass the Turing Test
von: Jones, Cameron R., et al.
Veröffentlicht: (2025)

Do Large Language Models Exhibit Spontaneous Rational Deception?
von: Taylor, Samuel M., et al.
Veröffentlicht: (2025)

BLooP: Zero-Shot Abstractive Summarization using Large Language Models with Bigram Lookahead Promotion
von: Iyer, Varun, et al.
Veröffentlicht: (2026)

Language Detection by Means of the Minkowski Norm: Identification Through Character Bigrams and Frequency Analysis
von: Pogăcean, Paul-Andrei, et al.
Veröffentlicht: (2025)

Language Model Behavioral Phases are Consistent Across Architecture, Training Data, and Scale
von: Michaelov, James A., et al.
Veröffentlicht: (2025)

Sparse Subnetwork Enhancement for Underrepresented Languages in Large Language Models
von: Gurgurov, Daniil, et al.
Veröffentlicht: (2025)

Evolving Subnetwork Training for Large Language Models
von: Li, Hanqi, et al.
Veröffentlicht: (2024)

Lies, Damned Lies, and Distributional Language Statistics: Persuasion and Deception with Large Language Models
von: Jones, Cameron R., et al.
Veröffentlicht: (2024)

Bolmo: Byteifying the Next Generation of Language Models
von: Minixhofer, Benjamin, et al.
Veröffentlicht: (2025)

Your Language Model Secretly Contains Personality Subnetworks
von: Ye, Ruimeng, et al.
Veröffentlicht: (2026)

Emergent inabilities? Inverse scaling over the course of pretraining
von: Michaelov, James A., et al.
Veröffentlicht: (2023)

Why do language models perform worse for morphologically complex languages?
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)

The Heuristic Core: Understanding Subnetwork Generalization in Pretrained Language Models
von: Bhaskar, Adithya, et al.
Veröffentlicht: (2024)

Discovering Knowledge-Critical Subnetworks in Pretrained Language Models
von: Bayazit, Deniz, et al.
Veröffentlicht: (2023)

How Open Must Language Models be to Enable Reliable Scientific Inference?
von: Michaelov, James A., et al.
Veröffentlicht: (2026)

Moving Beyond Next-Token Prediction: Transformers are Context-Sensitive Language Generators
von: Rhee, Phill Kyu
Veröffentlicht: (2025)

Multimodal Latent Language Modeling with Next-Token Diffusion
von: Sun, Yutao, et al.
Veröffentlicht: (2024)

Better Language Model Inversion by Compactly Representing Next-Token Distributions
von: Nazir, Murtaza, et al.
Veröffentlicht: (2025)

EVOKE: Emotion Vocabulary Of Korean and English
von: Jung, Yoonwon, et al.
Veröffentlicht: (2026)

Not quite Sherlock Holmes: Language model predictions do not reliably differentiate impossible from improbable events
von: Michaelov, James A., et al.
Veröffentlicht: (2025)

Does GPT-4 pass the Turing test?
von: Jones, Cameron R., et al.
Veröffentlicht: (2023)

ELAICHI: Enhancing Low-resource TTS by Addressing Infrequent and Low-frequency Character Bigrams
von: Anand, Srija, et al.
Veröffentlicht: (2024)

Finding Task-specific Subnetworks in Multi-task Spoken Language Understanding Model
von: Futami, Hayato, et al.
Veröffentlicht: (2024)

SENTRA: Selected-Next-Token Transformer for LLM Text Detection
von: Plyler, Mitchell, et al.
Veröffentlicht: (2025)

Unveiling Language Routing Isolation in Multilingual MoE Models for Interpretable Subnetwork Adaptation
von: Zheng, Kening, et al.
Veröffentlicht: (2026)

Efficient Training of Language Models with Compact and Consistent Next Token Distributions
von: Sathe, Ashutosh, et al.
Veröffentlicht: (2024)

A Law of Next-Token Prediction in Large Language Models
von: He, Hangfeng, et al.
Veröffentlicht: (2024)

Differentially Private Next-Token Prediction of Large Language Models
von: Flemings, James, et al.
Veröffentlicht: (2024)

Different Tokenization Schemes Lead to Comparable Performance in Spanish Number Agreement
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)

Retrofitting Large Language Models with Dynamic Tokenization
von: Feher, Darius, et al.
Veröffentlicht: (2024)

From Next-Token to Mathematics: The Learning Dynamics of Mathematical Reasoning in Language Models
von: Mishra, Shubhra, et al.
Veröffentlicht: (2024)

Distribution Prompting: Understanding the Expressivity of Language Models Through the Next-Token Distributions They Can Produce
von: Wang, Haojin, et al.
Veröffentlicht: (2025)