Gespeichert in:
| Hauptverfasser: | Chang, Tyler A., Bergen, Benjamin K. |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2504.15471 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Explaining and Mitigating Crosslingual Tokenizer Inequities
von: Arnett, Catherine, et al.
Veröffentlicht: (2025)
von: Arnett, Catherine, et al.
Veröffentlicht: (2025)
Characterizing Learning Curves During Language Model Pre-Training: Learning, Forgetting, and Stability
von: Chang, Tyler A., et al.
Veröffentlicht: (2023)
von: Chang, Tyler A., et al.
Veröffentlicht: (2023)
Goldfish: Monolingual Language Models for 350 Languages
von: Chang, Tyler A., et al.
Veröffentlicht: (2024)
von: Chang, Tyler A., et al.
Veröffentlicht: (2024)
A Bit of a Problem: Measurement Disparities in Dataset Sizes Across Languages
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)
On the Acquisition of Shared Grammatical Representations in Bilingual Language Models
von: Arnett, Catherine, et al.
Veröffentlicht: (2025)
von: Arnett, Catherine, et al.
Veröffentlicht: (2025)
Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers
von: Jang, Eugene, et al.
Veröffentlicht: (2024)
von: Jang, Eugene, et al.
Veröffentlicht: (2024)
Revenge of the Fallen? Recurrent Models Match Transformers at Predicting Human Language Comprehension Metrics
von: Michaelov, James A., et al.
Veröffentlicht: (2024)
von: Michaelov, James A., et al.
Veröffentlicht: (2024)
Learning and Transferring Sparse Contextual Bigrams with Linear Transformers
von: Ren, Yunwei, et al.
Veröffentlicht: (2024)
von: Ren, Yunwei, et al.
Veröffentlicht: (2024)
Large Language Models Pass the Turing Test
von: Jones, Cameron R., et al.
Veröffentlicht: (2025)
von: Jones, Cameron R., et al.
Veröffentlicht: (2025)
Do Large Language Models Exhibit Spontaneous Rational Deception?
von: Taylor, Samuel M., et al.
Veröffentlicht: (2025)
von: Taylor, Samuel M., et al.
Veröffentlicht: (2025)
BLooP: Zero-Shot Abstractive Summarization using Large Language Models with Bigram Lookahead Promotion
von: Iyer, Varun, et al.
Veröffentlicht: (2026)
von: Iyer, Varun, et al.
Veröffentlicht: (2026)
Language Detection by Means of the Minkowski Norm: Identification Through Character Bigrams and Frequency Analysis
von: Pogăcean, Paul-Andrei, et al.
Veröffentlicht: (2025)
von: Pogăcean, Paul-Andrei, et al.
Veröffentlicht: (2025)
Language Model Behavioral Phases are Consistent Across Architecture, Training Data, and Scale
von: Michaelov, James A., et al.
Veröffentlicht: (2025)
von: Michaelov, James A., et al.
Veröffentlicht: (2025)
Sparse Subnetwork Enhancement for Underrepresented Languages in Large Language Models
von: Gurgurov, Daniil, et al.
Veröffentlicht: (2025)
von: Gurgurov, Daniil, et al.
Veröffentlicht: (2025)
Evolving Subnetwork Training for Large Language Models
von: Li, Hanqi, et al.
Veröffentlicht: (2024)
von: Li, Hanqi, et al.
Veröffentlicht: (2024)
Lies, Damned Lies, and Distributional Language Statistics: Persuasion and Deception with Large Language Models
von: Jones, Cameron R., et al.
Veröffentlicht: (2024)
von: Jones, Cameron R., et al.
Veröffentlicht: (2024)
Bolmo: Byteifying the Next Generation of Language Models
von: Minixhofer, Benjamin, et al.
Veröffentlicht: (2025)
von: Minixhofer, Benjamin, et al.
Veröffentlicht: (2025)
Your Language Model Secretly Contains Personality Subnetworks
von: Ye, Ruimeng, et al.
Veröffentlicht: (2026)
von: Ye, Ruimeng, et al.
Veröffentlicht: (2026)
Emergent inabilities? Inverse scaling over the course of pretraining
von: Michaelov, James A., et al.
Veröffentlicht: (2023)
von: Michaelov, James A., et al.
Veröffentlicht: (2023)
Why do language models perform worse for morphologically complex languages?
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)
The Heuristic Core: Understanding Subnetwork Generalization in Pretrained Language Models
von: Bhaskar, Adithya, et al.
Veröffentlicht: (2024)
von: Bhaskar, Adithya, et al.
Veröffentlicht: (2024)
Discovering Knowledge-Critical Subnetworks in Pretrained Language Models
von: Bayazit, Deniz, et al.
Veröffentlicht: (2023)
von: Bayazit, Deniz, et al.
Veröffentlicht: (2023)
How Open Must Language Models be to Enable Reliable Scientific Inference?
von: Michaelov, James A., et al.
Veröffentlicht: (2026)
von: Michaelov, James A., et al.
Veröffentlicht: (2026)
Moving Beyond Next-Token Prediction: Transformers are Context-Sensitive Language Generators
von: Rhee, Phill Kyu
Veröffentlicht: (2025)
von: Rhee, Phill Kyu
Veröffentlicht: (2025)
Multimodal Latent Language Modeling with Next-Token Diffusion
von: Sun, Yutao, et al.
Veröffentlicht: (2024)
von: Sun, Yutao, et al.
Veröffentlicht: (2024)
Better Language Model Inversion by Compactly Representing Next-Token Distributions
von: Nazir, Murtaza, et al.
Veröffentlicht: (2025)
von: Nazir, Murtaza, et al.
Veröffentlicht: (2025)
EVOKE: Emotion Vocabulary Of Korean and English
von: Jung, Yoonwon, et al.
Veröffentlicht: (2026)
von: Jung, Yoonwon, et al.
Veröffentlicht: (2026)
Not quite Sherlock Holmes: Language model predictions do not reliably differentiate impossible from improbable events
von: Michaelov, James A., et al.
Veröffentlicht: (2025)
von: Michaelov, James A., et al.
Veröffentlicht: (2025)
Does GPT-4 pass the Turing test?
von: Jones, Cameron R., et al.
Veröffentlicht: (2023)
von: Jones, Cameron R., et al.
Veröffentlicht: (2023)
ELAICHI: Enhancing Low-resource TTS by Addressing Infrequent and Low-frequency Character Bigrams
von: Anand, Srija, et al.
Veröffentlicht: (2024)
von: Anand, Srija, et al.
Veröffentlicht: (2024)
Finding Task-specific Subnetworks in Multi-task Spoken Language Understanding Model
von: Futami, Hayato, et al.
Veröffentlicht: (2024)
von: Futami, Hayato, et al.
Veröffentlicht: (2024)
SENTRA: Selected-Next-Token Transformer for LLM Text Detection
von: Plyler, Mitchell, et al.
Veröffentlicht: (2025)
von: Plyler, Mitchell, et al.
Veröffentlicht: (2025)
Unveiling Language Routing Isolation in Multilingual MoE Models for Interpretable Subnetwork Adaptation
von: Zheng, Kening, et al.
Veröffentlicht: (2026)
von: Zheng, Kening, et al.
Veröffentlicht: (2026)
Efficient Training of Language Models with Compact and Consistent Next Token Distributions
von: Sathe, Ashutosh, et al.
Veröffentlicht: (2024)
von: Sathe, Ashutosh, et al.
Veröffentlicht: (2024)
A Law of Next-Token Prediction in Large Language Models
von: He, Hangfeng, et al.
Veröffentlicht: (2024)
von: He, Hangfeng, et al.
Veröffentlicht: (2024)
Differentially Private Next-Token Prediction of Large Language Models
von: Flemings, James, et al.
Veröffentlicht: (2024)
von: Flemings, James, et al.
Veröffentlicht: (2024)
Different Tokenization Schemes Lead to Comparable Performance in Spanish Number Agreement
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)
von: Arnett, Catherine, et al.
Veröffentlicht: (2024)
Retrofitting Large Language Models with Dynamic Tokenization
von: Feher, Darius, et al.
Veröffentlicht: (2024)
von: Feher, Darius, et al.
Veröffentlicht: (2024)
From Next-Token to Mathematics: The Learning Dynamics of Mathematical Reasoning in Language Models
von: Mishra, Shubhra, et al.
Veröffentlicht: (2024)
von: Mishra, Shubhra, et al.
Veröffentlicht: (2024)
Distribution Prompting: Understanding the Expressivity of Language Models Through the Next-Token Distributions They Can Produce
von: Wang, Haojin, et al.
Veröffentlicht: (2025)
von: Wang, Haojin, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Explaining and Mitigating Crosslingual Tokenizer Inequities
von: Arnett, Catherine, et al.
Veröffentlicht: (2025) -
Characterizing Learning Curves During Language Model Pre-Training: Learning, Forgetting, and Stability
von: Chang, Tyler A., et al.
Veröffentlicht: (2023) -
Goldfish: Monolingual Language Models for 350 Languages
von: Chang, Tyler A., et al.
Veröffentlicht: (2024) -
A Bit of a Problem: Measurement Disparities in Dataset Sizes Across Languages
von: Arnett, Catherine, et al.
Veröffentlicht: (2024) -
On the Acquisition of Shared Grammatical Representations in Bilingual Language Models
von: Arnett, Catherine, et al.
Veröffentlicht: (2025)