:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	Jabbar, Haris
Format:	Preprint
Veröffentlicht:	2023
Schlagworte:	Computation and Language
Online-Zugang:	https://arxiv.org/abs/2307.07262
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

MorphTok: Morphologically Grounded Tokenization for Indian Languages
von: Brahma, Maharaj, et al.
Veröffentlicht: (2025)

Towards Linguistically-Aware and Language-Independent Tokenization for Large Language Models (LLMs)
von: Rahman, Abrar, et al.
Veröffentlicht: (2024)

MorphBPE: A Morpho-Aware Tokenizer Bridging Linguistic Complexity for Efficient LLM Training Across Morphologies
von: Asgari, Ehsaneddin, et al.
Veröffentlicht: (2025)

Piecing Together Clues: A Benchmark for Evaluating the Detective Skills of Large Language Models
von: Gu, Zhouhong, et al.
Veröffentlicht: (2023)

Personalized Pieces: Efficient Personalized Large Language Models through Collaborative Efforts
von: Tan, Zhaoxuan, et al.
Veröffentlicht: (2024)

Which Pieces Does Unigram Tokenization Really Need?
von: Land, Sander, et al.
Veröffentlicht: (2025)

Linguistically Informed Tokenization Improves ASR for Underresourced Languages
von: Daul, Massimo, et al.
Veröffentlicht: (2025)

Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language Models
von: Zhou, Xinyu, et al.
Veröffentlicht: (2024)

How Long Is a Piece of String? A Brief Empirical Analysis of Tokenizers
von: Roberts, Jonathan, et al.
Veröffentlicht: (2026)

A Survey on Personalized Alignment -- The Missing Piece for Large Language Models in Real-World Applications
von: Guan, Jian, et al.
Veröffentlicht: (2025)

DetectBench: Can Large Language Model Detect and Piece Together Implicit Evidence?
von: Gu, Zhouhong, et al.
Veröffentlicht: (2024)

Linguistic Intelligence in Large Language Models for Telecommunications
von: Ahmed, Tasnim, et al.
Veröffentlicht: (2024)

Unveiling Linguistic Regions in Large Language Models
von: Zhang, Zhihao, et al.
Veröffentlicht: (2024)

Benchmarking Linguistic Diversity of Large Language Models
von: Guo, Yanzhu, et al.
Veröffentlicht: (2024)

Problematic Tokens: Tokenizer Bias in Large Language Models
von: Yang, Jin, et al.
Veröffentlicht: (2024)

Multi-Objective Linguistic Control of Large Language Models
von: Nguyen, Dang, et al.
Veröffentlicht: (2024)

Inductive Linguistic Reasoning with Large Language Models
von: Ramji, Raghav, et al.
Veröffentlicht: (2024)

Rethinking Tokenization: Crafting Better Tokenizers for Large Language Models
von: Yang, Jinbiao
Veröffentlicht: (2024)

Brain in a Vat: On Missing Pieces Towards Artificial General Intelligence in Large Language Models
von: Ma, Yuxi, et al.
Veröffentlicht: (2023)

The Shrinking Landscape of Linguistic Diversity in the Age of Large Language Models
von: Sourati, Zhivar, et al.
Veröffentlicht: (2025)

Large Language Models as Proxies for Theories of Human Linguistic Cognition
von: Ziv, Imry, et al.
Veröffentlicht: (2025)

Are Large Language Models the future crowd workers of Linguistics?
von: Ferrazzo, Iris
Veröffentlicht: (2025)

MorphNLI: A Stepwise Approach to Natural Language Inference Using Text Morphing
von: Negru, Vlad Andrei, et al.
Veröffentlicht: (2025)

A Comparative Approach to Assessing Linguistic Creativity of Large Language Models and Humans
von: Dinu, Anca, et al.
Veröffentlicht: (2025)

Linguistic Blind Spots of Large Language Models
von: Cheng, Jiali, et al.
Veröffentlicht: (2025)

Large Language Model as Token Compressor and Decompressor
von: Li, Wenbing, et al.
Veröffentlicht: (2026)

Retrofitting Large Language Models with Dynamic Tokenization
von: Feher, Darius, et al.
Veröffentlicht: (2024)

Generative Linguistics, Large Language Models, and the Social Nature of Scientific Success
von: Hao, Sophie
Veröffentlicht: (2025)

Probing Large Language Models in Reasoning and Translating Complex Linguistic Puzzles
von: Lin, Zheng-Lin, et al.
Veröffentlicht: (2025)

Performance Evaluation of Tokenizers in Large Language Models for the Assamese Language
von: Tamang, Sagar, et al.
Veröffentlicht: (2024)

Investigating Large Language Models' Linguistic Abilities for Text Preprocessing
von: Braga, Marco, et al.
Veröffentlicht: (2025)

Detecting Linguistic Indicators for Stereotype Assessment with Large Language Models
von: Görge, Rebekka, et al.
Veröffentlicht: (2025)

Rethinking Personalization in Large Language Models at the Token Level
von: Zhang, Chenheng, et al.
Veröffentlicht: (2026)

Unified Large Language Models for Misinformation Detection in Low-Resource Linguistic Settings
von: Islam, Muhammad, et al.
Veröffentlicht: (2025)

Decomposed Prompting: Probing Multilingual Linguistic Structure Knowledge in Large Language Models
von: Nie, Ercong, et al.
Veröffentlicht: (2024)

The Invalsi Benchmarks: measuring Linguistic and Mathematical understanding of Large Language Models in Italian
von: Puccetti, Giovanni, et al.
Veröffentlicht: (2024)

Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization
von: Wang, Dixuan, et al.
Veröffentlicht: (2024)

FTP: A Fine-grained Token-wise Pruner for Large Language Models via Token Routing
von: Li, Zekai, et al.
Veröffentlicht: (2024)

CLEAR: A Comprehensive Linguistic Evaluation of Argument Rewriting by Large Language Models
von: Huber, Thomas, et al.
Veröffentlicht: (2025)

Token-Level Privacy in Large Language Models
von: Harel, Re'em, et al.
Veröffentlicht: (2025)