Gespeichert in:
| 1. Verfasser: | Jabbar, Haris |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2023
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2307.07262 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
MorphTok: Morphologically Grounded Tokenization for Indian Languages
von: Brahma, Maharaj, et al.
Veröffentlicht: (2025)
von: Brahma, Maharaj, et al.
Veröffentlicht: (2025)
Towards Linguistically-Aware and Language-Independent Tokenization for Large Language Models (LLMs)
von: Rahman, Abrar, et al.
Veröffentlicht: (2024)
von: Rahman, Abrar, et al.
Veröffentlicht: (2024)
MorphBPE: A Morpho-Aware Tokenizer Bridging Linguistic Complexity for Efficient LLM Training Across Morphologies
von: Asgari, Ehsaneddin, et al.
Veröffentlicht: (2025)
von: Asgari, Ehsaneddin, et al.
Veröffentlicht: (2025)
Piecing Together Clues: A Benchmark for Evaluating the Detective Skills of Large Language Models
von: Gu, Zhouhong, et al.
Veröffentlicht: (2023)
von: Gu, Zhouhong, et al.
Veröffentlicht: (2023)
Personalized Pieces: Efficient Personalized Large Language Models through Collaborative Efforts
von: Tan, Zhaoxuan, et al.
Veröffentlicht: (2024)
von: Tan, Zhaoxuan, et al.
Veröffentlicht: (2024)
Which Pieces Does Unigram Tokenization Really Need?
von: Land, Sander, et al.
Veröffentlicht: (2025)
von: Land, Sander, et al.
Veröffentlicht: (2025)
Linguistically Informed Tokenization Improves ASR for Underresourced Languages
von: Daul, Massimo, et al.
Veröffentlicht: (2025)
von: Daul, Massimo, et al.
Veröffentlicht: (2025)
Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language Models
von: Zhou, Xinyu, et al.
Veröffentlicht: (2024)
von: Zhou, Xinyu, et al.
Veröffentlicht: (2024)
How Long Is a Piece of String? A Brief Empirical Analysis of Tokenizers
von: Roberts, Jonathan, et al.
Veröffentlicht: (2026)
von: Roberts, Jonathan, et al.
Veröffentlicht: (2026)
A Survey on Personalized Alignment -- The Missing Piece for Large Language Models in Real-World Applications
von: Guan, Jian, et al.
Veröffentlicht: (2025)
von: Guan, Jian, et al.
Veröffentlicht: (2025)
DetectBench: Can Large Language Model Detect and Piece Together Implicit Evidence?
von: Gu, Zhouhong, et al.
Veröffentlicht: (2024)
von: Gu, Zhouhong, et al.
Veröffentlicht: (2024)
Linguistic Intelligence in Large Language Models for Telecommunications
von: Ahmed, Tasnim, et al.
Veröffentlicht: (2024)
von: Ahmed, Tasnim, et al.
Veröffentlicht: (2024)
Unveiling Linguistic Regions in Large Language Models
von: Zhang, Zhihao, et al.
Veröffentlicht: (2024)
von: Zhang, Zhihao, et al.
Veröffentlicht: (2024)
Benchmarking Linguistic Diversity of Large Language Models
von: Guo, Yanzhu, et al.
Veröffentlicht: (2024)
von: Guo, Yanzhu, et al.
Veröffentlicht: (2024)
Problematic Tokens: Tokenizer Bias in Large Language Models
von: Yang, Jin, et al.
Veröffentlicht: (2024)
von: Yang, Jin, et al.
Veröffentlicht: (2024)
Multi-Objective Linguistic Control of Large Language Models
von: Nguyen, Dang, et al.
Veröffentlicht: (2024)
von: Nguyen, Dang, et al.
Veröffentlicht: (2024)
Inductive Linguistic Reasoning with Large Language Models
von: Ramji, Raghav, et al.
Veröffentlicht: (2024)
von: Ramji, Raghav, et al.
Veröffentlicht: (2024)
Rethinking Tokenization: Crafting Better Tokenizers for Large Language Models
von: Yang, Jinbiao
Veröffentlicht: (2024)
von: Yang, Jinbiao
Veröffentlicht: (2024)
Brain in a Vat: On Missing Pieces Towards Artificial General Intelligence in Large Language Models
von: Ma, Yuxi, et al.
Veröffentlicht: (2023)
von: Ma, Yuxi, et al.
Veröffentlicht: (2023)
The Shrinking Landscape of Linguistic Diversity in the Age of Large Language Models
von: Sourati, Zhivar, et al.
Veröffentlicht: (2025)
von: Sourati, Zhivar, et al.
Veröffentlicht: (2025)
Large Language Models as Proxies for Theories of Human Linguistic Cognition
von: Ziv, Imry, et al.
Veröffentlicht: (2025)
von: Ziv, Imry, et al.
Veröffentlicht: (2025)
Are Large Language Models the future crowd workers of Linguistics?
von: Ferrazzo, Iris
Veröffentlicht: (2025)
von: Ferrazzo, Iris
Veröffentlicht: (2025)
MorphNLI: A Stepwise Approach to Natural Language Inference Using Text Morphing
von: Negru, Vlad Andrei, et al.
Veröffentlicht: (2025)
von: Negru, Vlad Andrei, et al.
Veröffentlicht: (2025)
A Comparative Approach to Assessing Linguistic Creativity of Large Language Models and Humans
von: Dinu, Anca, et al.
Veröffentlicht: (2025)
von: Dinu, Anca, et al.
Veröffentlicht: (2025)
Linguistic Blind Spots of Large Language Models
von: Cheng, Jiali, et al.
Veröffentlicht: (2025)
von: Cheng, Jiali, et al.
Veröffentlicht: (2025)
Large Language Model as Token Compressor and Decompressor
von: Li, Wenbing, et al.
Veröffentlicht: (2026)
von: Li, Wenbing, et al.
Veröffentlicht: (2026)
Retrofitting Large Language Models with Dynamic Tokenization
von: Feher, Darius, et al.
Veröffentlicht: (2024)
von: Feher, Darius, et al.
Veröffentlicht: (2024)
Generative Linguistics, Large Language Models, and the Social Nature of Scientific Success
von: Hao, Sophie
Veröffentlicht: (2025)
von: Hao, Sophie
Veröffentlicht: (2025)
Probing Large Language Models in Reasoning and Translating Complex Linguistic Puzzles
von: Lin, Zheng-Lin, et al.
Veröffentlicht: (2025)
von: Lin, Zheng-Lin, et al.
Veröffentlicht: (2025)
Performance Evaluation of Tokenizers in Large Language Models for the Assamese Language
von: Tamang, Sagar, et al.
Veröffentlicht: (2024)
von: Tamang, Sagar, et al.
Veröffentlicht: (2024)
Investigating Large Language Models' Linguistic Abilities for Text Preprocessing
von: Braga, Marco, et al.
Veröffentlicht: (2025)
von: Braga, Marco, et al.
Veröffentlicht: (2025)
Detecting Linguistic Indicators for Stereotype Assessment with Large Language Models
von: Görge, Rebekka, et al.
Veröffentlicht: (2025)
von: Görge, Rebekka, et al.
Veröffentlicht: (2025)
Rethinking Personalization in Large Language Models at the Token Level
von: Zhang, Chenheng, et al.
Veröffentlicht: (2026)
von: Zhang, Chenheng, et al.
Veröffentlicht: (2026)
Unified Large Language Models for Misinformation Detection in Low-Resource Linguistic Settings
von: Islam, Muhammad, et al.
Veröffentlicht: (2025)
von: Islam, Muhammad, et al.
Veröffentlicht: (2025)
Decomposed Prompting: Probing Multilingual Linguistic Structure Knowledge in Large Language Models
von: Nie, Ercong, et al.
Veröffentlicht: (2024)
von: Nie, Ercong, et al.
Veröffentlicht: (2024)
The Invalsi Benchmarks: measuring Linguistic and Mathematical understanding of Large Language Models in Italian
von: Puccetti, Giovanni, et al.
Veröffentlicht: (2024)
von: Puccetti, Giovanni, et al.
Veröffentlicht: (2024)
Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization
von: Wang, Dixuan, et al.
Veröffentlicht: (2024)
von: Wang, Dixuan, et al.
Veröffentlicht: (2024)
FTP: A Fine-grained Token-wise Pruner for Large Language Models via Token Routing
von: Li, Zekai, et al.
Veröffentlicht: (2024)
von: Li, Zekai, et al.
Veröffentlicht: (2024)
CLEAR: A Comprehensive Linguistic Evaluation of Argument Rewriting by Large Language Models
von: Huber, Thomas, et al.
Veröffentlicht: (2025)
von: Huber, Thomas, et al.
Veröffentlicht: (2025)
Token-Level Privacy in Large Language Models
von: Harel, Re'em, et al.
Veröffentlicht: (2025)
von: Harel, Re'em, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
MorphTok: Morphologically Grounded Tokenization for Indian Languages
von: Brahma, Maharaj, et al.
Veröffentlicht: (2025) -
Towards Linguistically-Aware and Language-Independent Tokenization for Large Language Models (LLMs)
von: Rahman, Abrar, et al.
Veröffentlicht: (2024) -
MorphBPE: A Morpho-Aware Tokenizer Bridging Linguistic Complexity for Efficient LLM Training Across Morphologies
von: Asgari, Ehsaneddin, et al.
Veröffentlicht: (2025) -
Piecing Together Clues: A Benchmark for Evaluating the Detective Skills of Large Language Models
von: Gu, Zhouhong, et al.
Veröffentlicht: (2023) -
Personalized Pieces: Efficient Personalized Large Language Models through Collaborative Efforts
von: Tan, Zhaoxuan, et al.
Veröffentlicht: (2024)