:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Luitel, Nishant, Bekoju, Nirajan, Sah, Anand Kumar, Shakya, Subarna
Format:	Preprint
Publié:	2024
Sujets:	Computation and Language Machine Learning
Accès en ligne:	https://arxiv.org/abs/2404.18071
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Contextual Spelling Correction with Language Model for Low-resource Setting
par: Luitel, Nishant, et autres
Publié: (2024)

Inconsistent Tokenizations Cause Language Models to be Perplexed by Japanese Grammar
par: Gambardella, Andrew, et autres
Publié: (2025)

Perplexity-Aware Data Scaling Law: Perplexity Landscapes Predict Performance for Continual Pre-training
par: Liu, Lei, et autres
Publié: (2025)

Perplexed by Perplexity: Perplexity-Based Data Pruning With Small Reference Models
par: Ankner, Zachary, et autres
Publié: (2024)

NepaliGPT: A Generative Language Model for the Nepali Language
par: Pudasaini, Shushanta, et autres
Publié: (2025)

Development of Pre-Trained Transformer-based Models for the Nepali Language
par: Thapa, Prajwal, et autres
Publié: (2024)

SEE: Continual Fine-tuning with Sequential Ensemble of Experts
par: Wang, Zhilin, et autres
Publié: (2025)

Automatic speech recognition for the Nepali language using CNN, bidirectional LSTM and ResNet
par: Dhakal, Manish, et autres
Publié: (2024)

What is Wrong with Perplexity for Long-context Language Modeling?
par: Fang, Lizhe, et autres
Publié: (2024)

Speculative Decoding Across Languages
par: Paudel, Nirajan, et autres
Publié: (2026)

Benchmarking BERT-based Models for Sentence-level Topic Classification in Nepali Language
par: Karki, Nischal, et autres
Publié: (2026)

Token-Level Adversarial Prompt Detection Based on Perplexity Measures and Contextual Information
par: Hu, Zhengmian, et autres
Publié: (2023)

Rethinking Perplexity: Revealing the Impact of Input Length on Perplexity Evaluation in LLMs
par: Cheng, Letian, et autres
Publié: (2026)

Momentum Point-Perplexity Mechanics in Large Language Models
par: Tomaz, Lorenzo, et autres
Publié: (2025)

Contrastive Perplexity for Controlled Generation: An Application in Detoxifying Large Language Models
par: Klein, Tassilo, et autres
Publié: (2024)

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning
par: Wang, Guoli, et autres
Publié: (2026)

Exploring Memorization in Fine-tuned Language Models
par: Zeng, Shenglai, et autres
Publié: (2023)

Efficient Ensemble for Fine-tuning Language Models on Multiple Datasets
par: Li, Dongyue, et autres
Publié: (2025)

Do as I do (Safely): Mitigating Task-Specific Fine-tuning Risks in Large Language Models
par: Eiras, Francisco, et autres
Publié: (2024)

Fine-tuning Large Language Models for Domain-specific Machine Translation
par: Zheng, Jiawei, et autres
Publié: (2024)

Automatic Pruning of Fine-tuning Datasets for Transformer-based Language Models
par: Tayaranian, Mohammadreza, et autres
Publié: (2024)

Information Guided Regularization for Fine-tuning Language Models
par: Sharma, Mandar, et autres
Publié: (2024)

Parallel Token Prediction for Language Models
par: Draxler, Felix, et autres
Publié: (2025)

Fine-tuning Language Models with Generative Adversarial Reward Modelling
par: Yu, Zhang Ze, et autres
Publié: (2023)

Memento: Fine-tuning LLM Agents without Fine-tuning LLMs
par: Zhou, Huichi, et autres
Publié: (2025)

Layer-wise Importance Matters: Less Memory for Better Performance in Parameter-efficient Fine-tuning of Large Language Models
par: Yao, Kai, et autres
Publié: (2024)

Model Internal Sleuthing: Finding Lexical Identity and Inflectional Features in Modern Language Models
par: Li, Michael, et autres
Publié: (2025)

RIFF: Learning to Rephrase Inputs for Few-shot Fine-tuning of Language Models
par: Najafi, Saeed, et autres
Publié: (2024)

Efficient End-to-end Language Model Fine-tuning on Graphs
par: Xue, Rui, et autres
Publié: (2023)

Alzheimer's Dementia Detection Using Perplexity from Paired Large Language Models
par: Xiao, Yao, et autres
Publié: (2025)

Whispering in Amharic: Fine-tuning Whisper for Low-resource Language
par: Gete, Dawit Ketema, et autres
Publié: (2025)

Can We Use Probing to Better Understand Fine-tuning and Knowledge Distillation of the BERT NLU?
par: Hościłowicz, Jakub, et autres
Publié: (2023)

MLP Fusion: Towards Efficient Fine-tuning of Dense and Mixture-of-Experts Language Models
par: Ai, Mengting, et autres
Publié: (2023)

Chain of LoRA: Efficient Fine-tuning of Language Models via Residual Learning
par: Xia, Wenhan, et autres
Publié: (2024)

Improving Pretraining Data Using Perplexity Correlations
par: Thrush, Tristan, et autres
Publié: (2024)

Fine-tuning vs. In-context Learning in Large Language Models: A Formal Language Learning Perspective
par: Ghosh, Bishwamittra, et autres
Publié: (2026)

Can Small Language Models be Good Reasoners for Sequential Recommendation?
par: Wang, Yuling, et autres
Publié: (2024)

Domain-adaptative Continual Learning for Low-resource Tasks: Evaluation on Nepali
par: Duwal, Sharad, et autres
Publié: (2024)

Stepwise Perplexity-Guided Refinement for Efficient Chain-of-Thought Reasoning in Large Language Models
par: Cui, Yingqian, et autres
Publié: (2025)

Sparse is Enough in Fine-tuning Pre-trained Large Language Models
par: Song, Weixi, et autres
Publié: (2023)