Enregistré dans:
| Auteurs principaux: | Luitel, Nishant, Bekoju, Nirajan, Sah, Anand Kumar, Shakya, Subarna |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2404.18071 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Contextual Spelling Correction with Language Model for Low-resource Setting
par: Luitel, Nishant, et autres
Publié: (2024)
par: Luitel, Nishant, et autres
Publié: (2024)
Inconsistent Tokenizations Cause Language Models to be Perplexed by Japanese Grammar
par: Gambardella, Andrew, et autres
Publié: (2025)
par: Gambardella, Andrew, et autres
Publié: (2025)
Perplexity-Aware Data Scaling Law: Perplexity Landscapes Predict Performance for Continual Pre-training
par: Liu, Lei, et autres
Publié: (2025)
par: Liu, Lei, et autres
Publié: (2025)
Perplexed by Perplexity: Perplexity-Based Data Pruning With Small Reference Models
par: Ankner, Zachary, et autres
Publié: (2024)
par: Ankner, Zachary, et autres
Publié: (2024)
NepaliGPT: A Generative Language Model for the Nepali Language
par: Pudasaini, Shushanta, et autres
Publié: (2025)
par: Pudasaini, Shushanta, et autres
Publié: (2025)
Development of Pre-Trained Transformer-based Models for the Nepali Language
par: Thapa, Prajwal, et autres
Publié: (2024)
par: Thapa, Prajwal, et autres
Publié: (2024)
SEE: Continual Fine-tuning with Sequential Ensemble of Experts
par: Wang, Zhilin, et autres
Publié: (2025)
par: Wang, Zhilin, et autres
Publié: (2025)
Automatic speech recognition for the Nepali language using CNN, bidirectional LSTM and ResNet
par: Dhakal, Manish, et autres
Publié: (2024)
par: Dhakal, Manish, et autres
Publié: (2024)
What is Wrong with Perplexity for Long-context Language Modeling?
par: Fang, Lizhe, et autres
Publié: (2024)
par: Fang, Lizhe, et autres
Publié: (2024)
Speculative Decoding Across Languages
par: Paudel, Nirajan, et autres
Publié: (2026)
par: Paudel, Nirajan, et autres
Publié: (2026)
Benchmarking BERT-based Models for Sentence-level Topic Classification in Nepali Language
par: Karki, Nischal, et autres
Publié: (2026)
par: Karki, Nischal, et autres
Publié: (2026)
Token-Level Adversarial Prompt Detection Based on Perplexity Measures and Contextual Information
par: Hu, Zhengmian, et autres
Publié: (2023)
par: Hu, Zhengmian, et autres
Publié: (2023)
Rethinking Perplexity: Revealing the Impact of Input Length on Perplexity Evaluation in LLMs
par: Cheng, Letian, et autres
Publié: (2026)
par: Cheng, Letian, et autres
Publié: (2026)
Momentum Point-Perplexity Mechanics in Large Language Models
par: Tomaz, Lorenzo, et autres
Publié: (2025)
par: Tomaz, Lorenzo, et autres
Publié: (2025)
Contrastive Perplexity for Controlled Generation: An Application in Detoxifying Large Language Models
par: Klein, Tassilo, et autres
Publié: (2024)
par: Klein, Tassilo, et autres
Publié: (2024)
Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning
par: Wang, Guoli, et autres
Publié: (2026)
par: Wang, Guoli, et autres
Publié: (2026)
Exploring Memorization in Fine-tuned Language Models
par: Zeng, Shenglai, et autres
Publié: (2023)
par: Zeng, Shenglai, et autres
Publié: (2023)
Efficient Ensemble for Fine-tuning Language Models on Multiple Datasets
par: Li, Dongyue, et autres
Publié: (2025)
par: Li, Dongyue, et autres
Publié: (2025)
Do as I do (Safely): Mitigating Task-Specific Fine-tuning Risks in Large Language Models
par: Eiras, Francisco, et autres
Publié: (2024)
par: Eiras, Francisco, et autres
Publié: (2024)
Fine-tuning Large Language Models for Domain-specific Machine Translation
par: Zheng, Jiawei, et autres
Publié: (2024)
par: Zheng, Jiawei, et autres
Publié: (2024)
Automatic Pruning of Fine-tuning Datasets for Transformer-based Language Models
par: Tayaranian, Mohammadreza, et autres
Publié: (2024)
par: Tayaranian, Mohammadreza, et autres
Publié: (2024)
Information Guided Regularization for Fine-tuning Language Models
par: Sharma, Mandar, et autres
Publié: (2024)
par: Sharma, Mandar, et autres
Publié: (2024)
Parallel Token Prediction for Language Models
par: Draxler, Felix, et autres
Publié: (2025)
par: Draxler, Felix, et autres
Publié: (2025)
Fine-tuning Language Models with Generative Adversarial Reward Modelling
par: Yu, Zhang Ze, et autres
Publié: (2023)
par: Yu, Zhang Ze, et autres
Publié: (2023)
Memento: Fine-tuning LLM Agents without Fine-tuning LLMs
par: Zhou, Huichi, et autres
Publié: (2025)
par: Zhou, Huichi, et autres
Publié: (2025)
Layer-wise Importance Matters: Less Memory for Better Performance in Parameter-efficient Fine-tuning of Large Language Models
par: Yao, Kai, et autres
Publié: (2024)
par: Yao, Kai, et autres
Publié: (2024)
Model Internal Sleuthing: Finding Lexical Identity and Inflectional Features in Modern Language Models
par: Li, Michael, et autres
Publié: (2025)
par: Li, Michael, et autres
Publié: (2025)
RIFF: Learning to Rephrase Inputs for Few-shot Fine-tuning of Language Models
par: Najafi, Saeed, et autres
Publié: (2024)
par: Najafi, Saeed, et autres
Publié: (2024)
Efficient End-to-end Language Model Fine-tuning on Graphs
par: Xue, Rui, et autres
Publié: (2023)
par: Xue, Rui, et autres
Publié: (2023)
Alzheimer's Dementia Detection Using Perplexity from Paired Large Language Models
par: Xiao, Yao, et autres
Publié: (2025)
par: Xiao, Yao, et autres
Publié: (2025)
Whispering in Amharic: Fine-tuning Whisper for Low-resource Language
par: Gete, Dawit Ketema, et autres
Publié: (2025)
par: Gete, Dawit Ketema, et autres
Publié: (2025)
Can We Use Probing to Better Understand Fine-tuning and Knowledge Distillation of the BERT NLU?
par: Hościłowicz, Jakub, et autres
Publié: (2023)
par: Hościłowicz, Jakub, et autres
Publié: (2023)
MLP Fusion: Towards Efficient Fine-tuning of Dense and Mixture-of-Experts Language Models
par: Ai, Mengting, et autres
Publié: (2023)
par: Ai, Mengting, et autres
Publié: (2023)
Chain of LoRA: Efficient Fine-tuning of Language Models via Residual Learning
par: Xia, Wenhan, et autres
Publié: (2024)
par: Xia, Wenhan, et autres
Publié: (2024)
Improving Pretraining Data Using Perplexity Correlations
par: Thrush, Tristan, et autres
Publié: (2024)
par: Thrush, Tristan, et autres
Publié: (2024)
Fine-tuning vs. In-context Learning in Large Language Models: A Formal Language Learning Perspective
par: Ghosh, Bishwamittra, et autres
Publié: (2026)
par: Ghosh, Bishwamittra, et autres
Publié: (2026)
Can Small Language Models be Good Reasoners for Sequential Recommendation?
par: Wang, Yuling, et autres
Publié: (2024)
par: Wang, Yuling, et autres
Publié: (2024)
Domain-adaptative Continual Learning for Low-resource Tasks: Evaluation on Nepali
par: Duwal, Sharad, et autres
Publié: (2024)
par: Duwal, Sharad, et autres
Publié: (2024)
Stepwise Perplexity-Guided Refinement for Efficient Chain-of-Thought Reasoning in Large Language Models
par: Cui, Yingqian, et autres
Publié: (2025)
par: Cui, Yingqian, et autres
Publié: (2025)
Sparse is Enough in Fine-tuning Pre-trained Large Language Models
par: Song, Weixi, et autres
Publié: (2023)
par: Song, Weixi, et autres
Publié: (2023)
Documents similaires
-
Contextual Spelling Correction with Language Model for Low-resource Setting
par: Luitel, Nishant, et autres
Publié: (2024) -
Inconsistent Tokenizations Cause Language Models to be Perplexed by Japanese Grammar
par: Gambardella, Andrew, et autres
Publié: (2025) -
Perplexity-Aware Data Scaling Law: Perplexity Landscapes Predict Performance for Continual Pre-training
par: Liu, Lei, et autres
Publié: (2025) -
Perplexed by Perplexity: Perplexity-Based Data Pruning With Small Reference Models
par: Ankner, Zachary, et autres
Publié: (2024) -
NepaliGPT: A Generative Language Model for the Nepali Language
par: Pudasaini, Shushanta, et autres
Publié: (2025)