Enregistré dans:
| Auteur principal: | Khan, Muhammad Shahmeer |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2601.00444 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
RefactorCoderQA: Benchmarking LLMs for Multi-Domain Coding Question Solutions in Cloud and Edge Deployment
par: Rahman, Shadikur, et autres
Publié: (2025)
par: Rahman, Shadikur, et autres
Publié: (2025)
From Transformers to LLMs: A Systematic Survey of Efficiency Considerations in NLP
par: Ansar, Wazib, et autres
Publié: (2024)
par: Ansar, Wazib, et autres
Publié: (2024)
Measuring the Robustness of NLP Models to Domain Shifts
par: Calderon, Nitay, et autres
Publié: (2023)
par: Calderon, Nitay, et autres
Publié: (2023)
SciNLP: A Domain-Specific Benchmark for Full-Text Scientific Entity and Relation Extraction in NLP
par: Duan, Decheng, et autres
Publié: (2025)
par: Duan, Decheng, et autres
Publié: (2025)
NLP-ADBench: NLP Anomaly Detection Benchmark
par: Li, Yuangang, et autres
Publié: (2024)
par: Li, Yuangang, et autres
Publié: (2024)
Privacy Evaluation Benchmarks for NLP Models
par: Huang, Wei, et autres
Publié: (2024)
par: Huang, Wei, et autres
Publié: (2024)
NLP for Social Good: A Survey and Outlook of Challenges, Opportunities, and Responsible Deployment
par: Karamolegkou, Antonia, et autres
Publié: (2025)
par: Karamolegkou, Antonia, et autres
Publié: (2025)
mhGPT: A Lightweight Generative Pre-Trained Transformer for Mental Health Text Analysis
par: Kim, Dae-young, et autres
Publié: (2024)
par: Kim, Dae-young, et autres
Publié: (2024)
PIIvot: A Lightweight NLP Anonymization Framework for Question-Anchored Tutoring Dialogues
par: Zent, Matthew, et autres
Publié: (2025)
par: Zent, Matthew, et autres
Publié: (2025)
EvalxNLP: A Framework for Benchmarking Post-Hoc Explainability Methods on NLP Models
par: Dhaini, Mahdi, et autres
Publié: (2025)
par: Dhaini, Mahdi, et autres
Publié: (2025)
Towards Inclusive NLP: Assessing Compressed Multilingual Transformers across Diverse Language Benchmarks
par: Alshehhi, Maitha, et autres
Publié: (2025)
par: Alshehhi, Maitha, et autres
Publié: (2025)
Robust Explanations for User Trust in Enterprise NLP Systems
par: Zhang, Guilin, et autres
Publié: (2026)
par: Zhang, Guilin, et autres
Publié: (2026)
SEMFED: Semantic-Aware Resource-Efficient Federated Learning for Heterogeneous NLP Tasks
par: Hussain, Sajid, et autres
Publié: (2025)
par: Hussain, Sajid, et autres
Publié: (2025)
Divide et Impera: Multi-Transformer Architectures for Complex NLP-Tasks
par: Helland, Solveig, et autres
Publié: (2023)
par: Helland, Solveig, et autres
Publié: (2023)
Towards Incremental Transformers: An Empirical Analysis of Transformer Models for Incremental NLU
par: Kahardipraja, Patrick, et autres
Publié: (2021)
par: Kahardipraja, Patrick, et autres
Publié: (2021)
AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation
par: Nakash, Itay, et autres
Publié: (2025)
par: Nakash, Itay, et autres
Publié: (2025)
A Japanese Language Model and Three New Evaluation Benchmarks for Pharmaceutical NLP
par: Ono, Shinnosuke, et autres
Publié: (2025)
par: Ono, Shinnosuke, et autres
Publié: (2025)
LLM and Agent-Driven Data Analysis: A Systematic Approach for Enterprise Applications and System-level Deployment
par: Wang, Xi, et autres
Publié: (2025)
par: Wang, Xi, et autres
Publié: (2025)
ECBD: Evidence-Centered Benchmark Design for NLP
par: Liu, Yu Lu, et autres
Publié: (2024)
par: Liu, Yu Lu, et autres
Publié: (2024)
BURMESE-SAN: Burmese NLP Benchmark for Evaluating Large Language Models
par: Aung, Thura, et autres
Publié: (2026)
par: Aung, Thura, et autres
Publié: (2026)
Benchmarking NLP-supported Language Sample Analysis for Swiss Children's Speech
par: Ryser, Anja, et autres
Publié: (2025)
par: Ryser, Anja, et autres
Publié: (2025)
Enterprise Benchmarks for Large Language Model Evaluation
par: Zhang, Bing, et autres
Publié: (2024)
par: Zhang, Bing, et autres
Publié: (2024)
Detecting PTSD in Clinical Interviews: A Comparative Analysis of NLP Methods and Large Language Models
par: Chen, Feng, et autres
Publié: (2025)
par: Chen, Feng, et autres
Publié: (2025)
DRBench: A Realistic Benchmark for Enterprise Deep Research
par: Abaskohi, Amirhossein, et autres
Publié: (2025)
par: Abaskohi, Amirhossein, et autres
Publié: (2025)
Exploring NLP Benchmarks in an Extremely Low-Resource Setting
par: Nuha, Ulin, et autres
Publié: (2025)
par: Nuha, Ulin, et autres
Publié: (2025)
When does MAML Work the Best? An Empirical Study on Model-Agnostic Meta-Learning in NLP Applications
par: Liu, Zequn, et autres
Publié: (2020)
par: Liu, Zequn, et autres
Publié: (2020)
Comparative Analysis of Efficient Adapter-Based Fine-Tuning of State-of-the-Art Transformer Models
par: Siddiqui, Saad Mashkoor, et autres
Publié: (2025)
par: Siddiqui, Saad Mashkoor, et autres
Publié: (2025)
Transformer Enhanced Relation Classification: A Comparative Analysis of Contextuality, Data Efficiency and Sequence Complexity
par: Jing, Bowen, et autres
Publié: (2025)
par: Jing, Bowen, et autres
Publié: (2025)
Benchmarking Sociolinguistic Diversity in Swahili NLP: A Taxonomy-Guided Approach
par: Oketch, Kezia, et autres
Publié: (2025)
par: Oketch, Kezia, et autres
Publié: (2025)
Large Language Model for Multi-Domain Translation: Benchmarking and Domain CoT Fine-tuning
par: Hu, Tianxiang, et autres
Publié: (2024)
par: Hu, Tianxiang, et autres
Publié: (2024)
Indian Legal NLP Benchmarks : A Survey
par: Kalamkar, Prathamesh, et autres
Publié: (2021)
par: Kalamkar, Prathamesh, et autres
Publié: (2021)
BriefMe: A Legal NLP Benchmark for Assisting with Legal Briefs
par: Woo, Jesse, et autres
Publié: (2025)
par: Woo, Jesse, et autres
Publié: (2025)
Evaluating Large Language Models (LLMs) in Financial NLP: A Comparative Study on Financial Report Analysis
par: Mohsin, Md Talha
Publié: (2025)
par: Mohsin, Md Talha
Publié: (2025)
LogogramNLP: Comparing Visual and Textual Representations of Ancient Logographic Writing Systems for NLP
par: Chen, Danlu, et autres
Publié: (2024)
par: Chen, Danlu, et autres
Publié: (2024)
Benchmarking Large Language Models on Multiple Tasks in Bioinformatics NLP with Prompting
par: Jiang, Jiyue, et autres
Publié: (2025)
par: Jiang, Jiyue, et autres
Publié: (2025)
Pretraining Language Models with Subword Regularization: An Empirical Study of BPE Dropout in Low-Resource NLP
par: Visser, Ruan, et autres
Publié: (2026)
par: Visser, Ruan, et autres
Publié: (2026)
Towards Sustainable NLP: Insights from Benchmarking Inference Energy in Large Language Models
par: Poddar, Soham, et autres
Publié: (2025)
par: Poddar, Soham, et autres
Publié: (2025)
An Empirical Analysis of Fine-Tuning Large Language Models on Bioinformatics Literature: PRSGPT and BioStarsGPT
par: Muneeb, Muhammad, et autres
Publié: (2025)
par: Muneeb, Muhammad, et autres
Publié: (2025)
LightPAL: Lightweight Passage Retrieval for Open Domain Multi-Document Summarization
par: Enomoto, Masafumi, et autres
Publié: (2024)
par: Enomoto, Masafumi, et autres
Publié: (2024)
Current State in Privacy-Preserving Text Preprocessing for Domain-Agnostic NLP
par: Sinha, Abhirup, et autres
Publié: (2025)
par: Sinha, Abhirup, et autres
Publié: (2025)
Documents similaires
-
RefactorCoderQA: Benchmarking LLMs for Multi-Domain Coding Question Solutions in Cloud and Edge Deployment
par: Rahman, Shadikur, et autres
Publié: (2025) -
From Transformers to LLMs: A Systematic Survey of Efficiency Considerations in NLP
par: Ansar, Wazib, et autres
Publié: (2024) -
Measuring the Robustness of NLP Models to Domain Shifts
par: Calderon, Nitay, et autres
Publié: (2023) -
SciNLP: A Domain-Specific Benchmark for Full-Text Scientific Entity and Relation Extraction in NLP
par: Duan, Decheng, et autres
Publié: (2025) -
NLP-ADBench: NLP Anomaly Detection Benchmark
par: Li, Yuangang, et autres
Publié: (2024)