Gespeichert in:
| Hauptverfasser: | Garbas, Lukas, Ploner, Max, Akbik, Alan |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2409.05997 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
BEAR: A Unified Framework for Evaluating Relational Knowledge in Causal and Masked Language Models
von: Wiland, Jacek, et al.
Veröffentlicht: (2024)
von: Wiland, Jacek, et al.
Veröffentlicht: (2024)
From Data to Knowledge: Evaluating How Efficiently Language Models Learn Facts
von: Christoph, Daniel, et al.
Veröffentlicht: (2025)
von: Christoph, Daniel, et al.
Veröffentlicht: (2025)
Towards a Principled Evaluation of Knowledge Editors
von: Pohl, Sebastian, et al.
Veröffentlicht: (2025)
von: Pohl, Sebastian, et al.
Veröffentlicht: (2025)
LM-PUB-QUIZ: A Comprehensive Framework for Zero-Shot Evaluation of Relational Knowledge in Language Models
von: Ploner, Max, et al.
Veröffentlicht: (2024)
von: Ploner, Max, et al.
Veröffentlicht: (2024)
Familiarity: Better Evaluation of Zero-Shot Named Entity Recognition by Quantifying Label Shifts in Synthetic Training Data
von: Golde, Jonas, et al.
Veröffentlicht: (2024)
von: Golde, Jonas, et al.
Veröffentlicht: (2024)
What Matters in Linearizing Language Models? A Comparative Study of Architecture, Scale, and Task Adaptation
von: Haller, Patrick, et al.
Veröffentlicht: (2025)
von: Haller, Patrick, et al.
Veröffentlicht: (2025)
BabyHGRN: Exploring RNNs for Sample-Efficient Training of Language Models
von: Haller, Patrick, et al.
Veröffentlicht: (2024)
von: Haller, Patrick, et al.
Veröffentlicht: (2024)
Sample-Efficient Language Modeling with Linear Attention and Lightweight Enhancements
von: Haller, Patrick, et al.
Veröffentlicht: (2025)
von: Haller, Patrick, et al.
Veröffentlicht: (2025)
Less is More: Parameter-Efficient Selection of Intermediate Tasks for Transfer Learning
von: Schulte, David, et al.
Veröffentlicht: (2024)
von: Schulte, David, et al.
Veröffentlicht: (2024)
Pre-Training Curriculum for Multi-Token Prediction in Language Models
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2025)
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2025)
Repetition over Diversity: High-Signal Data Filtering for Sample-Efficient German Language Modeling
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2026)
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2026)
Self-Aware Knowledge Probing: Evaluating Language Models' Relational Knowledge through Confidence Calibration
von: Kissling, Christopher, et al.
Veröffentlicht: (2026)
von: Kissling, Christopher, et al.
Veröffentlicht: (2026)
Fundus: A Simple-to-Use News Scraper Optimized for High Quality Extractions
von: Dallabetta, Max, et al.
Veröffentlicht: (2024)
von: Dallabetta, Max, et al.
Veröffentlicht: (2024)
SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2024)
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2024)
Evaluating Design Decisions for Dual Encoder-based Entity Disambiguation
von: Rücker, Susanna, et al.
Veröffentlicht: (2025)
von: Rücker, Susanna, et al.
Veröffentlicht: (2025)
Lemma Dilemma: On Lemma Generation Without Domain- or Language-Specific Training Data
von: Toporkov, Olia, et al.
Veröffentlicht: (2025)
von: Toporkov, Olia, et al.
Veröffentlicht: (2025)
What Matters When Building Universal Multilingual Named Entity Recognition Models?
von: Golde, Jonas, et al.
Veröffentlicht: (2026)
von: Golde, Jonas, et al.
Veröffentlicht: (2026)
Large-Scale Label Interpretation Learning for Few-Shot Named Entity Recognition
von: Golde, Jonas, et al.
Veröffentlicht: (2024)
von: Golde, Jonas, et al.
Veröffentlicht: (2024)
FiNERweb: Datasets and Artifacts for Scalable Multilingual Named Entity Recognition
von: Golde, Jonas, et al.
Veröffentlicht: (2025)
von: Golde, Jonas, et al.
Veröffentlicht: (2025)
MastermindEval: A Simple But Scalable Reasoning Benchmark
von: Golde, Jonas, et al.
Veröffentlicht: (2025)
von: Golde, Jonas, et al.
Veröffentlicht: (2025)
Beyond Marginal Distributions: A Framework to Evaluate the Representativeness of Demographic-Aligned LLMs
von: Williams, Tristan, et al.
Veröffentlicht: (2026)
von: Williams, Tristan, et al.
Veröffentlicht: (2026)
Attention in Large Language Models Yields Efficient Zero-Shot Re-Rankers
von: Chen, Shijie, et al.
Veröffentlicht: (2024)
von: Chen, Shijie, et al.
Veröffentlicht: (2024)
NoiseBench: Benchmarking the Impact of Real Label Noise on Named Entity Recognition
von: Merdjanovska, Elena, et al.
Veröffentlicht: (2024)
von: Merdjanovska, Elena, et al.
Veröffentlicht: (2024)
Optimising Language Models for Downstream Tasks: A Post-Training Perspective
von: Shi, Zhengyan
Veröffentlicht: (2025)
von: Shi, Zhengyan
Veröffentlicht: (2025)
Scaling Laws for Downstream Task Performance of Large Language Models
von: Isik, Berivan, et al.
Veröffentlicht: (2024)
von: Isik, Berivan, et al.
Veröffentlicht: (2024)
Question Decomposition for Retrieval-Augmented Generation
von: Ammann, Paul J. L., et al.
Veröffentlicht: (2025)
von: Ammann, Paul J. L., et al.
Veröffentlicht: (2025)
Measuring the Effect of Transcription Noise on Downstream Language Understanding Tasks
von: Shapira, Ori, et al.
Veröffentlicht: (2025)
von: Shapira, Ori, et al.
Veröffentlicht: (2025)
Adapting Decoder-Based Language Models for Diverse Encoder Downstream Tasks
von: Suganthan, Paul, et al.
Veröffentlicht: (2025)
von: Suganthan, Paul, et al.
Veröffentlicht: (2025)
Large Language Models are Zero-Shot Rankers for Recommender Systems
von: Hou, Yupeng, et al.
Veröffentlicht: (2023)
von: Hou, Yupeng, et al.
Veröffentlicht: (2023)
Make Large Language Model a Better Ranker
von: Chao, Wen-Shuo, et al.
Veröffentlicht: (2024)
von: Chao, Wen-Shuo, et al.
Veröffentlicht: (2024)
Medical Coding with Biomedical Transformer Ensembles and Zero/Few-shot Learning
von: Ziletti, Angelo, et al.
Veröffentlicht: (2022)
von: Ziletti, Angelo, et al.
Veröffentlicht: (2022)
PsyEval: A Suite of Mental Health Related Tasks for Evaluating Large Language Models
von: Jin, Haoan, et al.
Veröffentlicht: (2023)
von: Jin, Haoan, et al.
Veröffentlicht: (2023)
Language Ranker: A Lightweight Ranking framework for LLM Decoding
von: Zhang, Chenheng, et al.
Veröffentlicht: (2025)
von: Zhang, Chenheng, et al.
Veröffentlicht: (2025)
Exploring the Impact of a Transformer's Latent Space Geometry on Downstream Task Performance
von: Marbut, Anna C., et al.
Veröffentlicht: (2024)
von: Marbut, Anna C., et al.
Veröffentlicht: (2024)
VocabTailor: Dynamic Vocabulary Selection for Downstream Tasks in Small Language Models
von: Zhang, Hanling, et al.
Veröffentlicht: (2025)
von: Zhang, Hanling, et al.
Veröffentlicht: (2025)
Fabricator: An Open Source Toolkit for Generating Labeled Training Data with Teacher LLMs
von: Golde, Jonas, et al.
Veröffentlicht: (2023)
von: Golde, Jonas, et al.
Veröffentlicht: (2023)
Large Language Models are Effective Text Rankers with Pairwise Ranking Prompting
von: Qin, Zhen, et al.
Veröffentlicht: (2023)
von: Qin, Zhen, et al.
Veröffentlicht: (2023)
Instability in Downstream Task Performance During LLM Pretraining
von: Nishida, Yuto, et al.
Veröffentlicht: (2025)
von: Nishida, Yuto, et al.
Veröffentlicht: (2025)
Can Character-based Language Models Improve Downstream Task Performance in Low-Resource and Noisy Language Scenarios?
von: Riabi, Arij, et al.
Veröffentlicht: (2021)
von: Riabi, Arij, et al.
Veröffentlicht: (2021)
Do Large Language Models Rank Fairly? An Empirical Study on the Fairness of LLMs as Rankers
von: Wang, Yuan, et al.
Veröffentlicht: (2024)
von: Wang, Yuan, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
BEAR: A Unified Framework for Evaluating Relational Knowledge in Causal and Masked Language Models
von: Wiland, Jacek, et al.
Veröffentlicht: (2024) -
From Data to Knowledge: Evaluating How Efficiently Language Models Learn Facts
von: Christoph, Daniel, et al.
Veröffentlicht: (2025) -
Towards a Principled Evaluation of Knowledge Editors
von: Pohl, Sebastian, et al.
Veröffentlicht: (2025) -
LM-PUB-QUIZ: A Comprehensive Framework for Zero-Shot Evaluation of Relational Knowledge in Language Models
von: Ploner, Max, et al.
Veröffentlicht: (2024) -
Familiarity: Better Evaluation of Zero-Shot Named Entity Recognition by Quantifying Label Shifts in Synthetic Training Data
von: Golde, Jonas, et al.
Veröffentlicht: (2024)