:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Garbas, Lukas, Ploner, Max, Akbik, Alan
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Computation and Language
Online-Zugang:	https://arxiv.org/abs/2409.05997
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

BEAR: A Unified Framework for Evaluating Relational Knowledge in Causal and Masked Language Models
von: Wiland, Jacek, et al.
Veröffentlicht: (2024)

From Data to Knowledge: Evaluating How Efficiently Language Models Learn Facts
von: Christoph, Daniel, et al.
Veröffentlicht: (2025)

Towards a Principled Evaluation of Knowledge Editors
von: Pohl, Sebastian, et al.
Veröffentlicht: (2025)

LM-PUB-QUIZ: A Comprehensive Framework for Zero-Shot Evaluation of Relational Knowledge in Language Models
von: Ploner, Max, et al.
Veröffentlicht: (2024)

Familiarity: Better Evaluation of Zero-Shot Named Entity Recognition by Quantifying Label Shifts in Synthetic Training Data
von: Golde, Jonas, et al.
Veröffentlicht: (2024)

What Matters in Linearizing Language Models? A Comparative Study of Architecture, Scale, and Task Adaptation
von: Haller, Patrick, et al.
Veröffentlicht: (2025)

BabyHGRN: Exploring RNNs for Sample-Efficient Training of Language Models
von: Haller, Patrick, et al.
Veröffentlicht: (2024)

Sample-Efficient Language Modeling with Linear Attention and Lightweight Enhancements
von: Haller, Patrick, et al.
Veröffentlicht: (2025)

Less is More: Parameter-Efficient Selection of Intermediate Tasks for Transfer Learning
von: Schulte, David, et al.
Veröffentlicht: (2024)

Pre-Training Curriculum for Multi-Token Prediction in Language Models
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2025)

Repetition over Diversity: High-Signal Data Filtering for Sample-Efficient German Language Modeling
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2026)

Self-Aware Knowledge Probing: Evaluating Language Models' Relational Knowledge through Confidence Calibration
von: Kissling, Christopher, et al.
Veröffentlicht: (2026)

Fundus: A Simple-to-Use News Scraper Optimized for High Quality Extractions
von: Dallabetta, Max, et al.
Veröffentlicht: (2024)

SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity
von: Aynetdinov, Ansar, et al.
Veröffentlicht: (2024)

Evaluating Design Decisions for Dual Encoder-based Entity Disambiguation
von: Rücker, Susanna, et al.
Veröffentlicht: (2025)

Lemma Dilemma: On Lemma Generation Without Domain- or Language-Specific Training Data
von: Toporkov, Olia, et al.
Veröffentlicht: (2025)

What Matters When Building Universal Multilingual Named Entity Recognition Models?
von: Golde, Jonas, et al.
Veröffentlicht: (2026)

Large-Scale Label Interpretation Learning for Few-Shot Named Entity Recognition
von: Golde, Jonas, et al.
Veröffentlicht: (2024)

FiNERweb: Datasets and Artifacts for Scalable Multilingual Named Entity Recognition
von: Golde, Jonas, et al.
Veröffentlicht: (2025)

MastermindEval: A Simple But Scalable Reasoning Benchmark
von: Golde, Jonas, et al.
Veröffentlicht: (2025)

Beyond Marginal Distributions: A Framework to Evaluate the Representativeness of Demographic-Aligned LLMs
von: Williams, Tristan, et al.
Veröffentlicht: (2026)

Attention in Large Language Models Yields Efficient Zero-Shot Re-Rankers
von: Chen, Shijie, et al.
Veröffentlicht: (2024)

NoiseBench: Benchmarking the Impact of Real Label Noise on Named Entity Recognition
von: Merdjanovska, Elena, et al.
Veröffentlicht: (2024)

Optimising Language Models for Downstream Tasks: A Post-Training Perspective
von: Shi, Zhengyan
Veröffentlicht: (2025)

Scaling Laws for Downstream Task Performance of Large Language Models
von: Isik, Berivan, et al.
Veröffentlicht: (2024)

Question Decomposition for Retrieval-Augmented Generation
von: Ammann, Paul J. L., et al.
Veröffentlicht: (2025)

Measuring the Effect of Transcription Noise on Downstream Language Understanding Tasks
von: Shapira, Ori, et al.
Veröffentlicht: (2025)

Adapting Decoder-Based Language Models for Diverse Encoder Downstream Tasks
von: Suganthan, Paul, et al.
Veröffentlicht: (2025)

Large Language Models are Zero-Shot Rankers for Recommender Systems
von: Hou, Yupeng, et al.
Veröffentlicht: (2023)

Make Large Language Model a Better Ranker
von: Chao, Wen-Shuo, et al.
Veröffentlicht: (2024)

Medical Coding with Biomedical Transformer Ensembles and Zero/Few-shot Learning
von: Ziletti, Angelo, et al.
Veröffentlicht: (2022)

PsyEval: A Suite of Mental Health Related Tasks for Evaluating Large Language Models
von: Jin, Haoan, et al.
Veröffentlicht: (2023)

Language Ranker: A Lightweight Ranking framework for LLM Decoding
von: Zhang, Chenheng, et al.
Veröffentlicht: (2025)

Exploring the Impact of a Transformer's Latent Space Geometry on Downstream Task Performance
von: Marbut, Anna C., et al.
Veröffentlicht: (2024)

VocabTailor: Dynamic Vocabulary Selection for Downstream Tasks in Small Language Models
von: Zhang, Hanling, et al.
Veröffentlicht: (2025)

Fabricator: An Open Source Toolkit for Generating Labeled Training Data with Teacher LLMs
von: Golde, Jonas, et al.
Veröffentlicht: (2023)

Large Language Models are Effective Text Rankers with Pairwise Ranking Prompting
von: Qin, Zhen, et al.
Veröffentlicht: (2023)

Instability in Downstream Task Performance During LLM Pretraining
von: Nishida, Yuto, et al.
Veröffentlicht: (2025)

Can Character-based Language Models Improve Downstream Task Performance in Low-Resource and Noisy Language Scenarios?
von: Riabi, Arij, et al.
Veröffentlicht: (2021)

Do Large Language Models Rank Fairly? An Empirical Study on the Fairness of LLMs as Rankers
von: Wang, Yuan, et al.
Veröffentlicht: (2024)