Salvato in:
| Autori principali: | Shapira, Ori, Chazan, Shlomo E., Cohen, Amir DN |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2502.13645 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
The Overlooked Role of Graded Relevance Thresholds in Multilingual Dense Retrieval
di: Wullach, Tomer, et al.
Pubblicazione: (2026)
di: Wullach, Tomer, et al.
Pubblicazione: (2026)
Information Types in Product Reviews
di: Shapira, Ori, et al.
Pubblicazione: (2025)
di: Shapira, Ori, et al.
Pubblicazione: (2025)
A Unifying Scheme for Extractive Content Selection Tasks
di: Amar, Shmuel, et al.
Pubblicazione: (2025)
di: Amar, Shmuel, et al.
Pubblicazione: (2025)
Dicta-LM 3.0: Advancing The Frontier of Hebrew Sovereign LLMs
di: Shmidman, Shaltiel, et al.
Pubblicazione: (2026)
di: Shmidman, Shaltiel, et al.
Pubblicazione: (2026)
Adapting LLMs to Hebrew: Unveiling DictaLM 2.0 with Enhanced Vocabulary and Instruction Capabilities
di: Shmidman, Shaltiel, et al.
Pubblicazione: (2024)
di: Shmidman, Shaltiel, et al.
Pubblicazione: (2024)
HeQ: a Large and Diverse Hebrew Reading Comprehension Benchmark
di: Cohen, Amir DN, et al.
Pubblicazione: (2025)
di: Cohen, Amir DN, et al.
Pubblicazione: (2025)
Diversity Over Quantity: A Lesson From Few Shot Relation Classification
di: Cohen, Amir DN, et al.
Pubblicazione: (2024)
di: Cohen, Amir DN, et al.
Pubblicazione: (2024)
SEAM: A Stochastic Benchmark for Multi-Document Tasks
di: Lior, Gili, et al.
Pubblicazione: (2024)
di: Lior, Gili, et al.
Pubblicazione: (2024)
Quality Matters: Evaluating Synthetic Data for Tool-Using LLMs
di: Iskander, Shadi, et al.
Pubblicazione: (2024)
di: Iskander, Shadi, et al.
Pubblicazione: (2024)
IQ Test for LLMs: An Evaluation Framework for Uncovering Core Skills in LLMs
di: Maimon, Aviya, et al.
Pubblicazione: (2025)
di: Maimon, Aviya, et al.
Pubblicazione: (2025)
Multi-Review Fusion-in-Context
di: Slobodkin, Aviv, et al.
Pubblicazione: (2024)
di: Slobodkin, Aviv, et al.
Pubblicazione: (2024)
HEBATRON: A Hebrew-Specialized Open-Weight Mixture-of-Experts Language Model
di: Kayzer, Noam, et al.
Pubblicazione: (2026)
di: Kayzer, Noam, et al.
Pubblicazione: (2026)
Description-Based Text Similarity
di: Ravfogel, Shauli, et al.
Pubblicazione: (2023)
di: Ravfogel, Shauli, et al.
Pubblicazione: (2023)
Consensus or Conflict? Fine-Grained Evaluation of Conflicting Answers in Question-Answering
di: Nachshoni, Eviatar, et al.
Pubblicazione: (2025)
di: Nachshoni, Eviatar, et al.
Pubblicazione: (2025)
The Power of Summary-Source Alignments
di: Ernst, Ori, et al.
Pubblicazione: (2024)
di: Ernst, Ori, et al.
Pubblicazione: (2024)
The Degree of Language Diacriticity and Its Effect on Tasks
di: Cohen, Adi, et al.
Pubblicazione: (2026)
di: Cohen, Adi, et al.
Pubblicazione: (2026)
Scaling Laws for Downstream Task Performance of Large Language Models
di: Isik, Berivan, et al.
Pubblicazione: (2024)
di: Isik, Berivan, et al.
Pubblicazione: (2024)
Understanding and Mitigating Bias Inheritance in LLM-based Data Augmentation on Downstream Tasks
di: Li, Miaomiao, et al.
Pubblicazione: (2025)
di: Li, Miaomiao, et al.
Pubblicazione: (2025)
Adapting Decoder-Based Language Models for Diverse Encoder Downstream Tasks
di: Suganthan, Paul, et al.
Pubblicazione: (2025)
di: Suganthan, Paul, et al.
Pubblicazione: (2025)
Optimising Language Models for Downstream Tasks: A Post-Training Perspective
di: Shi, Zhengyan
Pubblicazione: (2025)
di: Shi, Zhengyan
Pubblicazione: (2025)
Instability in Downstream Task Performance During LLM Pretraining
di: Nishida, Yuto, et al.
Pubblicazione: (2025)
di: Nishida, Yuto, et al.
Pubblicazione: (2025)
Measuring Hong Kong Massive Multi-Task Language Understanding
di: Cao, Chuxue, et al.
Pubblicazione: (2025)
di: Cao, Chuxue, et al.
Pubblicazione: (2025)
An Evaluation of Sindhi Word Embedding in Semantic Analogies and Downstream Tasks
di: Ali, Wazir, et al.
Pubblicazione: (2024)
di: Ali, Wazir, et al.
Pubblicazione: (2024)
Edit Distances and Their Applications to Downstream Tasks in Research and Commercial Contexts
di: Carmo, Félix do, et al.
Pubblicazione: (2024)
di: Carmo, Félix do, et al.
Pubblicazione: (2024)
Making Retrieval-Augmented Language Models Robust to Irrelevant Context
di: Yoran, Ori, et al.
Pubblicazione: (2023)
di: Yoran, Ori, et al.
Pubblicazione: (2023)
TransformerRanker: A Tool for Efficiently Finding the Best-Suited Language Models for Downstream Classification Tasks
di: Garbas, Lukas, et al.
Pubblicazione: (2024)
di: Garbas, Lukas, et al.
Pubblicazione: (2024)
VocabTailor: Dynamic Vocabulary Selection for Downstream Tasks in Small Language Models
di: Zhang, Hanling, et al.
Pubblicazione: (2025)
di: Zhang, Hanling, et al.
Pubblicazione: (2025)
Applying Intrinsic Debiasing on Downstream Tasks: Challenges and Considerations for Machine Translation
di: Iluz, Bar, et al.
Pubblicazione: (2024)
di: Iluz, Bar, et al.
Pubblicazione: (2024)
Learning to Rewrite Prompts for Bootstrapping LLMs on Downstream Tasks
di: Zhou, Qinhao, et al.
Pubblicazione: (2025)
di: Zhou, Qinhao, et al.
Pubblicazione: (2025)
Donors and Recipients: On Asymmetric Transfer Across Tasks and Languages with Parameter-Efficient Fine-Tuning
di: Dymkiewicz, Kajetan, et al.
Pubblicazione: (2025)
di: Dymkiewicz, Kajetan, et al.
Pubblicazione: (2025)
Scaling Laws Are Unreliable for Downstream Tasks: A Reality Check
di: Lourie, Nicholas, et al.
Pubblicazione: (2025)
di: Lourie, Nicholas, et al.
Pubblicazione: (2025)
Can Character-based Language Models Improve Downstream Task Performance in Low-Resource and Noisy Language Scenarios?
di: Riabi, Arij, et al.
Pubblicazione: (2021)
di: Riabi, Arij, et al.
Pubblicazione: (2021)
DFPE: A Diverse Fingerprint Ensemble for Enhancing LLM Performance
di: Cohen, Seffi, et al.
Pubblicazione: (2025)
di: Cohen, Seffi, et al.
Pubblicazione: (2025)
Forget What You Know about LLMs Evaluations -- LLMs are Like a Chameleon
di: Cohen-Inger, Nurit, et al.
Pubblicazione: (2025)
di: Cohen-Inger, Nurit, et al.
Pubblicazione: (2025)
Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions
di: Liu, Emmy, et al.
Pubblicazione: (2025)
di: Liu, Emmy, et al.
Pubblicazione: (2025)
Understanding and Mitigating the Label Noise in Pre-training on Downstream Tasks
di: Chen, Hao, et al.
Pubblicazione: (2023)
di: Chen, Hao, et al.
Pubblicazione: (2023)
FedEval-LLM: Federated Evaluation of Large Language Models on Downstream Tasks with Collective Wisdom
di: He, Yuanqin, et al.
Pubblicazione: (2024)
di: He, Yuanqin, et al.
Pubblicazione: (2024)
Measuring Bias or Measuring the Task: Understanding the Brittle Nature of LLM Gender Biases
di: Gao, Bufan, et al.
Pubblicazione: (2025)
di: Gao, Bufan, et al.
Pubblicazione: (2025)
CoLA: Cross-Modal Low-rank Adaptation for Multimodal Downstream Tasks
di: Suharitdamrong, Wish, et al.
Pubblicazione: (2026)
di: Suharitdamrong, Wish, et al.
Pubblicazione: (2026)
Spectral or spatial? Leveraging both for speaker extraction in challenging data conditions
di: Eisenberg, Aviad, et al.
Pubblicazione: (2025)
di: Eisenberg, Aviad, et al.
Pubblicazione: (2025)
Documenti analoghi
-
The Overlooked Role of Graded Relevance Thresholds in Multilingual Dense Retrieval
di: Wullach, Tomer, et al.
Pubblicazione: (2026) -
Information Types in Product Reviews
di: Shapira, Ori, et al.
Pubblicazione: (2025) -
A Unifying Scheme for Extractive Content Selection Tasks
di: Amar, Shmuel, et al.
Pubblicazione: (2025) -
Dicta-LM 3.0: Advancing The Frontier of Hebrew Sovereign LLMs
di: Shmidman, Shaltiel, et al.
Pubblicazione: (2026) -
Adapting LLMs to Hebrew: Unveiling DictaLM 2.0 with Enhanced Vocabulary and Instruction Capabilities
di: Shmidman, Shaltiel, et al.
Pubblicazione: (2024)