Enregistré dans:
| Auteurs principaux: | Bhattarai, Kriti, Keloth, Vipina K., Wright, Donald, Loza, Andrew, Ren, Yang, Xu, Hua |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2601.12632 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
MedHopQA: A Disease-Centered Multi-Hop Reasoning Benchmark and Evaluation Framework for LLM-Based Biomedical Question Answering
par: Islamaj, Rezarta, et autres
Publié: (2026)
par: Islamaj, Rezarta, et autres
Publié: (2026)
MizanQA: Benchmarking Large Language Models on Moroccan Legal Question Answering
par: Bahaj, Adil, et autres
Publié: (2025)
par: Bahaj, Adil, et autres
Publié: (2025)
ASTRA-QA: A Benchmark for Abstract Question Answering over Documents
par: Wang, Shu, et autres
Publié: (2026)
par: Wang, Shu, et autres
Publié: (2026)
Overview of BioASQ 2025: The Thirteenth BioASQ Challenge on Large-Scale Biomedical Semantic Indexing and Question Answering
par: Nentidis, Anastasios, et autres
Publié: (2025)
par: Nentidis, Anastasios, et autres
Publié: (2025)
Overview of BioASQ 2024: The twelfth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering
par: Nentidis, Anastasios, et autres
Publié: (2025)
par: Nentidis, Anastasios, et autres
Publié: (2025)
Overview of BioASQ 2022: The tenth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering
par: Nentidis, Anastasios, et autres
Publié: (2022)
par: Nentidis, Anastasios, et autres
Publié: (2022)
HCT-QA: A Benchmark for Question Answering on Human-Centric Tables
par: Ahmad, Mohammad S., et autres
Publié: (2025)
par: Ahmad, Mohammad S., et autres
Publié: (2025)
Jamendo-MT-QA: A Benchmark for Multi-Track Comparative Music Question Answering
par: Koh, Junyoung, et autres
Publié: (2026)
par: Koh, Junyoung, et autres
Publié: (2026)
SyllabusQA: A Course Logistics Question Answering Dataset
par: Fernandez, Nigel, et autres
Publié: (2024)
par: Fernandez, Nigel, et autres
Publié: (2024)
LaMP-QA: A Benchmark for Personalized Long-form Question Answering
par: Salemi, Alireza, et autres
Publié: (2025)
par: Salemi, Alireza, et autres
Publié: (2025)
Evaluating Robustness of Generative Search Engine on Adversarial Factual Questions
par: Hu, Xuming, et autres
Publié: (2024)
par: Hu, Xuming, et autres
Publié: (2024)
ArabicaQA: A Comprehensive Dataset for Arabic Question Answering
par: Abdallah, Abdelrahman, et autres
Publié: (2024)
par: Abdallah, Abdelrahman, et autres
Publié: (2024)
KG20C & KG20C-QA: Scholarly Knowledge Graph Benchmarks for Link Prediction and Question Answering
par: Tran, Hung-Nghiep, et autres
Publié: (2025)
par: Tran, Hung-Nghiep, et autres
Publié: (2025)
IRB: Automated Generation of Robust Factuality Benchmarks
par: Do, Lam Thanh, et autres
Publié: (2026)
par: Do, Lam Thanh, et autres
Publié: (2026)
FabricQA-Extractor: A Question Answering System to Extract Information from Documents using Natural Language Questions
par: Wang, Qiming, et autres
Publié: (2024)
par: Wang, Qiming, et autres
Publié: (2024)
OpenLifelogQA: An Open-Ended Multi-Modal Lifelog Question-Answering Dataset
par: Tran, Quang-Linh, et autres
Publié: (2025)
par: Tran, Quang-Linh, et autres
Publié: (2025)
SustainableQA: A Comprehensive Question Answering Dataset for Corporate Sustainability and EU Taxonomy Reporting
par: Ali, Mohammed, et autres
Publié: (2025)
par: Ali, Mohammed, et autres
Publié: (2025)
MapQA: Open-domain Geospatial Question Answering on Map Data
par: Li, Zekun, et autres
Publié: (2025)
par: Li, Zekun, et autres
Publié: (2025)
NeuroSym-BioCAT: Leveraging Neuro-Symbolic Methods for Biomedical Scholarly Document Categorization and Question Answering
par: Zamil, Parvez, et autres
Publié: (2024)
par: Zamil, Parvez, et autres
Publié: (2024)
LLM-MedQA: Enhancing Medical Question Answering through Case Studies in Large Language Models
par: Yang, Hang, et autres
Publié: (2024)
par: Yang, Hang, et autres
Publié: (2024)
DragonVerseQA: Open-Domain Long-Form Context-Aware Question-Answering
par: Lahiri, Aritra Kumar, et autres
Publié: (2024)
par: Lahiri, Aritra Kumar, et autres
Publié: (2024)
Fact or Facsimile? Evaluating the Factual Robustness of Modern Retrievers
par: Wu, Haoyu, et autres
Publié: (2025)
par: Wu, Haoyu, et autres
Publié: (2025)
Answer Retrieval in Legal Community Question Answering
par: Askari, Arian, et autres
Publié: (2024)
par: Askari, Arian, et autres
Publié: (2024)
PeerQA: A Scientific Question Answering Dataset from Peer Reviews
par: Baumgärtner, Tim, et autres
Publié: (2025)
par: Baumgärtner, Tim, et autres
Publié: (2025)
Evaluating Search Engines and Large Language Models for Answering Health Questions
par: Fernández-Pichel, Marcos, et autres
Publié: (2024)
par: Fernández-Pichel, Marcos, et autres
Publié: (2024)
Efficient and Reproducible Biomedical Question Answering using Retrieval Augmented Generation
par: Stuhlmann, Linus, et autres
Publié: (2025)
par: Stuhlmann, Linus, et autres
Publié: (2025)
Towards Robust Expert Finding in Community Question Answering Platforms
par: Amendola, Maddalena, et autres
Publié: (2025)
par: Amendola, Maddalena, et autres
Publié: (2025)
MedTrust-RAG: Evidence Verification and Trust Alignment for Biomedical Question Answering
par: Ning, Yingpeng, et autres
Publié: (2025)
par: Ning, Yingpeng, et autres
Publié: (2025)
An Empirical Study of Evaluating Long-form Question Answering
par: Xian, Ning, et autres
Publié: (2025)
par: Xian, Ning, et autres
Publié: (2025)
Evaluating Position Bias in Large Language Model Recommendations
par: Bito, Ethan, et autres
Publié: (2025)
par: Bito, Ethan, et autres
Publié: (2025)
Optimizing Question Semantic Space for Dynamic Retrieval-Augmented Multi-hop Question Answering
par: Ye, Linhao, et autres
Publié: (2025)
par: Ye, Linhao, et autres
Publié: (2025)
Are Smaller Open-Weight LLMs Closing the Gap to Proprietary Models for Biomedical Question Answering?
par: Stachura, Damian, et autres
Publié: (2025)
par: Stachura, Damian, et autres
Publié: (2025)
VerifAI: A Verifiable Open-Source Search Engine for Biomedical Question Answering
par: Košprdić, Miloš, et autres
Publié: (2026)
par: Košprdić, Miloš, et autres
Publié: (2026)
Biomedical Question Answering via Multi-Level Summarization on a Local Knowledge Graph
par: Guan, Lingxiao, et autres
Publié: (2025)
par: Guan, Lingxiao, et autres
Publié: (2025)
Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation
par: Ren, Ruiyang, et autres
Publié: (2023)
par: Ren, Ruiyang, et autres
Publié: (2023)
PARSE: An Open-Domain Reasoning Question Answering Benchmark for Persian
par: Mozafari, Jamshid, et autres
Publié: (2026)
par: Mozafari, Jamshid, et autres
Publié: (2026)
Evaluating Multimodal Large Language Models on Educational Textbook Question Answering
par: Alawwad, Hessa A., et autres
Publié: (2025)
par: Alawwad, Hessa A., et autres
Publié: (2025)
Generate-then-Ground in Retrieval-Augmented Generation for Multi-hop Question Answering
par: Shi, Zhengliang, et autres
Publié: (2024)
par: Shi, Zhengliang, et autres
Publié: (2024)
UQABench: Evaluating User Embedding for Prompting LLMs in Personalized Question Answering
par: Liu, Langming, et autres
Publié: (2025)
par: Liu, Langming, et autres
Publié: (2025)
Evaluating Large Language Models in Semantic Parsing for Conversational Question Answering over Knowledge Graphs
par: Schneider, Phillip, et autres
Publié: (2024)
par: Schneider, Phillip, et autres
Publié: (2024)
Documents similaires
-
MedHopQA: A Disease-Centered Multi-Hop Reasoning Benchmark and Evaluation Framework for LLM-Based Biomedical Question Answering
par: Islamaj, Rezarta, et autres
Publié: (2026) -
MizanQA: Benchmarking Large Language Models on Moroccan Legal Question Answering
par: Bahaj, Adil, et autres
Publié: (2025) -
ASTRA-QA: A Benchmark for Abstract Question Answering over Documents
par: Wang, Shu, et autres
Publié: (2026) -
Overview of BioASQ 2025: The Thirteenth BioASQ Challenge on Large-Scale Biomedical Semantic Indexing and Question Answering
par: Nentidis, Anastasios, et autres
Publié: (2025) -
Overview of BioASQ 2024: The twelfth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering
par: Nentidis, Anastasios, et autres
Publié: (2025)