:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Bhattarai, Kriti, Keloth, Vipina K., Wright, Donald, Loza, Andrew, Ren, Yang, Xu, Hua
Format:	Preprint
Publié:	2026
Sujets:	Computation and Language Information Retrieval
Accès en ligne:	https://arxiv.org/abs/2601.12632
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

MedHopQA: A Disease-Centered Multi-Hop Reasoning Benchmark and Evaluation Framework for LLM-Based Biomedical Question Answering
par: Islamaj, Rezarta, et autres
Publié: (2026)

MizanQA: Benchmarking Large Language Models on Moroccan Legal Question Answering
par: Bahaj, Adil, et autres
Publié: (2025)

ASTRA-QA: A Benchmark for Abstract Question Answering over Documents
par: Wang, Shu, et autres
Publié: (2026)

Overview of BioASQ 2025: The Thirteenth BioASQ Challenge on Large-Scale Biomedical Semantic Indexing and Question Answering
par: Nentidis, Anastasios, et autres
Publié: (2025)

Overview of BioASQ 2024: The twelfth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering
par: Nentidis, Anastasios, et autres
Publié: (2025)

Overview of BioASQ 2022: The tenth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering
par: Nentidis, Anastasios, et autres
Publié: (2022)

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables
par: Ahmad, Mohammad S., et autres
Publié: (2025)

Jamendo-MT-QA: A Benchmark for Multi-Track Comparative Music Question Answering
par: Koh, Junyoung, et autres
Publié: (2026)

SyllabusQA: A Course Logistics Question Answering Dataset
par: Fernandez, Nigel, et autres
Publié: (2024)

LaMP-QA: A Benchmark for Personalized Long-form Question Answering
par: Salemi, Alireza, et autres
Publié: (2025)

Evaluating Robustness of Generative Search Engine on Adversarial Factual Questions
par: Hu, Xuming, et autres
Publié: (2024)

ArabicaQA: A Comprehensive Dataset for Arabic Question Answering
par: Abdallah, Abdelrahman, et autres
Publié: (2024)

KG20C & KG20C-QA: Scholarly Knowledge Graph Benchmarks for Link Prediction and Question Answering
par: Tran, Hung-Nghiep, et autres
Publié: (2025)

IRB: Automated Generation of Robust Factuality Benchmarks
par: Do, Lam Thanh, et autres
Publié: (2026)

FabricQA-Extractor: A Question Answering System to Extract Information from Documents using Natural Language Questions
par: Wang, Qiming, et autres
Publié: (2024)

OpenLifelogQA: An Open-Ended Multi-Modal Lifelog Question-Answering Dataset
par: Tran, Quang-Linh, et autres
Publié: (2025)

SustainableQA: A Comprehensive Question Answering Dataset for Corporate Sustainability and EU Taxonomy Reporting
par: Ali, Mohammed, et autres
Publié: (2025)

MapQA: Open-domain Geospatial Question Answering on Map Data
par: Li, Zekun, et autres
Publié: (2025)

NeuroSym-BioCAT: Leveraging Neuro-Symbolic Methods for Biomedical Scholarly Document Categorization and Question Answering
par: Zamil, Parvez, et autres
Publié: (2024)

LLM-MedQA: Enhancing Medical Question Answering through Case Studies in Large Language Models
par: Yang, Hang, et autres
Publié: (2024)

DragonVerseQA: Open-Domain Long-Form Context-Aware Question-Answering
par: Lahiri, Aritra Kumar, et autres
Publié: (2024)

Fact or Facsimile? Evaluating the Factual Robustness of Modern Retrievers
par: Wu, Haoyu, et autres
Publié: (2025)

Answer Retrieval in Legal Community Question Answering
par: Askari, Arian, et autres
Publié: (2024)

PeerQA: A Scientific Question Answering Dataset from Peer Reviews
par: Baumgärtner, Tim, et autres
Publié: (2025)

Evaluating Search Engines and Large Language Models for Answering Health Questions
par: Fernández-Pichel, Marcos, et autres
Publié: (2024)

Efficient and Reproducible Biomedical Question Answering using Retrieval Augmented Generation
par: Stuhlmann, Linus, et autres
Publié: (2025)

Towards Robust Expert Finding in Community Question Answering Platforms
par: Amendola, Maddalena, et autres
Publié: (2025)

MedTrust-RAG: Evidence Verification and Trust Alignment for Biomedical Question Answering
par: Ning, Yingpeng, et autres
Publié: (2025)

An Empirical Study of Evaluating Long-form Question Answering
par: Xian, Ning, et autres
Publié: (2025)

Evaluating Position Bias in Large Language Model Recommendations
par: Bito, Ethan, et autres
Publié: (2025)

Optimizing Question Semantic Space for Dynamic Retrieval-Augmented Multi-hop Question Answering
par: Ye, Linhao, et autres
Publié: (2025)

Are Smaller Open-Weight LLMs Closing the Gap to Proprietary Models for Biomedical Question Answering?
par: Stachura, Damian, et autres
Publié: (2025)

VerifAI: A Verifiable Open-Source Search Engine for Biomedical Question Answering
par: Košprdić, Miloš, et autres
Publié: (2026)

Biomedical Question Answering via Multi-Level Summarization on a Local Knowledge Graph
par: Guan, Lingxiao, et autres
Publié: (2025)

Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation
par: Ren, Ruiyang, et autres
Publié: (2023)

PARSE: An Open-Domain Reasoning Question Answering Benchmark for Persian
par: Mozafari, Jamshid, et autres
Publié: (2026)

Evaluating Multimodal Large Language Models on Educational Textbook Question Answering
par: Alawwad, Hessa A., et autres
Publié: (2025)

Generate-then-Ground in Retrieval-Augmented Generation for Multi-hop Question Answering
par: Shi, Zhengliang, et autres
Publié: (2024)

UQABench: Evaluating User Embedding for Prompting LLMs in Personalized Question Answering
par: Liu, Langming, et autres
Publié: (2025)

Evaluating Large Language Models in Semantic Parsing for Conversational Question Answering over Knowledge Graphs
par: Schneider, Phillip, et autres
Publié: (2024)