:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Ahuja, Naman, Bardoliya, Fenil, Baral, Chitta, Gupta, Vivek
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computation and Language
Accesso online:	https://arxiv.org/abs/2505.23174
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

SPORTSQL: An Interactive System for Real-Time Sports Reasoning and Visualization
di: Martinez, Sebastian, et al.
Pubblicazione: (2025)

The Perceptual Observatory Characterizing Robustness and Grounding in MLLMs
di: Anvekar, Tejas, et al.
Pubblicazione: (2025)

Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives
di: Upadhyay, Ritam, et al.
Pubblicazione: (2025)

GETReason: Enhancing Image Context Extraction through Hierarchical Multi-Agent Reasoning
di: Siingh, Shikhhar, et al.
Pubblicazione: (2025)

Rethinking Information Synthesis in Multimodal Question Answering A Multi-Agent Perspective
di: Rajput, Krishna Singh, et al.
Pubblicazione: (2025)

ViTaB-A: Evaluating Multimodal Large Language Models on Visual Table Attribution
di: Alqurnawi, Yahia, et al.
Pubblicazione: (2026)

UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification
di: Ganesan, Poojah, et al.
Pubblicazione: (2025)

TextInVision: Text and Prompt Complexity Driven Visual Text Generation Benchmark
di: Fallah, Forouzan, et al.
Pubblicazione: (2025)

Evidence-Guided Schema Normalization for Temporal Tabular Reasoning
di: Thanga, Ashish, et al.
Pubblicazione: (2025)

$λ$-ECLIPSE: Multi-Concept Personalized Text-to-Image Diffusion Models by Leveraging CLIP Latent Space
di: Patel, Maitreya, et al.
Pubblicazione: (2024)

ConceptBed: Evaluating Concept Learning Abilities of Text-to-Image Diffusion Models
di: Patel, Maitreya, et al.
Pubblicazione: (2023)

Hypothesis Generation for Materials Discovery and Design Using Goal-Driven and Constraint-Guided LLM Agents
di: Kumbhar, Shrinidhi, et al.
Pubblicazione: (2025)

MMTABREAL: Real-World Benchmark for Multimodal Table Understanding
di: Titiya, Prasham, et al.
Pubblicazione: (2025)

Cutting Through the Noise: Boosting LLM Performance on Math Word Problems
di: Anantheswaran, Ujjwala, et al.
Pubblicazione: (2024)

The Art of Defending: A Systematic Evaluation and Analysis of LLM Defense Strategies on Safety and Over-Defensiveness
di: Varshney, Neeraj, et al.
Pubblicazione: (2023)

Test-Time Scaling with Repeated Sampling Improves Multilingual Text Generation
di: Gupta, Ashim, et al.
Pubblicazione: (2025)

Insights into Alignment: Evaluating DPO and its Variants Across Multiple Tasks
di: Saeidi, Amir, et al.
Pubblicazione: (2024)

TarGEN: Targeted Data Generation with Large Language Models
di: Gupta, Himanshu, et al.
Pubblicazione: (2023)

All You Need is "Leet": Evading Hate-speech Detection AI
di: Kahu, Sampanna Yashwant, et al.
Pubblicazione: (2025)

Triple Preference Optimization: Achieving Better Alignment using a Single Step Optimization
di: Saeidi, Amir, et al.
Pubblicazione: (2024)

Don't Blame the Annotator: Bias Already Starts in the Annotation Instructions
di: Parmar, Mihir, et al.
Pubblicazione: (2022)

Polymath: A Challenging Multi-modal Mathematical Reasoning Benchmark
di: Gupta, Himanshu, et al.
Pubblicazione: (2024)

Lost in Translation? Translation Errors and Challenges for Fair Assessment of Text-to-Image Models on Multilingual Concepts
di: Saxon, Michael, et al.
Pubblicazione: (2024)

Chaos with Keywords: Exposing Large Language Models Sycophantic Hallucination to Misleading Keywords and Evaluating Defense Strategies
di: RRV, Aswin, et al.
Pubblicazione: (2024)

From Recall to Forgetting: Benchmarking Long-Term Memory for Personalized Agents
di: Uddin, Md Nayem, et al.
Pubblicazione: (2026)

Federated Retrieval-Augmented Generation: A Systematic Mapping Study
di: Chakraborty, Abhijit, et al.
Pubblicazione: (2025)

EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews
di: Ahuja, Naman, et al.
Pubblicazione: (2026)

PHANTOM RECALL: When Familiar Puzzles Fool Smart Models
di: Mukhopadhyay, Souradeep, et al.
Pubblicazione: (2025)

CORE-T: COherent REtrieval of Tables for Text-to-SQL
di: Soliman, Hassan, et al.
Pubblicazione: (2026)

Investigating and Addressing Hallucinations of LLMs in Tasks Involving Negation
di: Varshney, Neeraj, et al.
Pubblicazione: (2024)

FAMA: Failure-Aware Meta-Agentic Framework for Open-Source LLMs in Interactive Tool Use Environments
di: Saeidi, Amir, et al.
Pubblicazione: (2026)

Investigating VLM Hallucination from a Cognitive Psychology Perspective: A First Step Toward Interpretation with Intriguing Observations
di: Liu, Xiangrui, et al.
Pubblicazione: (2025)

RSL-SQL: Robust Schema Linking in Text-to-SQL Generation
di: Cao, Zhenbiao, et al.
Pubblicazione: (2024)

AutoLink: Autonomous Schema Exploration and Expansion for Scalable Schema Linking in Text-to-SQL at Scale
di: Wang, Ziyang, et al.
Pubblicazione: (2025)

Extractive Schema Linking for Text-to-SQL
di: Glass, Michael, et al.
Pubblicazione: (2025)

TripletCLIP: Improving Compositional Reasoning of CLIP via Synthetic Vision-Language Negatives
di: Patel, Maitreya, et al.
Pubblicazione: (2024)

Knapsack Optimization-based Schema Linking for LLM-based Text-to-SQL Generation
di: Yuan, Zheng, et al.
Pubblicazione: (2025)

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution
di: Zhang, Tianshu, et al.
Pubblicazione: (2026)

Multi-LogiEval: Towards Evaluating Multi-Step Logical Reasoning Ability of Large Language Models
di: Patel, Nisarg, et al.
Pubblicazione: (2024)

CREST: Universal Safety Guardrails Through Cluster-Guided Cross-Lingual Transfer
di: Bansal, Lavish, et al.
Pubblicazione: (2025)