Salvato in:
| Autori principali: | Ahuja, Naman, Bardoliya, Fenil, Baral, Chitta, Gupta, Vivek |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2505.23174 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
SPORTSQL: An Interactive System for Real-Time Sports Reasoning and Visualization
di: Martinez, Sebastian, et al.
Pubblicazione: (2025)
di: Martinez, Sebastian, et al.
Pubblicazione: (2025)
The Perceptual Observatory Characterizing Robustness and Grounding in MLLMs
di: Anvekar, Tejas, et al.
Pubblicazione: (2025)
di: Anvekar, Tejas, et al.
Pubblicazione: (2025)
Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives
di: Upadhyay, Ritam, et al.
Pubblicazione: (2025)
di: Upadhyay, Ritam, et al.
Pubblicazione: (2025)
GETReason: Enhancing Image Context Extraction through Hierarchical Multi-Agent Reasoning
di: Siingh, Shikhhar, et al.
Pubblicazione: (2025)
di: Siingh, Shikhhar, et al.
Pubblicazione: (2025)
Rethinking Information Synthesis in Multimodal Question Answering A Multi-Agent Perspective
di: Rajput, Krishna Singh, et al.
Pubblicazione: (2025)
di: Rajput, Krishna Singh, et al.
Pubblicazione: (2025)
ViTaB-A: Evaluating Multimodal Large Language Models on Visual Table Attribution
di: Alqurnawi, Yahia, et al.
Pubblicazione: (2026)
di: Alqurnawi, Yahia, et al.
Pubblicazione: (2026)
UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification
di: Ganesan, Poojah, et al.
Pubblicazione: (2025)
di: Ganesan, Poojah, et al.
Pubblicazione: (2025)
TextInVision: Text and Prompt Complexity Driven Visual Text Generation Benchmark
di: Fallah, Forouzan, et al.
Pubblicazione: (2025)
di: Fallah, Forouzan, et al.
Pubblicazione: (2025)
Evidence-Guided Schema Normalization for Temporal Tabular Reasoning
di: Thanga, Ashish, et al.
Pubblicazione: (2025)
di: Thanga, Ashish, et al.
Pubblicazione: (2025)
$λ$-ECLIPSE: Multi-Concept Personalized Text-to-Image Diffusion Models by Leveraging CLIP Latent Space
di: Patel, Maitreya, et al.
Pubblicazione: (2024)
di: Patel, Maitreya, et al.
Pubblicazione: (2024)
ConceptBed: Evaluating Concept Learning Abilities of Text-to-Image Diffusion Models
di: Patel, Maitreya, et al.
Pubblicazione: (2023)
di: Patel, Maitreya, et al.
Pubblicazione: (2023)
Hypothesis Generation for Materials Discovery and Design Using Goal-Driven and Constraint-Guided LLM Agents
di: Kumbhar, Shrinidhi, et al.
Pubblicazione: (2025)
di: Kumbhar, Shrinidhi, et al.
Pubblicazione: (2025)
MMTABREAL: Real-World Benchmark for Multimodal Table Understanding
di: Titiya, Prasham, et al.
Pubblicazione: (2025)
di: Titiya, Prasham, et al.
Pubblicazione: (2025)
Cutting Through the Noise: Boosting LLM Performance on Math Word Problems
di: Anantheswaran, Ujjwala, et al.
Pubblicazione: (2024)
di: Anantheswaran, Ujjwala, et al.
Pubblicazione: (2024)
The Art of Defending: A Systematic Evaluation and Analysis of LLM Defense Strategies on Safety and Over-Defensiveness
di: Varshney, Neeraj, et al.
Pubblicazione: (2023)
di: Varshney, Neeraj, et al.
Pubblicazione: (2023)
Test-Time Scaling with Repeated Sampling Improves Multilingual Text Generation
di: Gupta, Ashim, et al.
Pubblicazione: (2025)
di: Gupta, Ashim, et al.
Pubblicazione: (2025)
Insights into Alignment: Evaluating DPO and its Variants Across Multiple Tasks
di: Saeidi, Amir, et al.
Pubblicazione: (2024)
di: Saeidi, Amir, et al.
Pubblicazione: (2024)
TarGEN: Targeted Data Generation with Large Language Models
di: Gupta, Himanshu, et al.
Pubblicazione: (2023)
di: Gupta, Himanshu, et al.
Pubblicazione: (2023)
All You Need is "Leet": Evading Hate-speech Detection AI
di: Kahu, Sampanna Yashwant, et al.
Pubblicazione: (2025)
di: Kahu, Sampanna Yashwant, et al.
Pubblicazione: (2025)
Triple Preference Optimization: Achieving Better Alignment using a Single Step Optimization
di: Saeidi, Amir, et al.
Pubblicazione: (2024)
di: Saeidi, Amir, et al.
Pubblicazione: (2024)
Don't Blame the Annotator: Bias Already Starts in the Annotation Instructions
di: Parmar, Mihir, et al.
Pubblicazione: (2022)
di: Parmar, Mihir, et al.
Pubblicazione: (2022)
Polymath: A Challenging Multi-modal Mathematical Reasoning Benchmark
di: Gupta, Himanshu, et al.
Pubblicazione: (2024)
di: Gupta, Himanshu, et al.
Pubblicazione: (2024)
Lost in Translation? Translation Errors and Challenges for Fair Assessment of Text-to-Image Models on Multilingual Concepts
di: Saxon, Michael, et al.
Pubblicazione: (2024)
di: Saxon, Michael, et al.
Pubblicazione: (2024)
Chaos with Keywords: Exposing Large Language Models Sycophantic Hallucination to Misleading Keywords and Evaluating Defense Strategies
di: RRV, Aswin, et al.
Pubblicazione: (2024)
di: RRV, Aswin, et al.
Pubblicazione: (2024)
From Recall to Forgetting: Benchmarking Long-Term Memory for Personalized Agents
di: Uddin, Md Nayem, et al.
Pubblicazione: (2026)
di: Uddin, Md Nayem, et al.
Pubblicazione: (2026)
Federated Retrieval-Augmented Generation: A Systematic Mapping Study
di: Chakraborty, Abhijit, et al.
Pubblicazione: (2025)
di: Chakraborty, Abhijit, et al.
Pubblicazione: (2025)
EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews
di: Ahuja, Naman, et al.
Pubblicazione: (2026)
di: Ahuja, Naman, et al.
Pubblicazione: (2026)
PHANTOM RECALL: When Familiar Puzzles Fool Smart Models
di: Mukhopadhyay, Souradeep, et al.
Pubblicazione: (2025)
di: Mukhopadhyay, Souradeep, et al.
Pubblicazione: (2025)
CORE-T: COherent REtrieval of Tables for Text-to-SQL
di: Soliman, Hassan, et al.
Pubblicazione: (2026)
di: Soliman, Hassan, et al.
Pubblicazione: (2026)
Investigating and Addressing Hallucinations of LLMs in Tasks Involving Negation
di: Varshney, Neeraj, et al.
Pubblicazione: (2024)
di: Varshney, Neeraj, et al.
Pubblicazione: (2024)
FAMA: Failure-Aware Meta-Agentic Framework for Open-Source LLMs in Interactive Tool Use Environments
di: Saeidi, Amir, et al.
Pubblicazione: (2026)
di: Saeidi, Amir, et al.
Pubblicazione: (2026)
Investigating VLM Hallucination from a Cognitive Psychology Perspective: A First Step Toward Interpretation with Intriguing Observations
di: Liu, Xiangrui, et al.
Pubblicazione: (2025)
di: Liu, Xiangrui, et al.
Pubblicazione: (2025)
RSL-SQL: Robust Schema Linking in Text-to-SQL Generation
di: Cao, Zhenbiao, et al.
Pubblicazione: (2024)
di: Cao, Zhenbiao, et al.
Pubblicazione: (2024)
AutoLink: Autonomous Schema Exploration and Expansion for Scalable Schema Linking in Text-to-SQL at Scale
di: Wang, Ziyang, et al.
Pubblicazione: (2025)
di: Wang, Ziyang, et al.
Pubblicazione: (2025)
Extractive Schema Linking for Text-to-SQL
di: Glass, Michael, et al.
Pubblicazione: (2025)
di: Glass, Michael, et al.
Pubblicazione: (2025)
TripletCLIP: Improving Compositional Reasoning of CLIP via Synthetic Vision-Language Negatives
di: Patel, Maitreya, et al.
Pubblicazione: (2024)
di: Patel, Maitreya, et al.
Pubblicazione: (2024)
Knapsack Optimization-based Schema Linking for LLM-based Text-to-SQL Generation
di: Yuan, Zheng, et al.
Pubblicazione: (2025)
di: Yuan, Zheng, et al.
Pubblicazione: (2025)
EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution
di: Zhang, Tianshu, et al.
Pubblicazione: (2026)
di: Zhang, Tianshu, et al.
Pubblicazione: (2026)
Multi-LogiEval: Towards Evaluating Multi-Step Logical Reasoning Ability of Large Language Models
di: Patel, Nisarg, et al.
Pubblicazione: (2024)
di: Patel, Nisarg, et al.
Pubblicazione: (2024)
CREST: Universal Safety Guardrails Through Cluster-Guided Cross-Lingual Transfer
di: Bansal, Lavish, et al.
Pubblicazione: (2025)
di: Bansal, Lavish, et al.
Pubblicazione: (2025)
Documenti analoghi
-
SPORTSQL: An Interactive System for Real-Time Sports Reasoning and Visualization
di: Martinez, Sebastian, et al.
Pubblicazione: (2025) -
The Perceptual Observatory Characterizing Robustness and Grounding in MLLMs
di: Anvekar, Tejas, et al.
Pubblicazione: (2025) -
Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives
di: Upadhyay, Ritam, et al.
Pubblicazione: (2025) -
GETReason: Enhancing Image Context Extraction through Hierarchical Multi-Agent Reasoning
di: Siingh, Shikhhar, et al.
Pubblicazione: (2025) -
Rethinking Information Synthesis in Multimodal Question Answering A Multi-Agent Perspective
di: Rajput, Krishna Singh, et al.
Pubblicazione: (2025)