:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Martinez, Sebastian, Ahuja, Naman, Bardoliya, Fenil, Bryan, Chris, Gupta, Vivek
Format:	Preprint
Publié:	2025
Sujets:	Computation and Language
Accès en ligne:	https://arxiv.org/abs/2508.17157
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Map&Make: Schema Guided Text to Table Generation
par: Ahuja, Naman, et autres
Publié: (2025)

Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives
par: Upadhyay, Ritam, et autres
Publié: (2025)

The Perceptual Observatory Characterizing Robustness and Grounding in MLLMs
par: Anvekar, Tejas, et autres
Publié: (2025)

EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews
par: Ahuja, Naman, et autres
Publié: (2026)

All You Need is "Leet": Evading Hate-speech Detection AI
par: Kahu, Sampanna Yashwant, et autres
Publié: (2025)

Test-Time Scaling with Repeated Sampling Improves Multilingual Text Generation
par: Gupta, Ashim, et autres
Publié: (2025)

LLM-Symbolic Integration for Robust Temporal Tabular Reasoning
par: Kulkarni, Atharv, et autres
Publié: (2025)

EfficientXLang: Towards Improving Token Efficiency Through Cross-Lingual Reasoning
par: Ahuja, Sanchit, et autres
Publié: (2025)

Evaluating LLMs' Mathematical Reasoning in Financial Document Question Answering
par: Srivastava, Pragya, et autres
Publié: (2024)

GETReason: Enhancing Image Context Extraction through Hierarchical Multi-Agent Reasoning
par: Siingh, Shikhhar, et autres
Publié: (2025)

Finding Flawed Fictions: Evaluating Complex Reasoning in Language Models via Plot Hole Detection
par: Ahuja, Kabir, et autres
Publié: (2025)

DRAGON: A Benchmark for Evidence-Grounded Visual Reasoning over Diagrams
par: Iyengar, Anirudh Iyengar Kaniyar Narayana, et autres
Publié: (2026)

Evidence-Guided Schema Normalization for Temporal Tabular Reasoning
par: Thanga, Ashish, et autres
Publié: (2025)

DeALOG: Decentralized Multi-Agents Log-Mediated Reasoning Framework
par: Chakraborty, Abhijit, et autres
Publié: (2026)

No Universal Prompt: Unifying Reasoning through Adaptive Prompting for Temporal Table Reasoning
par: Rajgaria, Abhishek, et autres
Publié: (2025)

Chow-Liu Ordering for Long-Context Reasoning in Chain-of-Agents
par: Gupta, Naman, et autres
Publié: (2026)

NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models
par: Pandya, Pranshu, et autres
Publié: (2024)

QUIETT: Query-Independent Table Transformation for Robust Reasoning
par: Najpande, Gaurav, et autres
Publié: (2026)

ViTaB-A: Evaluating Multimodal Large Language Models on Visual Table Attribution
par: Alqurnawi, Yahia, et autres
Publié: (2026)

TransientTables: Evaluating LLMs' Reasoning on Temporally Evolving Semi-structured Tables
par: Shankarampeta, Abhilash, et autres
Publié: (2025)

ChartCheck: Explainable Fact-Checking over Real-World Chart Images
par: Akhtar, Mubashara, et autres
Publié: (2023)

A comprehensive study of on-device NLP applications -- VQA, automated Form filling, Smart Replies for Linguistic Codeswitching
par: Goyal, Naman
Publié: (2024)

Uncertainty-Aware Budget Allocation for Adaptive Test-Time Reasoning
par: Nguyen, Manh, et autres
Publié: (2026)

On The Truthfulness of 'Surprisingly Likely' Responses of Large Language Models
par: Goel, Naman
Publié: (2023)

H-STAR: LLM-driven Hybrid SQL-Text Adaptive Reasoning on Tables
par: Abhyankar, Nikhil, et autres
Publié: (2024)

RiverEcho: Real-Time Interactive Digital System for Ancient Yellow River Culture
par: Wang, Haofeng, et autres
Publié: (2025)

FlowVQA: Mapping Multimodal Logic in Visual Question Answering with Flowcharts
par: Singh, Shubhankar, et autres
Publié: (2024)

Parameter Alignment Mitigates Catastrophic Forgetting in Multilingual Expert Language Models
par: Ahuja, Sanchit, et autres
Publié: (2026)

Failure Modes of LLMs for Causal Reasoning on Narratives
par: Yamin, Khurram, et autres
Publié: (2024)

Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks
par: Zhang, Wenqi, et autres
Publié: (2025)

M-HELP: Using Social Media Data to Detect Mental Health Help-Seeking Signals
par: Sathvik, MSVPJ, et autres
Publié: (2025)

Rank-K: Test-Time Reasoning for Listwise Reranking
par: Yang, Eugene, et autres
Publié: (2025)

Modeling Real-Time Interactive Conversations as Timed Diarized Transcripts
par: Tanzer, Garrett, et autres
Publié: (2024)

CREST: Universal Safety Guardrails Through Cluster-Guided Cross-Lingual Transfer
par: Bansal, Lavish, et autres
Publié: (2025)

Automatic Summarization of Long Documents
par: Chhibbar, Naman, et autres
Publié: (2024)

Federated Retrieval-Augmented Generation: A Systematic Mapping Study
par: Chakraborty, Abhijit, et autres
Publié: (2025)

Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability
par: Sundaram, Shobhita, et autres
Publié: (2026)

Integrity Shield A System for Ethical AI Use & Authorship Transparency in Assessments
par: Shekhar, Ashish Raj, et autres
Publié: (2026)

InterChart: Benchmarking Visual Reasoning Across Decomposed and Distributed Chart Information
par: Iyengar, Anirudh Iyengar Kaniyar Narayana, et autres
Publié: (2025)

Found in Translation: Measuring Multilingual LLM Consistency as Simple as Translate then Evaluate
par: Gupta, Ashim, et autres
Publié: (2025)