Enregistré dans:
| Auteurs principaux: | Martinez, Sebastian, Ahuja, Naman, Bardoliya, Fenil, Bryan, Chris, Gupta, Vivek |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.17157 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Map&Make: Schema Guided Text to Table Generation
par: Ahuja, Naman, et autres
Publié: (2025)
par: Ahuja, Naman, et autres
Publié: (2025)
Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives
par: Upadhyay, Ritam, et autres
Publié: (2025)
par: Upadhyay, Ritam, et autres
Publié: (2025)
The Perceptual Observatory Characterizing Robustness and Grounding in MLLMs
par: Anvekar, Tejas, et autres
Publié: (2025)
par: Anvekar, Tejas, et autres
Publié: (2025)
EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews
par: Ahuja, Naman, et autres
Publié: (2026)
par: Ahuja, Naman, et autres
Publié: (2026)
All You Need is "Leet": Evading Hate-speech Detection AI
par: Kahu, Sampanna Yashwant, et autres
Publié: (2025)
par: Kahu, Sampanna Yashwant, et autres
Publié: (2025)
Test-Time Scaling with Repeated Sampling Improves Multilingual Text Generation
par: Gupta, Ashim, et autres
Publié: (2025)
par: Gupta, Ashim, et autres
Publié: (2025)
LLM-Symbolic Integration for Robust Temporal Tabular Reasoning
par: Kulkarni, Atharv, et autres
Publié: (2025)
par: Kulkarni, Atharv, et autres
Publié: (2025)
EfficientXLang: Towards Improving Token Efficiency Through Cross-Lingual Reasoning
par: Ahuja, Sanchit, et autres
Publié: (2025)
par: Ahuja, Sanchit, et autres
Publié: (2025)
Evaluating LLMs' Mathematical Reasoning in Financial Document Question Answering
par: Srivastava, Pragya, et autres
Publié: (2024)
par: Srivastava, Pragya, et autres
Publié: (2024)
GETReason: Enhancing Image Context Extraction through Hierarchical Multi-Agent Reasoning
par: Siingh, Shikhhar, et autres
Publié: (2025)
par: Siingh, Shikhhar, et autres
Publié: (2025)
Finding Flawed Fictions: Evaluating Complex Reasoning in Language Models via Plot Hole Detection
par: Ahuja, Kabir, et autres
Publié: (2025)
par: Ahuja, Kabir, et autres
Publié: (2025)
DRAGON: A Benchmark for Evidence-Grounded Visual Reasoning over Diagrams
par: Iyengar, Anirudh Iyengar Kaniyar Narayana, et autres
Publié: (2026)
par: Iyengar, Anirudh Iyengar Kaniyar Narayana, et autres
Publié: (2026)
Evidence-Guided Schema Normalization for Temporal Tabular Reasoning
par: Thanga, Ashish, et autres
Publié: (2025)
par: Thanga, Ashish, et autres
Publié: (2025)
DeALOG: Decentralized Multi-Agents Log-Mediated Reasoning Framework
par: Chakraborty, Abhijit, et autres
Publié: (2026)
par: Chakraborty, Abhijit, et autres
Publié: (2026)
No Universal Prompt: Unifying Reasoning through Adaptive Prompting for Temporal Table Reasoning
par: Rajgaria, Abhishek, et autres
Publié: (2025)
par: Rajgaria, Abhishek, et autres
Publié: (2025)
Chow-Liu Ordering for Long-Context Reasoning in Chain-of-Agents
par: Gupta, Naman, et autres
Publié: (2026)
par: Gupta, Naman, et autres
Publié: (2026)
NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models
par: Pandya, Pranshu, et autres
Publié: (2024)
par: Pandya, Pranshu, et autres
Publié: (2024)
QUIETT: Query-Independent Table Transformation for Robust Reasoning
par: Najpande, Gaurav, et autres
Publié: (2026)
par: Najpande, Gaurav, et autres
Publié: (2026)
ViTaB-A: Evaluating Multimodal Large Language Models on Visual Table Attribution
par: Alqurnawi, Yahia, et autres
Publié: (2026)
par: Alqurnawi, Yahia, et autres
Publié: (2026)
TransientTables: Evaluating LLMs' Reasoning on Temporally Evolving Semi-structured Tables
par: Shankarampeta, Abhilash, et autres
Publié: (2025)
par: Shankarampeta, Abhilash, et autres
Publié: (2025)
ChartCheck: Explainable Fact-Checking over Real-World Chart Images
par: Akhtar, Mubashara, et autres
Publié: (2023)
par: Akhtar, Mubashara, et autres
Publié: (2023)
A comprehensive study of on-device NLP applications -- VQA, automated Form filling, Smart Replies for Linguistic Codeswitching
par: Goyal, Naman
Publié: (2024)
par: Goyal, Naman
Publié: (2024)
Uncertainty-Aware Budget Allocation for Adaptive Test-Time Reasoning
par: Nguyen, Manh, et autres
Publié: (2026)
par: Nguyen, Manh, et autres
Publié: (2026)
On The Truthfulness of 'Surprisingly Likely' Responses of Large Language Models
par: Goel, Naman
Publié: (2023)
par: Goel, Naman
Publié: (2023)
H-STAR: LLM-driven Hybrid SQL-Text Adaptive Reasoning on Tables
par: Abhyankar, Nikhil, et autres
Publié: (2024)
par: Abhyankar, Nikhil, et autres
Publié: (2024)
RiverEcho: Real-Time Interactive Digital System for Ancient Yellow River Culture
par: Wang, Haofeng, et autres
Publié: (2025)
par: Wang, Haofeng, et autres
Publié: (2025)
FlowVQA: Mapping Multimodal Logic in Visual Question Answering with Flowcharts
par: Singh, Shubhankar, et autres
Publié: (2024)
par: Singh, Shubhankar, et autres
Publié: (2024)
Parameter Alignment Mitigates Catastrophic Forgetting in Multilingual Expert Language Models
par: Ahuja, Sanchit, et autres
Publié: (2026)
par: Ahuja, Sanchit, et autres
Publié: (2026)
Failure Modes of LLMs for Causal Reasoning on Narratives
par: Yamin, Khurram, et autres
Publié: (2024)
par: Yamin, Khurram, et autres
Publié: (2024)
Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks
par: Zhang, Wenqi, et autres
Publié: (2025)
par: Zhang, Wenqi, et autres
Publié: (2025)
M-HELP: Using Social Media Data to Detect Mental Health Help-Seeking Signals
par: Sathvik, MSVPJ, et autres
Publié: (2025)
par: Sathvik, MSVPJ, et autres
Publié: (2025)
Rank-K: Test-Time Reasoning for Listwise Reranking
par: Yang, Eugene, et autres
Publié: (2025)
par: Yang, Eugene, et autres
Publié: (2025)
Modeling Real-Time Interactive Conversations as Timed Diarized Transcripts
par: Tanzer, Garrett, et autres
Publié: (2024)
par: Tanzer, Garrett, et autres
Publié: (2024)
CREST: Universal Safety Guardrails Through Cluster-Guided Cross-Lingual Transfer
par: Bansal, Lavish, et autres
Publié: (2025)
par: Bansal, Lavish, et autres
Publié: (2025)
Automatic Summarization of Long Documents
par: Chhibbar, Naman, et autres
Publié: (2024)
par: Chhibbar, Naman, et autres
Publié: (2024)
Federated Retrieval-Augmented Generation: A Systematic Mapping Study
par: Chakraborty, Abhijit, et autres
Publié: (2025)
par: Chakraborty, Abhijit, et autres
Publié: (2025)
Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability
par: Sundaram, Shobhita, et autres
Publié: (2026)
par: Sundaram, Shobhita, et autres
Publié: (2026)
Integrity Shield A System for Ethical AI Use & Authorship Transparency in Assessments
par: Shekhar, Ashish Raj, et autres
Publié: (2026)
par: Shekhar, Ashish Raj, et autres
Publié: (2026)
InterChart: Benchmarking Visual Reasoning Across Decomposed and Distributed Chart Information
par: Iyengar, Anirudh Iyengar Kaniyar Narayana, et autres
Publié: (2025)
par: Iyengar, Anirudh Iyengar Kaniyar Narayana, et autres
Publié: (2025)
Found in Translation: Measuring Multilingual LLM Consistency as Simple as Translate then Evaluate
par: Gupta, Ashim, et autres
Publié: (2025)
par: Gupta, Ashim, et autres
Publié: (2025)
Documents similaires
-
Map&Make: Schema Guided Text to Table Generation
par: Ahuja, Naman, et autres
Publié: (2025) -
Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives
par: Upadhyay, Ritam, et autres
Publié: (2025) -
The Perceptual Observatory Characterizing Robustness and Grounding in MLLMs
par: Anvekar, Tejas, et autres
Publié: (2025) -
EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews
par: Ahuja, Naman, et autres
Publié: (2026) -
All You Need is "Leet": Evading Hate-speech Detection AI
par: Kahu, Sampanna Yashwant, et autres
Publié: (2025)