:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Lim, Jimin, Damerla, Arjun, Jiang, Arthur, Le, Nam
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computation and Language
Accesso online:	https://arxiv.org/abs/2510.13878
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Zero-Shot Embedding Drift Detection: A Lightweight Defense Against Prompt Injections in LLMs
di: Sekar, Anirudh, et al.
Pubblicazione: (2026)

Evaluating Computational Accuracy of Large Language Models in Numerical Reasoning Tasks for Healthcare Applications
di: Malghan, Arjun R.
Pubblicazione: (2025)

Hearing Between the Lines: Unlocking the Reasoning Power of LLMs for Speech Evaluation
di: Chandra, Arjun, et al.
Pubblicazione: (2026)

Flex-Judge: Text-Only Reasoning Unleashes Zero-Shot Multimodal Evaluators
di: Ko, Jongwoo, et al.
Pubblicazione: (2025)

Evaluating Small Decoder-Only Language Models for Grammar Correction and Text Simplification
di: Lamelas, Anthony
Pubblicazione: (2026)

TRN-R1-Zero: Text-rich Network Reasoning via LLMs with Reinforcement Learning Only
di: Liu, Yilun, et al.
Pubblicazione: (2026)

Reasoning Under Uncertainty: Exploring Probabilistic Reasoning Capabilities of LLMs
di: Pournemat, Mobina, et al.
Pubblicazione: (2025)

Autonomous Evaluation of LLMs for Truth Maintenance and Reasoning Tasks
di: Karia, Rushang, et al.
Pubblicazione: (2024)

Grounding Spatial Relations in Text-Only Language Models
di: Azkune, Gorka, et al.
Pubblicazione: (2024)

Doing Experiments and Revising Rules with Natural Language and Probabilistic Reasoning
di: Piriyakulkij, Wasu Top, et al.
Pubblicazione: (2024)

Say Anything but This: When Tokenizer Betrays Reasoning in LLMs
di: Ayoobi, Navid, et al.
Pubblicazione: (2026)

Unveiling Decision-Making in LLMs for Text Classification : Extraction of influential and interpretable concepts with Sparse Autoencoders
di: Bail, Mathis Le, et al.
Pubblicazione: (2025)

Decision-Oriented Text Evaluation
di: Huang, Yu-Shiang, et al.
Pubblicazione: (2025)

Probabilistic Reasoning with LLMs for k-anonymity Estimation
di: Zheng, Jonathan, et al.
Pubblicazione: (2025)

Evaluating the Evaluator: Measuring LLMs' Adherence to Task Evaluation Instructions
di: Murugadoss, Bhuvanashree, et al.
Pubblicazione: (2024)

Text2VLM: Adapting Text-Only Datasets to Evaluate Alignment Training in Visual Language Models
di: Downer, Gabriel, et al.
Pubblicazione: (2025)

From Benchmarking to Reasoning: A Dual-Aspect, Large-Scale Evaluation of LLMs on Vietnamese Legal Text
di: Le, Van-Truong
Pubblicazione: (2026)

Teaching and Evaluating LLMs to Reason About Polymer Design Related Tasks
di: Mohanty, Dikshya, et al.
Pubblicazione: (2026)

A Multi-Task Evaluation of LLMs' Processing of Academic Text Input
di: Li, Tianyi, et al.
Pubblicazione: (2025)

MMAFFBen: A Multilingual and Multimodal Affective Analysis Benchmark for Evaluating LLMs and VLMs
di: Liu, Zhiwei, et al.
Pubblicazione: (2025)

In-Domain African Languages Translation Using LLMs and Multi-armed Bandits
di: Singh, Pratik Rakesh, et al.
Pubblicazione: (2025)

XCR-Bench: A Multi-Task Benchmark for Evaluating Cultural Reasoning in LLMs
di: Kabir, Mohsinul, et al.
Pubblicazione: (2026)

A Comprehensive Study of Decoder-Only LLMs for Text-to-Image Generation
di: Wang, Andrew Z., et al.
Pubblicazione: (2025)

Implicit Values Embedded in How Humans and LLMs Complete Subjective Everyday Tasks
di: Arunasalam, Arjun, et al.
Pubblicazione: (2025)

Uncovering Gaps in How Humans and LLMs Interpret Subjective Language
di: Jones, Erik, et al.
Pubblicazione: (2025)

Fino1: On the Transferability of Reasoning-Enhanced LLMs and Reinforcement Learning to Finance
di: Qian, Lingfei, et al.
Pubblicazione: (2025)

BIG5-TPoT: Predicting BIG Five Personality Traits, Facets, and Items Through Targeted Preselection of Texts
di: Le, Triet M., et al.
Pubblicazione: (2025)

What Are the Odds? Language Models Are Capable of Probabilistic Reasoning
di: Paruchuri, Akshay, et al.
Pubblicazione: (2024)

Reliable Decision Support with LLMs: A Framework for Evaluating Consistency in Binary Text Classification Applications
di: Megahed, Fadel M., et al.
Pubblicazione: (2025)

Scaling Competence, Shrinking Reasoning: Cognitive Signatures in Language Model Learning
di: Singh, Mukul, et al.
Pubblicazione: (2025)

Multi-Task Learning for Front-End Text Processing in TTS
di: Kang, Wonjune, et al.
Pubblicazione: (2024)

Slot Filling as a Reasoning Task for SpeechLLMs
di: Hacioglu, Kadri, et al.
Pubblicazione: (2025)

Unveiling Over-Memorization in Finetuning LLMs for Reasoning Tasks
di: Ruan, Zhiwen, et al.
Pubblicazione: (2025)

Low-Resource Domain Adaptation for Speech LLMs via Text-Only Fine-Tuning
di: Fang, Yangui, et al.
Pubblicazione: (2025)

Reasoning or Reciting? Exploring the Capabilities and Limitations of Language Models Through Counterfactual Tasks
di: Wu, Zhaofeng, et al.
Pubblicazione: (2023)

Text2Cypher Across Languages: Evaluating and Finetuning LLMs
di: Ozsoy, Makbule Gulcin, et al.
Pubblicazione: (2025)

MzansiText and MzansiLM: An Open Corpus and Decoder-Only Language Model for South African Languages
di: Lombard, Anri, et al.
Pubblicazione: (2026)

Can Structural Cues Save LLMs? Evaluating Language Models in Massive Document Streams
di: Lee, Yukyung, et al.
Pubblicazione: (2026)

Language-Aware Distillation for Multilingual Instruction-Following Speech LLMs with ASR-Only Supervision
di: Gopal, Shreyas, et al.
Pubblicazione: (2026)

Understanding How CodeLLMs (Mis)Predict Types with Activation Steering
di: Lucchetti, Francesca, et al.
Pubblicazione: (2024)