Salvato in:
| Autori principali: | Lim, Jimin, Damerla, Arjun, Jiang, Arthur, Le, Nam |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2510.13878 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Zero-Shot Embedding Drift Detection: A Lightweight Defense Against Prompt Injections in LLMs
di: Sekar, Anirudh, et al.
Pubblicazione: (2026)
di: Sekar, Anirudh, et al.
Pubblicazione: (2026)
Evaluating Computational Accuracy of Large Language Models in Numerical Reasoning Tasks for Healthcare Applications
di: Malghan, Arjun R.
Pubblicazione: (2025)
di: Malghan, Arjun R.
Pubblicazione: (2025)
Hearing Between the Lines: Unlocking the Reasoning Power of LLMs for Speech Evaluation
di: Chandra, Arjun, et al.
Pubblicazione: (2026)
di: Chandra, Arjun, et al.
Pubblicazione: (2026)
Flex-Judge: Text-Only Reasoning Unleashes Zero-Shot Multimodal Evaluators
di: Ko, Jongwoo, et al.
Pubblicazione: (2025)
di: Ko, Jongwoo, et al.
Pubblicazione: (2025)
Evaluating Small Decoder-Only Language Models for Grammar Correction and Text Simplification
di: Lamelas, Anthony
Pubblicazione: (2026)
di: Lamelas, Anthony
Pubblicazione: (2026)
TRN-R1-Zero: Text-rich Network Reasoning via LLMs with Reinforcement Learning Only
di: Liu, Yilun, et al.
Pubblicazione: (2026)
di: Liu, Yilun, et al.
Pubblicazione: (2026)
Reasoning Under Uncertainty: Exploring Probabilistic Reasoning Capabilities of LLMs
di: Pournemat, Mobina, et al.
Pubblicazione: (2025)
di: Pournemat, Mobina, et al.
Pubblicazione: (2025)
Autonomous Evaluation of LLMs for Truth Maintenance and Reasoning Tasks
di: Karia, Rushang, et al.
Pubblicazione: (2024)
di: Karia, Rushang, et al.
Pubblicazione: (2024)
Grounding Spatial Relations in Text-Only Language Models
di: Azkune, Gorka, et al.
Pubblicazione: (2024)
di: Azkune, Gorka, et al.
Pubblicazione: (2024)
Doing Experiments and Revising Rules with Natural Language and Probabilistic Reasoning
di: Piriyakulkij, Wasu Top, et al.
Pubblicazione: (2024)
di: Piriyakulkij, Wasu Top, et al.
Pubblicazione: (2024)
Say Anything but This: When Tokenizer Betrays Reasoning in LLMs
di: Ayoobi, Navid, et al.
Pubblicazione: (2026)
di: Ayoobi, Navid, et al.
Pubblicazione: (2026)
Unveiling Decision-Making in LLMs for Text Classification : Extraction of influential and interpretable concepts with Sparse Autoencoders
di: Bail, Mathis Le, et al.
Pubblicazione: (2025)
di: Bail, Mathis Le, et al.
Pubblicazione: (2025)
Decision-Oriented Text Evaluation
di: Huang, Yu-Shiang, et al.
Pubblicazione: (2025)
di: Huang, Yu-Shiang, et al.
Pubblicazione: (2025)
Probabilistic Reasoning with LLMs for k-anonymity Estimation
di: Zheng, Jonathan, et al.
Pubblicazione: (2025)
di: Zheng, Jonathan, et al.
Pubblicazione: (2025)
Evaluating the Evaluator: Measuring LLMs' Adherence to Task Evaluation Instructions
di: Murugadoss, Bhuvanashree, et al.
Pubblicazione: (2024)
di: Murugadoss, Bhuvanashree, et al.
Pubblicazione: (2024)
Text2VLM: Adapting Text-Only Datasets to Evaluate Alignment Training in Visual Language Models
di: Downer, Gabriel, et al.
Pubblicazione: (2025)
di: Downer, Gabriel, et al.
Pubblicazione: (2025)
From Benchmarking to Reasoning: A Dual-Aspect, Large-Scale Evaluation of LLMs on Vietnamese Legal Text
di: Le, Van-Truong
Pubblicazione: (2026)
di: Le, Van-Truong
Pubblicazione: (2026)
Teaching and Evaluating LLMs to Reason About Polymer Design Related Tasks
di: Mohanty, Dikshya, et al.
Pubblicazione: (2026)
di: Mohanty, Dikshya, et al.
Pubblicazione: (2026)
A Multi-Task Evaluation of LLMs' Processing of Academic Text Input
di: Li, Tianyi, et al.
Pubblicazione: (2025)
di: Li, Tianyi, et al.
Pubblicazione: (2025)
MMAFFBen: A Multilingual and Multimodal Affective Analysis Benchmark for Evaluating LLMs and VLMs
di: Liu, Zhiwei, et al.
Pubblicazione: (2025)
di: Liu, Zhiwei, et al.
Pubblicazione: (2025)
In-Domain African Languages Translation Using LLMs and Multi-armed Bandits
di: Singh, Pratik Rakesh, et al.
Pubblicazione: (2025)
di: Singh, Pratik Rakesh, et al.
Pubblicazione: (2025)
XCR-Bench: A Multi-Task Benchmark for Evaluating Cultural Reasoning in LLMs
di: Kabir, Mohsinul, et al.
Pubblicazione: (2026)
di: Kabir, Mohsinul, et al.
Pubblicazione: (2026)
A Comprehensive Study of Decoder-Only LLMs for Text-to-Image Generation
di: Wang, Andrew Z., et al.
Pubblicazione: (2025)
di: Wang, Andrew Z., et al.
Pubblicazione: (2025)
Implicit Values Embedded in How Humans and LLMs Complete Subjective Everyday Tasks
di: Arunasalam, Arjun, et al.
Pubblicazione: (2025)
di: Arunasalam, Arjun, et al.
Pubblicazione: (2025)
Uncovering Gaps in How Humans and LLMs Interpret Subjective Language
di: Jones, Erik, et al.
Pubblicazione: (2025)
di: Jones, Erik, et al.
Pubblicazione: (2025)
Fino1: On the Transferability of Reasoning-Enhanced LLMs and Reinforcement Learning to Finance
di: Qian, Lingfei, et al.
Pubblicazione: (2025)
di: Qian, Lingfei, et al.
Pubblicazione: (2025)
BIG5-TPoT: Predicting BIG Five Personality Traits, Facets, and Items Through Targeted Preselection of Texts
di: Le, Triet M., et al.
Pubblicazione: (2025)
di: Le, Triet M., et al.
Pubblicazione: (2025)
What Are the Odds? Language Models Are Capable of Probabilistic Reasoning
di: Paruchuri, Akshay, et al.
Pubblicazione: (2024)
di: Paruchuri, Akshay, et al.
Pubblicazione: (2024)
Reliable Decision Support with LLMs: A Framework for Evaluating Consistency in Binary Text Classification Applications
di: Megahed, Fadel M., et al.
Pubblicazione: (2025)
di: Megahed, Fadel M., et al.
Pubblicazione: (2025)
Scaling Competence, Shrinking Reasoning: Cognitive Signatures in Language Model Learning
di: Singh, Mukul, et al.
Pubblicazione: (2025)
di: Singh, Mukul, et al.
Pubblicazione: (2025)
Multi-Task Learning for Front-End Text Processing in TTS
di: Kang, Wonjune, et al.
Pubblicazione: (2024)
di: Kang, Wonjune, et al.
Pubblicazione: (2024)
Slot Filling as a Reasoning Task for SpeechLLMs
di: Hacioglu, Kadri, et al.
Pubblicazione: (2025)
di: Hacioglu, Kadri, et al.
Pubblicazione: (2025)
Unveiling Over-Memorization in Finetuning LLMs for Reasoning Tasks
di: Ruan, Zhiwen, et al.
Pubblicazione: (2025)
di: Ruan, Zhiwen, et al.
Pubblicazione: (2025)
Low-Resource Domain Adaptation for Speech LLMs via Text-Only Fine-Tuning
di: Fang, Yangui, et al.
Pubblicazione: (2025)
di: Fang, Yangui, et al.
Pubblicazione: (2025)
Reasoning or Reciting? Exploring the Capabilities and Limitations of Language Models Through Counterfactual Tasks
di: Wu, Zhaofeng, et al.
Pubblicazione: (2023)
di: Wu, Zhaofeng, et al.
Pubblicazione: (2023)
Text2Cypher Across Languages: Evaluating and Finetuning LLMs
di: Ozsoy, Makbule Gulcin, et al.
Pubblicazione: (2025)
di: Ozsoy, Makbule Gulcin, et al.
Pubblicazione: (2025)
MzansiText and MzansiLM: An Open Corpus and Decoder-Only Language Model for South African Languages
di: Lombard, Anri, et al.
Pubblicazione: (2026)
di: Lombard, Anri, et al.
Pubblicazione: (2026)
Can Structural Cues Save LLMs? Evaluating Language Models in Massive Document Streams
di: Lee, Yukyung, et al.
Pubblicazione: (2026)
di: Lee, Yukyung, et al.
Pubblicazione: (2026)
Language-Aware Distillation for Multilingual Instruction-Following Speech LLMs with ASR-Only Supervision
di: Gopal, Shreyas, et al.
Pubblicazione: (2026)
di: Gopal, Shreyas, et al.
Pubblicazione: (2026)
Understanding How CodeLLMs (Mis)Predict Types with Activation Steering
di: Lucchetti, Francesca, et al.
Pubblicazione: (2024)
di: Lucchetti, Francesca, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Zero-Shot Embedding Drift Detection: A Lightweight Defense Against Prompt Injections in LLMs
di: Sekar, Anirudh, et al.
Pubblicazione: (2026) -
Evaluating Computational Accuracy of Large Language Models in Numerical Reasoning Tasks for Healthcare Applications
di: Malghan, Arjun R.
Pubblicazione: (2025) -
Hearing Between the Lines: Unlocking the Reasoning Power of LLMs for Speech Evaluation
di: Chandra, Arjun, et al.
Pubblicazione: (2026) -
Flex-Judge: Text-Only Reasoning Unleashes Zero-Shot Multimodal Evaluators
di: Ko, Jongwoo, et al.
Pubblicazione: (2025) -
Evaluating Small Decoder-Only Language Models for Grammar Correction and Text Simplification
di: Lamelas, Anthony
Pubblicazione: (2026)