Gespeichert in:
| Hauptverfasser: | Sawyer, Hunter, Roberts, Jesse, Moore, Kyle |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2503.12530 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Human-Alignment and Calibration of Inference-Time Uncertainty in Large Language Models
von: Moore, Kyle, et al.
Veröffentlicht: (2025)
von: Moore, Kyle, et al.
Veröffentlicht: (2025)
Investigating Human-Aligned Large Language Model Uncertainty
von: Moore, Kyle, et al.
Veröffentlicht: (2025)
von: Moore, Kyle, et al.
Veröffentlicht: (2025)
Using Artificial Populations to Study Psychological Phenomena in Neural Models
von: Roberts, Jesse, et al.
Veröffentlicht: (2023)
von: Roberts, Jesse, et al.
Veröffentlicht: (2023)
Large Language Model Recall Uncertainty is Modulated by the Fan Effect
von: Roberts, Jesse, et al.
Veröffentlicht: (2024)
von: Roberts, Jesse, et al.
Veröffentlicht: (2024)
Chain of Thought Still Thinks Fast: APriCoT Helps with Thinking Slow
von: Moore, Kyle, et al.
Veröffentlicht: (2024)
von: Moore, Kyle, et al.
Veröffentlicht: (2024)
The Base-Rate Effect on LLM Benchmark Performance: Disambiguating Test-Taking Strategies from Benchmark Performance
von: Moore, Kyle, et al.
Veröffentlicht: (2024)
von: Moore, Kyle, et al.
Veröffentlicht: (2024)
Do Large Language Models Learn Human-Like Strategic Preferences?
von: Roberts, Jesse, et al.
Veröffentlicht: (2024)
von: Roberts, Jesse, et al.
Veröffentlicht: (2024)
How Powerful are Decoder-Only Transformer Neural Models?
von: Roberts, Jesse
Veröffentlicht: (2023)
von: Roberts, Jesse
Veröffentlicht: (2023)
KARMA: Karma-Aligned Reward Model Adaptation
von: Scott, Jared, et al.
Veröffentlicht: (2026)
von: Scott, Jared, et al.
Veröffentlicht: (2026)
Investigating Expert-in-the-Loop LLM Discourse Patterns for Ancient Intertextual Analysis
von: Umphrey, Ray, et al.
Veröffentlicht: (2024)
von: Umphrey, Ray, et al.
Veröffentlicht: (2024)
Supporting the Digital Autonomy of Elders Through LLM Assistance
von: Roberts, Jesse, et al.
Veröffentlicht: (2024)
von: Roberts, Jesse, et al.
Veröffentlicht: (2024)
Chartographer: Counterfactual Chart Generation for Evaluating Vision-Language Models
von: Jiang, Yifan, et al.
Veröffentlicht: (2026)
von: Jiang, Yifan, et al.
Veröffentlicht: (2026)
A Multimodal Recaptioning Framework to Account for Perceptual Diversity Across Languages in Vision-Language Modeling
von: Buettner, Kyle, et al.
Veröffentlicht: (2025)
von: Buettner, Kyle, et al.
Veröffentlicht: (2025)
Probing the Category of Verbal Aspect in Transformer Language Models
von: Katinskaia, Anisia, et al.
Veröffentlicht: (2024)
von: Katinskaia, Anisia, et al.
Veröffentlicht: (2024)
LLMs as Agentic Cooperative Players in Multiplayer UNO
von: Matinez, Yago Romano, et al.
Veröffentlicht: (2025)
von: Matinez, Yago Romano, et al.
Veröffentlicht: (2025)
Believing without Seeing: Quality Scores for Contextualizing Vision-Language Model Explanations
von: He, Keyu, et al.
Veröffentlicht: (2025)
von: He, Keyu, et al.
Veröffentlicht: (2025)
Syntactic Evolution in Language Usage
von: Kumar, Surbhit
Veröffentlicht: (2025)
von: Kumar, Surbhit
Veröffentlicht: (2025)
Evaluating the Usage of African-American Vernacular English in Large Language Models
von: Dunlap, Deja, et al.
Veröffentlicht: (2026)
von: Dunlap, Deja, et al.
Veröffentlicht: (2026)
Leveraging Large Language Models in Human-Robot Interaction: A Critical Analysis of Potential and Pitfalls
von: Atuhurra, Jesse
Veröffentlicht: (2024)
von: Atuhurra, Jesse
Veröffentlicht: (2024)
Estranged Predictions: Measuring Semantic Category Disruption with Masked Language Modelling
von: Liu, Yuxuan, et al.
Veröffentlicht: (2025)
von: Liu, Yuxuan, et al.
Veröffentlicht: (2025)
Risk and Response in Large Language Models: Evaluating Key Threat Categories
von: Harandizadeh, Bahareh, et al.
Veröffentlicht: (2024)
von: Harandizadeh, Bahareh, et al.
Veröffentlicht: (2024)
Constructing Multilingual Visual-Text Datasets Revealing Visual Multilingual Ability of Vision Language Models
von: Atuhurra, Jesse, et al.
Veröffentlicht: (2024)
von: Atuhurra, Jesse, et al.
Veröffentlicht: (2024)
olmOCR: Unlocking Trillions of Tokens in PDFs with Vision Language Models
von: Poznanski, Jake, et al.
Veröffentlicht: (2025)
von: Poznanski, Jake, et al.
Veröffentlicht: (2025)
Mixture-of-Skills: Learning to Optimize Data Usage for Fine-Tuning Large Language Models
von: Wu, Minghao, et al.
Veröffentlicht: (2024)
von: Wu, Minghao, et al.
Veröffentlicht: (2024)
Optimizing Token Usage on Large Language Model Conversations Using the Design Structure Matrix
von: Alarcia, Ramon Maria Garcia, et al.
Veröffentlicht: (2024)
von: Alarcia, Ramon Maria Garcia, et al.
Veröffentlicht: (2024)
The Aftermath of DrawEduMath: Vision Language Models Underperform with Struggling Students and Misdiagnose Errors
von: Lucy, Li, et al.
Veröffentlicht: (2026)
von: Lucy, Li, et al.
Veröffentlicht: (2026)
Language Diversity: Evaluating Language Usage and AI Performance on African Languages in Digital Spaces
von: Ajayi, Edward, et al.
Veröffentlicht: (2025)
von: Ajayi, Edward, et al.
Veröffentlicht: (2025)
Do Syntactic Categories Help in Developmentally Motivated Curriculum Learning for Language Models?
von: Güven, Arzu Burcu, et al.
Veröffentlicht: (2025)
von: Güven, Arzu Burcu, et al.
Veröffentlicht: (2025)
Signal and Noise: A Framework for Reducing Uncertainty in Language Model Evaluation
von: Heineman, David, et al.
Veröffentlicht: (2025)
von: Heineman, David, et al.
Veröffentlicht: (2025)
How Linguistics Learned to Stop Worrying and Love the Language Models
von: Futrell, Richard, et al.
Veröffentlicht: (2025)
von: Futrell, Richard, et al.
Veröffentlicht: (2025)
GutenOCR: A Grounded Vision-Language Front-End for Documents
von: Heidenreich, Hunter, et al.
Veröffentlicht: (2026)
von: Heidenreich, Hunter, et al.
Veröffentlicht: (2026)
Generalized Category Discovery with Large Language Models in the Loop
von: An, Wenbin, et al.
Veröffentlicht: (2023)
von: An, Wenbin, et al.
Veröffentlicht: (2023)
Large Language Models for Page Stream Segmentation
von: Heidenreich, Hunter, et al.
Veröffentlicht: (2024)
von: Heidenreich, Hunter, et al.
Veröffentlicht: (2024)
Bias in LLMs as Annotators: The Effect of Party Cues on Labelling Decision by Large Language Models
von: Vera, Sebastian Vallejo, et al.
Veröffentlicht: (2024)
von: Vera, Sebastian Vallejo, et al.
Veröffentlicht: (2024)
Selective "Selective Prediction": Reducing Unnecessary Abstention in Vision-Language Reasoning
von: Srinivasan, Tejas, et al.
Veröffentlicht: (2024)
von: Srinivasan, Tejas, et al.
Veröffentlicht: (2024)
Language Modeling by Language Models
von: Cheng, Junyan, et al.
Veröffentlicht: (2025)
von: Cheng, Junyan, et al.
Veröffentlicht: (2025)
STU-PID: Steering Token Usage via PID Controller for Efficient Large Language Model Reasoning
von: Bharadwaj, Aryasomayajula Ram
Veröffentlicht: (2025)
von: Bharadwaj, Aryasomayajula Ram
Veröffentlicht: (2025)
Leave No TRACE: Black-box Detection of Copyrighted Dataset Usage in Large Language Models via Watermarking
von: Zhang, Jingqi, et al.
Veröffentlicht: (2025)
von: Zhang, Jingqi, et al.
Veröffentlicht: (2025)
Look Before You Leap: Towards Decision-Aware and Generalizable Tool-Usage for Large Language Models
von: Gui, Anchun, et al.
Veröffentlicht: (2024)
von: Gui, Anchun, et al.
Veröffentlicht: (2024)
Identifying Linear Relational Concepts in Large Language Models
von: Chanin, David, et al.
Veröffentlicht: (2023)
von: Chanin, David, et al.
Veröffentlicht: (2023)
Ähnliche Einträge
-
Human-Alignment and Calibration of Inference-Time Uncertainty in Large Language Models
von: Moore, Kyle, et al.
Veröffentlicht: (2025) -
Investigating Human-Aligned Large Language Model Uncertainty
von: Moore, Kyle, et al.
Veröffentlicht: (2025) -
Using Artificial Populations to Study Psychological Phenomena in Neural Models
von: Roberts, Jesse, et al.
Veröffentlicht: (2023) -
Large Language Model Recall Uncertainty is Modulated by the Fan Effect
von: Roberts, Jesse, et al.
Veröffentlicht: (2024) -
Chain of Thought Still Thinks Fast: APriCoT Helps with Thinking Slow
von: Moore, Kyle, et al.
Veröffentlicht: (2024)