Salvato in:
| Autori principali: | Yang, Ivy Yuqian, Zhang, David Yu |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2511.14630 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Multi-step retrieval and reasoning improves radiology question answering with large language models
di: Wind, Sebastian, et al.
Pubblicazione: (2025)
di: Wind, Sebastian, et al.
Pubblicazione: (2025)
CaLMQA: Exploring culturally specific long-form question answering across 23 languages
di: Arora, Shane, et al.
Pubblicazione: (2024)
di: Arora, Shane, et al.
Pubblicazione: (2024)
Neural operators struggle to learn complex PDEs in pedestrian mobility: Hughes model case study
di: Chauhan, Prajwal, et al.
Pubblicazione: (2025)
di: Chauhan, Prajwal, et al.
Pubblicazione: (2025)
Policy alone is probably not the solution: A large-scale experiment on how developers struggle to design meaningful end-user explanations
di: Nahar, Nadia, et al.
Pubblicazione: (2025)
di: Nahar, Nadia, et al.
Pubblicazione: (2025)
How predictable is language model benchmark performance?
di: Owen, David
Pubblicazione: (2024)
di: Owen, David
Pubblicazione: (2024)
Large language models as uncertainty-calibrated optimizers for experimental discovery
di: Ranković, Bojana, et al.
Pubblicazione: (2025)
di: Ranković, Bojana, et al.
Pubblicazione: (2025)
Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering
di: Farajiamiri, Mina, et al.
Pubblicazione: (2026)
di: Farajiamiri, Mina, et al.
Pubblicazione: (2026)
Revisiting On-Policy Distillation: Empirical Failure Modes and Simple Fixes
di: Fu, Yuqian, et al.
Pubblicazione: (2026)
di: Fu, Yuqian, et al.
Pubblicazione: (2026)
Efficiency optimization of large-scale language models based on deep learning in natural language processing tasks
di: Mei, Taiyuan, et al.
Pubblicazione: (2024)
di: Mei, Taiyuan, et al.
Pubblicazione: (2024)
Agribot: agriculture-specific question answer system
di: Jain, Naman, et al.
Pubblicazione: (2025)
di: Jain, Naman, et al.
Pubblicazione: (2025)
MicroMix: Efficient Mixed-Precision Quantization with Microscaling Formats for Large Language Models
di: Liu, Wenyuan, et al.
Pubblicazione: (2025)
di: Liu, Wenyuan, et al.
Pubblicazione: (2025)
Select to Perfect: Imitating desired behavior from large multi-agent data
di: Franzmeyer, Tim, et al.
Pubblicazione: (2024)
di: Franzmeyer, Tim, et al.
Pubblicazione: (2024)
Latent label distribution grid representation for modeling uncertainty
di: Sun, ShuNing, et al.
Pubblicazione: (2025)
di: Sun, ShuNing, et al.
Pubblicazione: (2025)
AnyAttack: Towards Large-scale Self-supervised Adversarial Attacks on Vision-language Models
di: Zhang, Jiaming, et al.
Pubblicazione: (2024)
di: Zhang, Jiaming, et al.
Pubblicazione: (2024)
Large language models struggle with ethnographic text annotation
di: Goodall, Leonardo S., et al.
Pubblicazione: (2026)
di: Goodall, Leonardo S., et al.
Pubblicazione: (2026)
Deep Feature Embedding for Tabular Data
di: Wu, Yuqian, et al.
Pubblicazione: (2024)
di: Wu, Yuqian, et al.
Pubblicazione: (2024)
But what is your honest answer? Aiding LLM-judges with honest alternatives using steering vectors
di: Eshuijs, Leon, et al.
Pubblicazione: (2025)
di: Eshuijs, Leon, et al.
Pubblicazione: (2025)
Implicit meta-learning may lead language models to trust more reliable sources
di: Krasheninnikov, Dmitrii, et al.
Pubblicazione: (2023)
di: Krasheninnikov, Dmitrii, et al.
Pubblicazione: (2023)
Latent Space Data Fusion Outperforms Early Fusion in Multimodal Mental Health Digital Phenotyping Data
di: Barkat, Youcef, et al.
Pubblicazione: (2025)
di: Barkat, Youcef, et al.
Pubblicazione: (2025)
Context information can be more important than reasoning for time series forecasting with a large language model
di: Yang, Janghoon
Pubblicazione: (2025)
di: Yang, Janghoon
Pubblicazione: (2025)
Large language models can learn and generalize steganographic chain-of-thought under process supervision
di: Skaf, Joey, et al.
Pubblicazione: (2025)
di: Skaf, Joey, et al.
Pubblicazione: (2025)
Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis
di: Li, Hao, et al.
Pubblicazione: (2026)
di: Li, Hao, et al.
Pubblicazione: (2026)
The language of time: a language model perspective on time-series foundation models
di: Xie, Yi, et al.
Pubblicazione: (2025)
di: Xie, Yi, et al.
Pubblicazione: (2025)
Safety challenges of AI in medicine in the era of large language models
di: Wang, Xiaoye, et al.
Pubblicazione: (2024)
di: Wang, Xiaoye, et al.
Pubblicazione: (2024)
Quantifying construct validity in large language model evaluations
di: Kearns, Ryan Othniel
Pubblicazione: (2026)
di: Kearns, Ryan Othniel
Pubblicazione: (2026)
Applying sparse autoencoders to unlearn knowledge in language models
di: Farrell, Eoin, et al.
Pubblicazione: (2024)
di: Farrell, Eoin, et al.
Pubblicazione: (2024)
Text-guided multi-property molecular optimization with a diffusion language model
di: Xiong, Yida, et al.
Pubblicazione: (2024)
di: Xiong, Yida, et al.
Pubblicazione: (2024)
Alignment faking in large language models
di: Greenblatt, Ryan, et al.
Pubblicazione: (2024)
di: Greenblatt, Ryan, et al.
Pubblicazione: (2024)
Large Language Model Reasoning Failures
di: Song, Peiyang, et al.
Pubblicazione: (2026)
di: Song, Peiyang, et al.
Pubblicazione: (2026)
Can large language models explore in-context?
di: Krishnamurthy, Akshay, et al.
Pubblicazione: (2024)
di: Krishnamurthy, Akshay, et al.
Pubblicazione: (2024)
Representation in large language models
di: Yetman, Cameron
Pubblicazione: (2025)
di: Yetman, Cameron
Pubblicazione: (2025)
Long-form factuality in large language models
di: Wei, Jerry, et al.
Pubblicazione: (2024)
di: Wei, Jerry, et al.
Pubblicazione: (2024)
MergeIT: From Selection to Merging for Efficient Instruction Tuning
di: Cai, Hongyi, et al.
Pubblicazione: (2025)
di: Cai, Hongyi, et al.
Pubblicazione: (2025)
Improving training time and GPU utilization in geo-distributed language model training
di: Palak, et al.
Pubblicazione: (2024)
di: Palak, et al.
Pubblicazione: (2024)
Multimodal large language model for wheat breeding: a new exploration of smart breeding
di: Yang, Guofeng, et al.
Pubblicazione: (2024)
di: Yang, Guofeng, et al.
Pubblicazione: (2024)
Large language models can accurately predict searcher preferences
di: Thomas, Paul, et al.
Pubblicazione: (2023)
di: Thomas, Paul, et al.
Pubblicazione: (2023)
Replacing thinking with tool usage enables reasoning in small language models
di: Rainone, Corrado, et al.
Pubblicazione: (2025)
di: Rainone, Corrado, et al.
Pubblicazione: (2025)
Fresh in memory: Training-order recency is linearly encoded in language model activations
di: Krasheninnikov, Dmitrii, et al.
Pubblicazione: (2025)
di: Krasheninnikov, Dmitrii, et al.
Pubblicazione: (2025)
Conditional Equivalence of DPO and RLHF: Implicit Assumption, Failure Modes, and Provable Alignment
di: Yang, Zhiqin, et al.
Pubblicazione: (2026)
di: Yang, Zhiqin, et al.
Pubblicazione: (2026)
Auditing language models for hidden objectives
di: Marks, Samuel, et al.
Pubblicazione: (2025)
di: Marks, Samuel, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Multi-step retrieval and reasoning improves radiology question answering with large language models
di: Wind, Sebastian, et al.
Pubblicazione: (2025) -
CaLMQA: Exploring culturally specific long-form question answering across 23 languages
di: Arora, Shane, et al.
Pubblicazione: (2024) -
Neural operators struggle to learn complex PDEs in pedestrian mobility: Hughes model case study
di: Chauhan, Prajwal, et al.
Pubblicazione: (2025) -
Policy alone is probably not the solution: A large-scale experiment on how developers struggle to design meaningful end-user explanations
di: Nahar, Nadia, et al.
Pubblicazione: (2025) -
How predictable is language model benchmark performance?
di: Owen, David
Pubblicazione: (2024)