:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Yang, Ivy Yuqian, Zhang, David Yu
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2511.14630
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Multi-step retrieval and reasoning improves radiology question answering with large language models
di: Wind, Sebastian, et al.
Pubblicazione: (2025)

CaLMQA: Exploring culturally specific long-form question answering across 23 languages
di: Arora, Shane, et al.
Pubblicazione: (2024)

Neural operators struggle to learn complex PDEs in pedestrian mobility: Hughes model case study
di: Chauhan, Prajwal, et al.
Pubblicazione: (2025)

Policy alone is probably not the solution: A large-scale experiment on how developers struggle to design meaningful end-user explanations
di: Nahar, Nadia, et al.
Pubblicazione: (2025)

How predictable is language model benchmark performance?
di: Owen, David
Pubblicazione: (2024)

Large language models as uncertainty-calibrated optimizers for experimental discovery
di: Ranković, Bojana, et al.
Pubblicazione: (2025)

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering
di: Farajiamiri, Mina, et al.
Pubblicazione: (2026)

Revisiting On-Policy Distillation: Empirical Failure Modes and Simple Fixes
di: Fu, Yuqian, et al.
Pubblicazione: (2026)

Efficiency optimization of large-scale language models based on deep learning in natural language processing tasks
di: Mei, Taiyuan, et al.
Pubblicazione: (2024)

Agribot: agriculture-specific question answer system
di: Jain, Naman, et al.
Pubblicazione: (2025)

MicroMix: Efficient Mixed-Precision Quantization with Microscaling Formats for Large Language Models
di: Liu, Wenyuan, et al.
Pubblicazione: (2025)

Select to Perfect: Imitating desired behavior from large multi-agent data
di: Franzmeyer, Tim, et al.
Pubblicazione: (2024)

Latent label distribution grid representation for modeling uncertainty
di: Sun, ShuNing, et al.
Pubblicazione: (2025)

AnyAttack: Towards Large-scale Self-supervised Adversarial Attacks on Vision-language Models
di: Zhang, Jiaming, et al.
Pubblicazione: (2024)

Large language models struggle with ethnographic text annotation
di: Goodall, Leonardo S., et al.
Pubblicazione: (2026)

Deep Feature Embedding for Tabular Data
di: Wu, Yuqian, et al.
Pubblicazione: (2024)

But what is your honest answer? Aiding LLM-judges with honest alternatives using steering vectors
di: Eshuijs, Leon, et al.
Pubblicazione: (2025)

Implicit meta-learning may lead language models to trust more reliable sources
di: Krasheninnikov, Dmitrii, et al.
Pubblicazione: (2023)

Latent Space Data Fusion Outperforms Early Fusion in Multimodal Mental Health Digital Phenotyping Data
di: Barkat, Youcef, et al.
Pubblicazione: (2025)

Context information can be more important than reasoning for time series forecasting with a large language model
di: Yang, Janghoon
Pubblicazione: (2025)

Large language models can learn and generalize steganographic chain-of-thought under process supervision
di: Skaf, Joey, et al.
Pubblicazione: (2025)

Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis
di: Li, Hao, et al.
Pubblicazione: (2026)

The language of time: a language model perspective on time-series foundation models
di: Xie, Yi, et al.
Pubblicazione: (2025)

Safety challenges of AI in medicine in the era of large language models
di: Wang, Xiaoye, et al.
Pubblicazione: (2024)

Quantifying construct validity in large language model evaluations
di: Kearns, Ryan Othniel
Pubblicazione: (2026)

Applying sparse autoencoders to unlearn knowledge in language models
di: Farrell, Eoin, et al.
Pubblicazione: (2024)

Text-guided multi-property molecular optimization with a diffusion language model
di: Xiong, Yida, et al.
Pubblicazione: (2024)

Alignment faking in large language models
di: Greenblatt, Ryan, et al.
Pubblicazione: (2024)

Large Language Model Reasoning Failures
di: Song, Peiyang, et al.
Pubblicazione: (2026)

Can large language models explore in-context?
di: Krishnamurthy, Akshay, et al.
Pubblicazione: (2024)

Representation in large language models
di: Yetman, Cameron
Pubblicazione: (2025)

Long-form factuality in large language models
di: Wei, Jerry, et al.
Pubblicazione: (2024)

MergeIT: From Selection to Merging for Efficient Instruction Tuning
di: Cai, Hongyi, et al.
Pubblicazione: (2025)

Improving training time and GPU utilization in geo-distributed language model training
di: Palak, et al.
Pubblicazione: (2024)

Multimodal large language model for wheat breeding: a new exploration of smart breeding
di: Yang, Guofeng, et al.
Pubblicazione: (2024)

Large language models can accurately predict searcher preferences
di: Thomas, Paul, et al.
Pubblicazione: (2023)

Replacing thinking with tool usage enables reasoning in small language models
di: Rainone, Corrado, et al.
Pubblicazione: (2025)

Fresh in memory: Training-order recency is linearly encoded in language model activations
di: Krasheninnikov, Dmitrii, et al.
Pubblicazione: (2025)

Conditional Equivalence of DPO and RLHF: Implicit Assumption, Failure Modes, and Provable Alignment
di: Yang, Zhiqin, et al.
Pubblicazione: (2026)

Auditing language models for hidden objectives
di: Marks, Samuel, et al.
Pubblicazione: (2025)