Enregistré dans:
| Auteurs principaux: | Huang, Fangrui, Chbeir, Souhad, Khatua, Arpandeep, Wang, Sheng, Tan, Sijun, Ye, Kenan, Bailey, Lily, Daniel, Merryn, Louie, Ryan, Koyejo, Sanmi, Adeli, Ehsan |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2603.18008 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
VideoWeave: A Data-Centric Approach for Efficient Video Understanding
par: Durante, Zane, et autres
Publié: (2026)
par: Durante, Zane, et autres
Publié: (2026)
CURE: Cultural Understanding and Reasoning Evaluation - A Framework for "Thick" Culture Alignment Evaluation in LLMs
par: Vo, Truong, et autres
Publié: (2025)
par: Vo, Truong, et autres
Publié: (2025)
Cycle Diffusion Model for Counterfactual Image Generation
par: Huang, Fangrui, et autres
Publié: (2025)
par: Huang, Fangrui, et autres
Publié: (2025)
Why Do Safety Guardrails Degrade Across Languages?
par: Zhang, Max, et autres
Publié: (2026)
par: Zhang, Max, et autres
Publié: (2026)
VideoMultiAgents: A Multi-Agent Framework for Video Question Answering
par: Kugo, Noriyuki, et autres
Publié: (2025)
par: Kugo, Noriyuki, et autres
Publié: (2025)
Detecting Corpus-Level Knowledge Inconsistencies in Wikipedia with Large Language Models
par: Semnani, Sina J., et autres
Publié: (2025)
par: Semnani, Sina J., et autres
Publié: (2025)
Discovering Implicit Large Language Model Alignment Objectives
par: Chen, Edward, et autres
Publié: (2026)
par: Chen, Edward, et autres
Publié: (2026)
HiFA: High-fidelity Text-to-3D Generation with Advanced Diffusion Guidance
par: Zhu, Junzhe, et autres
Publié: (2023)
par: Zhu, Junzhe, et autres
Publié: (2023)
Reasoning Models Don't Just Think Longer, They Move Differently
par: Gjølbye, Anders, et autres
Publié: (2026)
par: Gjølbye, Anders, et autres
Publié: (2026)
The Inadequacy of Offline LLM Evaluations: A Need to Account for Personalization in Model Behavior
par: Wang, Angelina, et autres
Publié: (2025)
par: Wang, Angelina, et autres
Publié: (2025)
Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs
par: Wang, Angelina, et autres
Publié: (2025)
par: Wang, Angelina, et autres
Publié: (2025)
A Gentle Approach to Multi-Sensor Fusion Data Using Linear Kalman Filter
par: Veysi, Parsa, et autres
Publié: (2024)
par: Veysi, Parsa, et autres
Publié: (2024)
Discovering Latent Graphs with GFlowNets for Diverse Conditional Image Generation
par: Trang, Bailey, et autres
Publié: (2025)
par: Trang, Bailey, et autres
Publié: (2025)
Transforming and Combining Rewards for Aligning Large Language Models
par: Wang, Zihao, et autres
Publié: (2024)
par: Wang, Zihao, et autres
Publié: (2024)
TherapyProbe: Generating Design Knowledge for Relational Safety in Mental Health Chatbots Through Adversarial Simulation
par: Chandra, Joydeep, et autres
Publié: (2026)
par: Chandra, Joydeep, et autres
Publié: (2026)
Logits are All We Need to Adapt Closed Models
par: Hiranandani, Gaurush, et autres
Publié: (2025)
par: Hiranandani, Gaurush, et autres
Publié: (2025)
SpecEval: Evaluating Model Adherence to Behavior Specifications
par: Ahmed, Ahmed, et autres
Publié: (2025)
par: Ahmed, Ahmed, et autres
Publié: (2025)
Curriculum-Guided Layer Scaling for Language Model Pretraining
par: Singh, Karanpartap, et autres
Publié: (2025)
par: Singh, Karanpartap, et autres
Publié: (2025)
Position: Model Collapse Does Not Mean What You Think
par: Schaeffer, Rylan, et autres
Publié: (2025)
par: Schaeffer, Rylan, et autres
Publié: (2025)
Extracting books from production language models
par: Ahmed, Ahmed, et autres
Publié: (2026)
par: Ahmed, Ahmed, et autres
Publié: (2026)
Is Pre-training Truly Better Than Meta-Learning?
par: Miranda, Brando, et autres
Publié: (2023)
par: Miranda, Brando, et autres
Publié: (2023)
Differentially Private Adaptation of Diffusion Models via Noisy Aggregated Embeddings
par: Peetathawatchai, Pura, et autres
Publié: (2024)
par: Peetathawatchai, Pura, et autres
Publié: (2024)
Reliable and Efficient Amortized Model-based Evaluation
par: Truong, Sang, et autres
Publié: (2025)
par: Truong, Sang, et autres
Publié: (2025)
Scalable Ensembling For Mitigating Reward Overoptimisation
par: Ahmed, Ahmed M., et autres
Publié: (2024)
par: Ahmed, Ahmed M., et autres
Publié: (2024)
Welfare, Improvability, and Variance: A Principal-Agent Approach to Optimal Benchmark Item Aggregation
par: Haupt, Andreas, et autres
Publié: (2026)
par: Haupt, Andreas, et autres
Publié: (2026)
On Fairness of Low-Rank Adaptation of Large Models
par: Ding, Zhoujie, et autres
Publié: (2024)
par: Ding, Zhoujie, et autres
Publié: (2024)
Do You Understand How I Feel?: Towards Verified Empathy in Therapy Chatbots
par: Dettori, Francesco, et autres
Publié: (2026)
par: Dettori, Francesco, et autres
Publié: (2026)
NeuroQA: A Large-Scale Image-Grounded Benchmark for 3D Brain MRI Understanding
par: Abbasi, Mohammad H., et autres
Publié: (2026)
par: Abbasi, Mohammad H., et autres
Publié: (2026)
Lottery Ticket Adaptation: Mitigating Destructive Interference in LLMs
par: Panda, Ashwinee, et autres
Publié: (2024)
par: Panda, Ashwinee, et autres
Publié: (2024)
Scaling Laws for Downstream Task Performance of Large Language Models
par: Isik, Berivan, et autres
Publié: (2024)
par: Isik, Berivan, et autres
Publié: (2024)
AdaVid: Adaptive Video-Language Pretraining
par: Patel, Chaitanya, et autres
Publié: (2025)
par: Patel, Chaitanya, et autres
Publié: (2025)
Steering Away from Memorization: Reachability-Constrained Reinforcement Learning for Text-to-Image Diffusion
par: Karnik, Sathwik, et autres
Publié: (2026)
par: Karnik, Sathwik, et autres
Publié: (2026)
Beyond Scale: The Diversity Coefficient as a Data Quality Metric for Variability in Natural Language Data
par: Miranda, Brando, et autres
Publié: (2023)
par: Miranda, Brando, et autres
Publié: (2023)
HumanLM: Simulating Users with State Alignment Beats Response Imitation
par: Wu, Shirley, et autres
Publié: (2026)
par: Wu, Shirley, et autres
Publié: (2026)
In-Situ Behavioral Evaluation for LLM Fairness, Not Standardized-Test Scores
par: Tang, Zeyu, et autres
Publié: (2026)
par: Tang, Zeyu, et autres
Publié: (2026)
Artist-Created Mesh Generation from Raw Observation
par: He, Yao, et autres
Publié: (2025)
par: He, Yao, et autres
Publié: (2025)
Towards Robust 3D Pose Transfer with Adversarial Learning
par: Chen, Haoyu, et autres
Publié: (2024)
par: Chen, Haoyu, et autres
Publié: (2024)
Adaptive Compression in Federated Learning via Side Information
par: Isik, Berivan, et autres
Publié: (2023)
par: Isik, Berivan, et autres
Publié: (2023)
SWE-chat: Coding Agent Interactions From Real Users in the Wild
par: Baumann, Joachim, et autres
Publié: (2026)
par: Baumann, Joachim, et autres
Publié: (2026)
From Passive to Active Reasoning: Can Large Language Models Ask the Right Questions under Incomplete Information?
par: Zhou, Zhanke, et autres
Publié: (2025)
par: Zhou, Zhanke, et autres
Publié: (2025)
Documents similaires
-
VideoWeave: A Data-Centric Approach for Efficient Video Understanding
par: Durante, Zane, et autres
Publié: (2026) -
CURE: Cultural Understanding and Reasoning Evaluation - A Framework for "Thick" Culture Alignment Evaluation in LLMs
par: Vo, Truong, et autres
Publié: (2025) -
Cycle Diffusion Model for Counterfactual Image Generation
par: Huang, Fangrui, et autres
Publié: (2025) -
Why Do Safety Guardrails Degrade Across Languages?
par: Zhang, Max, et autres
Publié: (2026) -
VideoMultiAgents: A Multi-Agent Framework for Video Question Answering
par: Kugo, Noriyuki, et autres
Publié: (2025)