Enregistré dans:
| Auteurs principaux: | Thonet, Thibaut, Kruszewski, Germán, Rozen, Jos, Erbacher, Pierre, Dymetman, Marc |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.04698 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity
par: Kruszewski, Germán, et autres
Publié: (2025)
par: Kruszewski, Germán, et autres
Publié: (2025)
Compositional preference models for aligning LMs
par: Go, Dongyoung, et autres
Publié: (2023)
par: Go, Dongyoung, et autres
Publié: (2023)
Guaranteed Generation from Large Language Models
par: Kim, Minbeom, et autres
Publié: (2024)
par: Kim, Minbeom, et autres
Publié: (2024)
ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language Models
par: Thonet, Thibaut, et autres
Publié: (2024)
par: Thonet, Thibaut, et autres
Publié: (2024)
Drift: Decoding-time Personalized Alignments with Implicit User Preferences
par: Kim, Minbeom, et autres
Publié: (2025)
par: Kim, Minbeom, et autres
Publié: (2025)
Findings of the Third Automatic Minuting (AutoMin) Challenge
par: Shinde, Kartik, et autres
Publié: (2025)
par: Shinde, Kartik, et autres
Publié: (2025)
D-FaST: Cognitive Signal Decoding with Disentangled Frequency-Spatial-Temporal Attention
par: Chen, Weiguo, et autres
Publié: (2024)
par: Chen, Weiguo, et autres
Publié: (2024)
FaST: Efficient and Effective Long-Horizon Forecasting for Large-Scale Spatial-Temporal Graphs via Mixture-of-Experts
par: Zhao, Yiji, et autres
Publié: (2026)
par: Zhao, Yiji, et autres
Publié: (2026)
Self-supervised Attribute-aware Dynamic Preference Ranking Alignment
par: Yang, Hongyu, et autres
Publié: (2025)
par: Yang, Hongyu, et autres
Publié: (2025)
A Survey on Personalized and Pluralistic Preference Alignment in Large Language Models
par: Xie, Zhouhang, et autres
Publié: (2025)
par: Xie, Zhouhang, et autres
Publié: (2025)
MELD-ST: An Emotion-aware Speech Translation Dataset
par: Chen, Sirou, et autres
Publié: (2024)
par: Chen, Sirou, et autres
Publié: (2024)
PACIFIC: Can LLMs Discern the Traits Influencing Your Preferences? Evaluating Personality-Driven Preference Alignment in LLMs
par: Zhao, Tianyu, et autres
Publié: (2026)
par: Zhao, Tianyu, et autres
Publié: (2026)
Alignment Data Map for Efficient Preference Data Selection and Diagnosis
par: Lee, Seohyeong, et autres
Publié: (2025)
par: Lee, Seohyeong, et autres
Publié: (2025)
Reward-aware Preference Optimization: A Unified Mathematical Framework for Model Alignment
par: Sun, Shengyang, et autres
Publié: (2025)
par: Sun, Shengyang, et autres
Publié: (2025)
MiCRo: Mixture Modeling and Context-aware Routing for Personalized Preference Learning
par: Shen, Jingyan, et autres
Publié: (2025)
par: Shen, Jingyan, et autres
Publié: (2025)
Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment
par: Wang, Jialu, et autres
Publié: (2026)
par: Wang, Jialu, et autres
Publié: (2026)
FaBERT: Pre-training BERT on Persian Blogs
par: Masumi, Mostafa, et autres
Publié: (2024)
par: Masumi, Mostafa, et autres
Publié: (2024)
AlpsBench: An LLM Personalization Benchmark for Real-Dialogue Memorization and Preference Alignment
par: Xiao, Jianfei, et autres
Publié: (2026)
par: Xiao, Jianfei, et autres
Publié: (2026)
Exponential families from a single KL identity
par: Dymetman, Marc
Publié: (2026)
par: Dymetman, Marc
Publié: (2026)
Binary Rewards and Reinforcement Learning: Fundamental Challenges
par: Dymetman, Marc
Publié: (2026)
par: Dymetman, Marc
Publié: (2026)
Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback
par: Gao, Songyang, et autres
Publié: (2024)
par: Gao, Songyang, et autres
Publié: (2024)
Teaching Values to Machines: Simulating Human-Like Behavior in LLMs
par: Yehudai, Asaf, et autres
Publié: (2026)
par: Yehudai, Asaf, et autres
Publié: (2026)
Whose Boat Does it Float? Improving Personalization in Preference Tuning via Inferred User Personas
par: Balepur, Nishant, et autres
Publié: (2025)
par: Balepur, Nishant, et autres
Publié: (2025)
FaNS: a Facet-based Narrative Similarity Metric
par: Akter, Mousumi, et autres
Publié: (2023)
par: Akter, Mousumi, et autres
Publié: (2023)
The Limits of Preference Data for Post-Training
par: Zhao, Eric, et autres
Publié: (2025)
par: Zhao, Eric, et autres
Publié: (2025)
Human-Instruction-Free LLM Self-Alignment with Limited Samples
par: Guo, Hongyi, et autres
Publié: (2024)
par: Guo, Hongyi, et autres
Publié: (2024)
Beyond Under-Alignment: Atomic Preference Enhanced Factuality Tuning for Large Language Models
par: Yuan, Hongbang, et autres
Publié: (2024)
par: Yuan, Hongbang, et autres
Publié: (2024)
FedPDPO: Federated Personalized Direct Preference Optimization for Large Language Model Alignment
par: Zhu, Kewen, et autres
Publié: (2026)
par: Zhu, Kewen, et autres
Publié: (2026)
Configurable Preference Tuning with Rubric-Guided Synthetic Data
par: Gallego, Víctor
Publié: (2025)
par: Gallego, Víctor
Publié: (2025)
InstructGraph: Boosting Large Language Models via Graph-centric Instruction Tuning and Preference Alignment
par: Wang, Jianing, et autres
Publié: (2024)
par: Wang, Jianing, et autres
Publié: (2024)
From Generic Empathy to Personalized Emotional Support: A Self-Evolution Framework for User Preference Alignment
par: Ye, Jing, et autres
Publié: (2025)
par: Ye, Jing, et autres
Publié: (2025)
Value Augmented Sampling for Language Model Alignment and Personalization
par: Han, Seungwook, et autres
Publié: (2024)
par: Han, Seungwook, et autres
Publié: (2024)
Alignment through Meta-Weighted Online Sampling: Bridging the Gap between Data Generation and Preference Optimization
par: Yang, Junming, et autres
Publié: (2025)
par: Yang, Junming, et autres
Publié: (2025)
From Preferences to Prejudice: The Role of Alignment Tuning in Shaping Social Bias in Video Diffusion Models
par: Cai, Zefan, et autres
Publié: (2025)
par: Cai, Zefan, et autres
Publié: (2025)
Tuning-Free Personalized Alignment via Trial-Error-Explain In-Context Learning
par: Cho, Hyundong, et autres
Publié: (2025)
par: Cho, Hyundong, et autres
Publié: (2025)
JOLT-SQL: Joint Loss Tuning of Text-to-SQL with Confusion-aware Noisy Schema Sampling
par: Song, Jinwang, et autres
Publié: (2025)
par: Song, Jinwang, et autres
Publié: (2025)
Disperse-Then-Merge: Pushing the Limits of Instruction Tuning via Alignment Tax Reduction
par: Fu, Tingchen, et autres
Publié: (2024)
par: Fu, Tingchen, et autres
Publié: (2024)
Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis
par: Gisserot-Boukhlef, Hippolyte, et autres
Publié: (2024)
par: Gisserot-Boukhlef, Hippolyte, et autres
Publié: (2024)
Alignment Tuning for Large Language Models: A Data-Centric Lens on Alignment Data Pipelines
par: Song, Hwanjun
Publié: (2026)
par: Song, Hwanjun
Publié: (2026)
Exploring LLM-based Data Annotation Strategies for Medical Dialogue Preference Alignment
par: Dou, Chengfeng, et autres
Publié: (2024)
par: Dou, Chengfeng, et autres
Publié: (2024)
Documents similaires
-
Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity
par: Kruszewski, Germán, et autres
Publié: (2025) -
Compositional preference models for aligning LMs
par: Go, Dongyoung, et autres
Publié: (2023) -
Guaranteed Generation from Large Language Models
par: Kim, Minbeom, et autres
Publié: (2024) -
ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language Models
par: Thonet, Thibaut, et autres
Publié: (2024) -
Drift: Decoding-time Personalized Alignments with Implicit User Preferences
par: Kim, Minbeom, et autres
Publié: (2025)