Enregistré dans:
| Auteurs principaux: | Bae, Sanghwan, Hong, Jiwoo, Lee, Min Young, Kim, Hanbyul, Nam, JeongYeon, Kwak, Donghyun |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2504.03380 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Cross-lingual Collapse: How Language-Centric Foundation Models Shape Reasoning in Large Language Models
par: Park, Cheonbok, et autres
Publié: (2025)
par: Park, Cheonbok, et autres
Publié: (2025)
STEPER: Step-wise Knowledge Distillation for Enhancing Reasoning Ability in Multi-Step Retrieval-Augmented Language Models
par: Lee, Kyumin, et autres
Publié: (2025)
par: Lee, Kyumin, et autres
Publié: (2025)
ORPO: Monolithic Preference Optimization without Reference Model
par: Hong, Jiwoo, et autres
Publié: (2024)
par: Hong, Jiwoo, et autres
Publié: (2024)
Advancing Event Forecasting through Massive Training of Large Language Models: Challenges, Solutions, and Broader Impacts
par: Lee, Sang-Woo, et autres
Publié: (2025)
par: Lee, Sang-Woo, et autres
Publié: (2025)
Tackling the Inherent Difficulty of Noise Filtering in RAG
par: Liu, Jingyu, et autres
Publié: (2026)
par: Liu, Jingyu, et autres
Publié: (2026)
Pedagogy-R1: Pedagogically-Aligned Reasoning Model with Balanced Educational Benchmark
par: Lee, Unggi, et autres
Publié: (2025)
par: Lee, Unggi, et autres
Publié: (2025)
FENCE: A Financial and Multimodal Jailbreak Detection Dataset
par: Kim, Mirae, et autres
Publié: (2026)
par: Kim, Mirae, et autres
Publié: (2026)
AdaSTaR: Adaptive Data Sampling for Training Self-Taught Reasoners
par: Koh, Woosung, et autres
Publié: (2025)
par: Koh, Woosung, et autres
Publié: (2025)
Revealing User Familiarity Bias in Task-Oriented Dialogue via Interactive Evaluation
par: Kim, Takyoung, et autres
Publié: (2023)
par: Kim, Takyoung, et autres
Publié: (2023)
Beyond Ontology in Dialogue State Tracking for Goal-Oriented Chatbot
par: Lee, Sejin, et autres
Publié: (2024)
par: Lee, Sejin, et autres
Publié: (2024)
Rectifying Demonstration Shortcut in In-Context Learning
par: Jang, Joonwon, et autres
Publié: (2024)
par: Jang, Joonwon, et autres
Publié: (2024)
Exploring Language Model's Code Generation Ability with Auxiliary Functions
par: Lee, Seonghyeon, et autres
Publié: (2024)
par: Lee, Seonghyeon, et autres
Publié: (2024)
CORAL: Adaptive Retrieval Loop for Culturally-Aligned Multilingual RAG
par: Lee, Nayeon, et autres
Publié: (2026)
par: Lee, Nayeon, et autres
Publié: (2026)
MATE: Meet At The Embedding -- Connecting Images with Long Texts
par: Jang, Young Kyun, et autres
Publié: (2024)
par: Jang, Young Kyun, et autres
Publié: (2024)
Scaling Medical Reasoning Verification via Tool-Integrated Reinforcement Learning
par: Zhang, Hang, et autres
Publié: (2026)
par: Zhang, Hang, et autres
Publié: (2026)
Unlocking the Potential of Diffusion Language Models through Template Infilling
par: Lee, Junhoo, et autres
Publié: (2025)
par: Lee, Junhoo, et autres
Publié: (2025)
Cross-lingual Transfer of Reward Models in Multilingual Alignment
par: Hong, Jiwoo, et autres
Publié: (2024)
par: Hong, Jiwoo, et autres
Publié: (2024)
Learning Unified Distance Metric Across Diverse Data Distributions with Parameter-Efficient Transfer Learning
par: Kim, Sungyeon, et autres
Publié: (2023)
par: Kim, Sungyeon, et autres
Publié: (2023)
Uncovering Emergent Physics Representations Learned In-Context by Large Language Models
par: Song, Yeongwoo, et autres
Publié: (2025)
par: Song, Yeongwoo, et autres
Publié: (2025)
E-MMKGR: A Unified Multimodal Knowledge Graph Framework for E-commerce Applications
par: Kang, Jiwoo, et autres
Publié: (2026)
par: Kang, Jiwoo, et autres
Publié: (2026)
Probing the Difficulty Perception Mechanism of Large Language Models
par: Lee, Sunbowen, et autres
Publié: (2025)
par: Lee, Sunbowen, et autres
Publié: (2025)
WoLF: Wide-scope Large Language Model Framework for CXR Understanding
par: Kang, Seil, et autres
Publié: (2024)
par: Kang, Seil, et autres
Publié: (2024)
IPCGRL: Language-Instructed Reinforcement Learning for Procedural Level Generation
par: Baek, In-Chang, et autres
Publié: (2025)
par: Baek, In-Chang, et autres
Publié: (2025)
Real-Time Person Image Synthesis Using a Flow Matching Model
par: Jeong, Jiwoo, et autres
Publié: (2025)
par: Jeong, Jiwoo, et autres
Publié: (2025)
Do LLMs Need Inherent Reasoning Before Reinforcement Learning? A Study in Korean Self-Correction
par: Kim, Hongjin, et autres
Publié: (2026)
par: Kim, Hongjin, et autres
Publié: (2026)
Leveraging KV Similarity for Online Structured Pruning in LLMs
par: Lee, Jungmin, et autres
Publié: (2025)
par: Lee, Jungmin, et autres
Publié: (2025)
KPC-cF: Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering
par: Nam, Kibeom
Publié: (2024)
par: Nam, Kibeom
Publié: (2024)
Federated Learning and RAG Integration: A Scalable Approach for Medical Large Language Models
par: Jung, Jincheol, et autres
Publié: (2024)
par: Jung, Jincheol, et autres
Publié: (2024)
No Verifiable Reward for Prosody: Toward Preference-Guided Prosody Learning in TTS
par: Shin, Seungyoun, et autres
Publié: (2025)
par: Shin, Seungyoun, et autres
Publié: (2025)
Understanding Moral Reasoning Trajectories in Large Language Models: Toward Probing-Based Explainability
par: Huang, Fan, et autres
Publié: (2026)
par: Huang, Fan, et autres
Publié: (2026)
Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay
par: Sun, Yifan, et autres
Publié: (2025)
par: Sun, Yifan, et autres
Publié: (2025)
Learning When to Translate for Multilingual Reasoning
par: Kang, Deokhyung, et autres
Publié: (2026)
par: Kang, Deokhyung, et autres
Publié: (2026)
KU-DMIS at EHRSQL 2024:Generating SQL query via question templatization in EHR
par: Kim, Hajung, et autres
Publié: (2024)
par: Kim, Hajung, et autres
Publié: (2024)
Do not think about pink elephant!
par: Hwang, Kyomin, et autres
Publié: (2024)
par: Hwang, Kyomin, et autres
Publié: (2024)
Model-based Preference Optimization in Abstractive Summarization without Human Feedback
par: Choi, Jaepill, et autres
Publié: (2024)
par: Choi, Jaepill, et autres
Publié: (2024)
On the Robustness of Reward Models for Language Model Alignment
par: Hong, Jiwoo, et autres
Publié: (2025)
par: Hong, Jiwoo, et autres
Publié: (2025)
AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting
par: Huang, Shijue, et autres
Publié: (2025)
par: Huang, Shijue, et autres
Publié: (2025)
DISCO Balances the Scales: Adaptive Domain- and Difficulty-Aware Reinforcement Learning on Imbalanced Data
par: Zhou, Yuhang, et autres
Publié: (2025)
par: Zhou, Yuhang, et autres
Publié: (2025)
Reinforcement Learning vs. Distillation: Understanding Accuracy and Capability in LLM Reasoning
par: Kim, Minwu, et autres
Publié: (2025)
par: Kim, Minwu, et autres
Publié: (2025)
SALAD: Improving Robustness and Generalization through Contrastive Learning with Structure-Aware and LLM-Driven Augmented Data
par: Bae, Suyoung, et autres
Publié: (2025)
par: Bae, Suyoung, et autres
Publié: (2025)
Documents similaires
-
Cross-lingual Collapse: How Language-Centric Foundation Models Shape Reasoning in Large Language Models
par: Park, Cheonbok, et autres
Publié: (2025) -
STEPER: Step-wise Knowledge Distillation for Enhancing Reasoning Ability in Multi-Step Retrieval-Augmented Language Models
par: Lee, Kyumin, et autres
Publié: (2025) -
ORPO: Monolithic Preference Optimization without Reference Model
par: Hong, Jiwoo, et autres
Publié: (2024) -
Advancing Event Forecasting through Massive Training of Large Language Models: Challenges, Solutions, and Broader Impacts
par: Lee, Sang-Woo, et autres
Publié: (2025) -
Tackling the Inherent Difficulty of Noise Filtering in RAG
par: Liu, Jingyu, et autres
Publié: (2026)