:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Bae, Sanghwan, Hong, Jiwoo, Lee, Min Young, Kim, Hanbyul, Nam, JeongYeon, Kwak, Donghyun
Format:	Preprint
Publié:	2025
Sujets:	Computation and Language Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2504.03380
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Cross-lingual Collapse: How Language-Centric Foundation Models Shape Reasoning in Large Language Models
par: Park, Cheonbok, et autres
Publié: (2025)

STEPER: Step-wise Knowledge Distillation for Enhancing Reasoning Ability in Multi-Step Retrieval-Augmented Language Models
par: Lee, Kyumin, et autres
Publié: (2025)

ORPO: Monolithic Preference Optimization without Reference Model
par: Hong, Jiwoo, et autres
Publié: (2024)

Advancing Event Forecasting through Massive Training of Large Language Models: Challenges, Solutions, and Broader Impacts
par: Lee, Sang-Woo, et autres
Publié: (2025)

Tackling the Inherent Difficulty of Noise Filtering in RAG
par: Liu, Jingyu, et autres
Publié: (2026)

Pedagogy-R1: Pedagogically-Aligned Reasoning Model with Balanced Educational Benchmark
par: Lee, Unggi, et autres
Publié: (2025)

FENCE: A Financial and Multimodal Jailbreak Detection Dataset
par: Kim, Mirae, et autres
Publié: (2026)

AdaSTaR: Adaptive Data Sampling for Training Self-Taught Reasoners
par: Koh, Woosung, et autres
Publié: (2025)

Revealing User Familiarity Bias in Task-Oriented Dialogue via Interactive Evaluation
par: Kim, Takyoung, et autres
Publié: (2023)

Beyond Ontology in Dialogue State Tracking for Goal-Oriented Chatbot
par: Lee, Sejin, et autres
Publié: (2024)

Rectifying Demonstration Shortcut in In-Context Learning
par: Jang, Joonwon, et autres
Publié: (2024)

Exploring Language Model's Code Generation Ability with Auxiliary Functions
par: Lee, Seonghyeon, et autres
Publié: (2024)

CORAL: Adaptive Retrieval Loop for Culturally-Aligned Multilingual RAG
par: Lee, Nayeon, et autres
Publié: (2026)

MATE: Meet At The Embedding -- Connecting Images with Long Texts
par: Jang, Young Kyun, et autres
Publié: (2024)

Scaling Medical Reasoning Verification via Tool-Integrated Reinforcement Learning
par: Zhang, Hang, et autres
Publié: (2026)

Unlocking the Potential of Diffusion Language Models through Template Infilling
par: Lee, Junhoo, et autres
Publié: (2025)

Cross-lingual Transfer of Reward Models in Multilingual Alignment
par: Hong, Jiwoo, et autres
Publié: (2024)

Learning Unified Distance Metric Across Diverse Data Distributions with Parameter-Efficient Transfer Learning
par: Kim, Sungyeon, et autres
Publié: (2023)

Uncovering Emergent Physics Representations Learned In-Context by Large Language Models
par: Song, Yeongwoo, et autres
Publié: (2025)

E-MMKGR: A Unified Multimodal Knowledge Graph Framework for E-commerce Applications
par: Kang, Jiwoo, et autres
Publié: (2026)

Probing the Difficulty Perception Mechanism of Large Language Models
par: Lee, Sunbowen, et autres
Publié: (2025)

WoLF: Wide-scope Large Language Model Framework for CXR Understanding
par: Kang, Seil, et autres
Publié: (2024)

IPCGRL: Language-Instructed Reinforcement Learning for Procedural Level Generation
par: Baek, In-Chang, et autres
Publié: (2025)

Real-Time Person Image Synthesis Using a Flow Matching Model
par: Jeong, Jiwoo, et autres
Publié: (2025)

Do LLMs Need Inherent Reasoning Before Reinforcement Learning? A Study in Korean Self-Correction
par: Kim, Hongjin, et autres
Publié: (2026)

Leveraging KV Similarity for Online Structured Pruning in LLMs
par: Lee, Jungmin, et autres
Publié: (2025)

KPC-cF: Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering
par: Nam, Kibeom
Publié: (2024)

Federated Learning and RAG Integration: A Scalable Approach for Medical Large Language Models
par: Jung, Jincheol, et autres
Publié: (2024)

No Verifiable Reward for Prosody: Toward Preference-Guided Prosody Learning in TTS
par: Shin, Seungyoun, et autres
Publié: (2025)

Understanding Moral Reasoning Trajectories in Large Language Models: Toward Probing-Based Explainability
par: Huang, Fan, et autres
Publié: (2026)

Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay
par: Sun, Yifan, et autres
Publié: (2025)

Learning When to Translate for Multilingual Reasoning
par: Kang, Deokhyung, et autres
Publié: (2026)

KU-DMIS at EHRSQL 2024:Generating SQL query via question templatization in EHR
par: Kim, Hajung, et autres
Publié: (2024)

Do not think about pink elephant!
par: Hwang, Kyomin, et autres
Publié: (2024)

Model-based Preference Optimization in Abstractive Summarization without Human Feedback
par: Choi, Jaepill, et autres
Publié: (2024)

On the Robustness of Reward Models for Language Model Alignment
par: Hong, Jiwoo, et autres
Publié: (2025)

AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting
par: Huang, Shijue, et autres
Publié: (2025)

DISCO Balances the Scales: Adaptive Domain- and Difficulty-Aware Reinforcement Learning on Imbalanced Data
par: Zhou, Yuhang, et autres
Publié: (2025)

Reinforcement Learning vs. Distillation: Understanding Accuracy and Capability in LLM Reasoning
par: Kim, Minwu, et autres
Publié: (2025)

SALAD: Improving Robustness and Generalization through Contrastive Learning with Structure-Aware and LLM-Driven Augmented Data
par: Bae, Suyoung, et autres
Publié: (2025)