Salvato in:
| Autori principali: | Ding, Hongxin, Huang, Baixiang, Fang, Yue, Liao, Weibin, Jiang, Xinke, Li, Zheng, Zhao, Junfeng, Wang, Yasha |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2508.13514 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Toward Better EHR Reasoning in LLMs: Reinforcement Learning with Expert Attention Guidance
di: Fang, Yue, et al.
Pubblicazione: (2025)
di: Fang, Yue, et al.
Pubblicazione: (2025)
3DS: Medical Domain Adaptation of LLMs via Decomposed Difficulty-based Data Selection
di: Ding, Hongxin, et al.
Pubblicazione: (2024)
di: Ding, Hongxin, et al.
Pubblicazione: (2024)
GraphWalker: Graph-Guided In-Context Learning for Clinical Reasoning on Electronic Health Records
di: Fang, Yue, et al.
Pubblicazione: (2026)
di: Fang, Yue, et al.
Pubblicazione: (2026)
HyKGE: A Hypothesis Knowledge Graph Enhanced Framework for Accurate and Reliable Medical LLMs Responses
di: Jiang, Xinke, et al.
Pubblicazione: (2023)
di: Jiang, Xinke, et al.
Pubblicazione: (2023)
ADEPT: Continual Pretraining via Adaptive Expansion and Dynamic Decoupled Tuning
di: Zhang, Jinyang, et al.
Pubblicazione: (2025)
di: Zhang, Jinyang, et al.
Pubblicazione: (2025)
Bridging Global Intent with Local Details: A Hierarchical Representation Approach for Semantic Validation in Text-to-SQL
di: Qiu, Rihong, et al.
Pubblicazione: (2025)
di: Qiu, Rihong, et al.
Pubblicazione: (2025)
DFAMS: Dynamic-flow guided Federated Alignment based Multi-prototype Search
di: Yang, Zhibang, et al.
Pubblicazione: (2025)
di: Yang, Zhibang, et al.
Pubblicazione: (2025)
TC-RAG:Turing-Complete RAG's Case study on Medical LLM Systems
di: Jiang, Xinke, et al.
Pubblicazione: (2024)
di: Jiang, Xinke, et al.
Pubblicazione: (2024)
Infinite-Horizon Graph Filters: Leveraging Power Series to Enhance Sparse Information Aggregation
di: Zhang, Ruizhe, et al.
Pubblicazione: (2024)
di: Zhang, Ruizhe, et al.
Pubblicazione: (2024)
TPO: Aligning Large Language Models with Multi-branch & Multi-step Preference Trees
di: Liao, Weibin, et al.
Pubblicazione: (2024)
di: Liao, Weibin, et al.
Pubblicazione: (2024)
LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation
di: Liao, Weibin, et al.
Pubblicazione: (2024)
di: Liao, Weibin, et al.
Pubblicazione: (2024)
Magical: Medical Lay Language Generation via Semantic Invariance and Layperson-tailored Adaptation
di: Liao, Weibin, et al.
Pubblicazione: (2025)
di: Liao, Weibin, et al.
Pubblicazione: (2025)
KnowPO: Knowledge-aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models
di: Zhang, Ruizhe, et al.
Pubblicazione: (2024)
di: Zhang, Ruizhe, et al.
Pubblicazione: (2024)
MedReflect: Teaching Medical LLMs to Self-Improve via Reflective Correction
di: Huang, Yue, et al.
Pubblicazione: (2025)
di: Huang, Yue, et al.
Pubblicazione: (2025)
RAGraph: A General Retrieval-Augmented Graph Learning Framework
di: Jiang, Xinke, et al.
Pubblicazione: (2024)
di: Jiang, Xinke, et al.
Pubblicazione: (2024)
Authorship Attribution in the Era of LLMs: Problems, Methodologies, and Challenges
di: Huang, Baixiang, et al.
Pubblicazione: (2024)
di: Huang, Baixiang, et al.
Pubblicazione: (2024)
LearNAT: Learning NL2SQL with AST-guided Task Decomposition for Large Language Models
di: Liao, Weibin, et al.
Pubblicazione: (2025)
di: Liao, Weibin, et al.
Pubblicazione: (2025)
ProActor: Timing-Aware Reinforcement Learning for Proactive Task Scheduling Agents
di: Ding, Lei, et al.
Pubblicazione: (2026)
di: Ding, Lei, et al.
Pubblicazione: (2026)
Parenting: Optimizing Knowledge Selection of Retrieval-Augmented Language Models with Parameter Decoupling and Tailored Tuning
di: Xu, Yongxin, et al.
Pubblicazione: (2024)
di: Xu, Yongxin, et al.
Pubblicazione: (2024)
StackPlanner: A Centralized Hierarchical Multi-Agent System with Task-Experience Memory Management
di: Zhang, Ruizhe, et al.
Pubblicazione: (2026)
di: Zhang, Ruizhe, et al.
Pubblicazione: (2026)
Approaching Scarless Wound Healing: From Passive Anti‐Fibrotic to Proactive and Programmable Pro‐Regenerative Strategies
di: Meimei Fu, et al.
Pubblicazione: (2026)
di: Meimei Fu, et al.
Pubblicazione: (2026)
MedVR: Annotation-Free Medical Visual Reasoning via Agentic Reinforcement Learning
di: Jiang, Zheng, et al.
Pubblicazione: (2026)
di: Jiang, Zheng, et al.
Pubblicazione: (2026)
MedCare: Advancing Medical LLMs through Decoupling Clinical Alignment and Knowledge Aggregation
di: Liao, Yusheng, et al.
Pubblicazione: (2024)
di: Liao, Yusheng, et al.
Pubblicazione: (2024)
ProSec: Fortifying Code LLMs with Proactive Security Alignment
di: Xu, Xiangzhe, et al.
Pubblicazione: (2024)
di: Xu, Xiangzhe, et al.
Pubblicazione: (2024)
Med-PMC: Medical Personalized Multi-modal Consultation with a Proactive Ask-First-Observe-Next Paradigm
di: Liu, Hongcheng, et al.
Pubblicazione: (2024)
di: Liu, Hongcheng, et al.
Pubblicazione: (2024)
HiMed: Incentivizing Hindi Reasoning in Medical LLMs
di: Jiang, Dingfeng, et al.
Pubblicazione: (2026)
di: Jiang, Dingfeng, et al.
Pubblicazione: (2026)
MIRL: Mutual Information-Guided Reinforcement Learning for Vision-Language Models
di: Zhang, Yin, et al.
Pubblicazione: (2026)
di: Zhang, Yin, et al.
Pubblicazione: (2026)
Reinforcement Learning Tuning for VideoLLMs: Reward Design and Data Efficiency
di: Li, Hongyu, et al.
Pubblicazione: (2025)
di: Li, Hongyu, et al.
Pubblicazione: (2025)
ConfAgents: A Conformal-Guided Multi-Agent Framework for Cost-Efficient Medical Diagnosis
di: Zhao, Huiya, et al.
Pubblicazione: (2025)
di: Zhao, Huiya, et al.
Pubblicazione: (2025)
Mixture Compressor for Mixture-of-Experts LLMs Gains More
di: Huang, Wei, et al.
Pubblicazione: (2024)
di: Huang, Wei, et al.
Pubblicazione: (2024)
Med-R$^3$: Enhancing Medical Retrieval-Augmented Reasoning of LLMs via Progressive Reinforcement Learning
di: Lu, Keer, et al.
Pubblicazione: (2025)
di: Lu, Keer, et al.
Pubblicazione: (2025)
MedAD-R1: Eliciting Consistent Reasoning in Interpretible Medical Anomaly Detection via Consistency-Reinforced Policy Optimization
di: Zhang, Haitao, et al.
Pubblicazione: (2026)
di: Zhang, Haitao, et al.
Pubblicazione: (2026)
Med-HEAL: Analyzing and Mitigating Hallucinations in Medical LLMs with Hallucination-Aware In-Context Learning
di: Liao, Yiming, et al.
Pubblicazione: (2026)
di: Liao, Yiming, et al.
Pubblicazione: (2026)
Can Large Language Models Identify Authorship?
di: Huang, Baixiang, et al.
Pubblicazione: (2024)
di: Huang, Baixiang, et al.
Pubblicazione: (2024)
SMART: Towards Pre-trained Missing-Aware Model for Patient Health Status Prediction
di: Yu, Zhihao, et al.
Pubblicazione: (2024)
di: Yu, Zhihao, et al.
Pubblicazione: (2024)
ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation
di: Hou, Hongru, et al.
Pubblicazione: (2026)
di: Hou, Hongru, et al.
Pubblicazione: (2026)
ProAct: A Dual-System Framework for Proactive Embodied Social Agents
di: Zhang, Zeyi, et al.
Pubblicazione: (2026)
di: Zhang, Zeyi, et al.
Pubblicazione: (2026)
ProMedTS: A Self-Supervised, Prompt-Guided Multimodal Approach for Integrating Medical Text and Time Series
di: Niu, Shuai, et al.
Pubblicazione: (2025)
di: Niu, Shuai, et al.
Pubblicazione: (2025)
MrBlankness/HyFunc: HyFunc -- KDD'26
di: Weibin Liao
Pubblicazione: (2026)
di: Weibin Liao
Pubblicazione: (2026)
Legal$Δ$: Enhancing Legal Reasoning in LLMs via Reinforcement Learning with Chain-of-Thought Guided Information Gain
di: Dai, Xin, et al.
Pubblicazione: (2025)
di: Dai, Xin, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Toward Better EHR Reasoning in LLMs: Reinforcement Learning with Expert Attention Guidance
di: Fang, Yue, et al.
Pubblicazione: (2025) -
3DS: Medical Domain Adaptation of LLMs via Decomposed Difficulty-based Data Selection
di: Ding, Hongxin, et al.
Pubblicazione: (2024) -
GraphWalker: Graph-Guided In-Context Learning for Clinical Reasoning on Electronic Health Records
di: Fang, Yue, et al.
Pubblicazione: (2026) -
HyKGE: A Hypothesis Knowledge Graph Enhanced Framework for Accurate and Reliable Medical LLMs Responses
di: Jiang, Xinke, et al.
Pubblicazione: (2023) -
ADEPT: Continual Pretraining via Adaptive Expansion and Dynamic Decoupled Tuning
di: Zhang, Jinyang, et al.
Pubblicazione: (2025)