Gespeichert in:
| Hauptverfasser: | Tan, Lit Sin, Chen, Junzhe, Fu, Xiaolong, Ma, Lichen, Huang, Junshi, Shi, Jianzhong, Li, Yan, Wen, Lijie |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2603.15724 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
TTRL: Test-Time Reinforcement Learning
von: Zuo, Yuxin, et al.
Veröffentlicht: (2025)
von: Zuo, Yuxin, et al.
Veröffentlicht: (2025)
Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling
von: Fu, Xiaolong, et al.
Veröffentlicht: (2025)
von: Fu, Xiaolong, et al.
Veröffentlicht: (2025)
UM-Text: A Unified Multimodal Model for Image Understanding and Visual Text Editing
von: Ma, Lichen, et al.
Veröffentlicht: (2026)
von: Ma, Lichen, et al.
Veröffentlicht: (2026)
AQA-TTRL: Self-Adaptation in Audio Question Answering with Test-Time Reinforcement Learning
von: Zhang, Haoyu, et al.
Veröffentlicht: (2025)
von: Zhang, Haoyu, et al.
Veröffentlicht: (2025)
FrequencyBooster: Full-Frequency Modeling for High-Fidelity Pixel Diffusion
von: Ma, Lichen, et al.
Veröffentlicht: (2026)
von: Ma, Lichen, et al.
Veröffentlicht: (2026)
CG-TTRL: Context-Guided Test-Time Reinforcement Learning for On-Device Large Language Models
von: Hosseini, Peyman, et al.
Veröffentlicht: (2025)
von: Hosseini, Peyman, et al.
Veröffentlicht: (2025)
Fashion130K: An E-commerce Fashion Dataset for Outfit Generation with Unified Multi-modal Condition
von: He, Yu, et al.
Veröffentlicht: (2026)
von: He, Yu, et al.
Veröffentlicht: (2026)
CoT2-Meta: Budgeted Metacognitive Control for Test-Time Reasoning
von: Ma, Siyuan, et al.
Veröffentlicht: (2026)
von: Ma, Siyuan, et al.
Veröffentlicht: (2026)
HyperDiT: Hyper-Connected Transformers for High-Fidelity Pixel-Space Diffusion
von: He, Yu, et al.
Veröffentlicht: (2026)
von: He, Yu, et al.
Veröffentlicht: (2026)
RePainter: Empowering E-commerce Object Removal via Spatial-matting Reinforcement Learning
von: Guo, Zipeng, et al.
Veröffentlicht: (2025)
von: Guo, Zipeng, et al.
Veröffentlicht: (2025)
Beyond Meta-Reasoning: Metacognitive Consolidation for Self-Improving LLM Reasoning
von: Zhuang, Ziqing, et al.
Veröffentlicht: (2026)
von: Zhuang, Ziqing, et al.
Veröffentlicht: (2026)
LiWi: Layering in the Wild
von: He, Yu, et al.
Veröffentlicht: (2026)
von: He, Yu, et al.
Veröffentlicht: (2026)
Do We Really Need External Tools to Mitigate Hallucinations? SIRA: Shared-Prefix Internal Reconstruction of Attribution
von: Qin, Tian, et al.
Veröffentlicht: (2026)
von: Qin, Tian, et al.
Veröffentlicht: (2026)
SUDER: Self-Improving Unified Large Multimodal Models for Understanding and Generation with Dual Self-Rewards
von: Hong, Jixiang, et al.
Veröffentlicht: (2025)
von: Hong, Jixiang, et al.
Veröffentlicht: (2025)
Irec: A Metacognitive Scaffolding for Self-Regulated Learning through Just-in-Time Insight Recall: A Conceptual Framework and System Prototype
von: Hou, Xuefei, et al.
Veröffentlicht: (2025)
von: Hou, Xuefei, et al.
Veröffentlicht: (2025)
UniT: Unified Multimodal Chain-of-Thought Test-time Scaling
von: Chen, Leon Liangyu, et al.
Veröffentlicht: (2026)
von: Chen, Leon Liangyu, et al.
Veröffentlicht: (2026)
Metacognitive Sensitivity for Test-Time Dynamic Model Selection
von: Trinh, Le Tuan Minh, et al.
Veröffentlicht: (2025)
von: Trinh, Le Tuan Minh, et al.
Veröffentlicht: (2025)
Exploring the Output of Software Testing Tools through a Visual Comparative Analysis
von: Lit, Brandon, et al.
Veröffentlicht: (2026)
von: Lit, Brandon, et al.
Veröffentlicht: (2026)
MetaCogAgent: A Metacognitive Multi-Agent LLM Framework with Self-Aware Task Delegation
von: Wang, Chenyu, et al.
Veröffentlicht: (2026)
von: Wang, Chenyu, et al.
Veröffentlicht: (2026)
MetaCLASS: Metacognitive Coaching for Learning with Adaptive Self-regulation Support
von: Liu, Naiming, et al.
Veröffentlicht: (2026)
von: Liu, Naiming, et al.
Veröffentlicht: (2026)
UniRL: Self-Improving Unified Multimodal Models via Supervised and Reinforcement Learning
von: Mao, Weijia, et al.
Veröffentlicht: (2025)
von: Mao, Weijia, et al.
Veröffentlicht: (2025)
The Debate on the Dietary Guidelines for Americans (2025–2030) and Implications for China's Nutritional Policy
von: Junshi Chen
Veröffentlicht: (2026)
von: Junshi Chen
Veröffentlicht: (2026)
Truly Self-Improving Agents Require Intrinsic Metacognitive Learning
von: Liu, Tennison, et al.
Veröffentlicht: (2025)
von: Liu, Tennison, et al.
Veröffentlicht: (2025)
MENTOR: A Metacognition-Driven Self-Evolution Framework for Uncovering and Mitigating Implicit Domain Risks in LLMs
von: Shan, Liang, et al.
Veröffentlicht: (2025)
von: Shan, Liang, et al.
Veröffentlicht: (2025)
The PCP-like Theorem for Sub-linear Time Inapproximability
von: Ma, Hengzhao, et al.
Veröffentlicht: (2021)
von: Ma, Hengzhao, et al.
Veröffentlicht: (2021)
Test-Time Meta-Adaptation with Self-Synthesis
von: Kaya, Zeyneb N., et al.
Veröffentlicht: (2026)
von: Kaya, Zeyneb N., et al.
Veröffentlicht: (2026)
Curiosity and Metacognition: Towards a Unified Framework for Learning and Education in the Age of AI
von: Desvaux, Chloé, et al.
Veröffentlicht: (2026)
von: Desvaux, Chloé, et al.
Veröffentlicht: (2026)
A$^3$PIM: An Automated, Analytic and Accurate Processing-in-Memory Offloader
von: Jiang, Qingcai, et al.
Veröffentlicht: (2024)
von: Jiang, Qingcai, et al.
Veröffentlicht: (2024)
OmniDPO: A Preference Optimization Framework to Address Omni-Modal Hallucination
von: Chen, Junzhe, et al.
Veröffentlicht: (2025)
von: Chen, Junzhe, et al.
Veröffentlicht: (2025)
MetaEmbed: Scaling Multimodal Retrieval at Test-Time with Flexible Late Interaction
von: Xiao, Zilin, et al.
Veröffentlicht: (2025)
von: Xiao, Zilin, et al.
Veröffentlicht: (2025)
Test-Time Regret Minimization in Meta Reinforcement Learning
von: Mutti, Mirco, et al.
Veröffentlicht: (2024)
von: Mutti, Mirco, et al.
Veröffentlicht: (2024)
PER-DPP Sampling Framework and Its Application in Path Planning
von: Wang, Junzhe
Veröffentlicht: (2025)
von: Wang, Junzhe
Veröffentlicht: (2025)
Unsupervised Domain Adaptation Architecture Search with Self-Training for Land Cover Mapping
von: Broni-Bediako, Clifford, et al.
Veröffentlicht: (2024)
von: Broni-Bediako, Clifford, et al.
Veröffentlicht: (2024)
A Unified Information-Theoretic Framework for Meta-Learning Generalization
von: Wen, Wen, et al.
Veröffentlicht: (2025)
von: Wen, Wen, et al.
Veröffentlicht: (2025)
ImAgent: A Unified Multimodal Agent Framework for Test-Time Scalable Image Generation
von: Wang, Kaishen, et al.
Veröffentlicht: (2025)
von: Wang, Kaishen, et al.
Veröffentlicht: (2025)
UniCorn: Towards Self-Improving Unified Multimodal Models through Self-Generated Supervision
von: Han, Ruiyan, et al.
Veröffentlicht: (2026)
von: Han, Ruiyan, et al.
Veröffentlicht: (2026)
UniMotion: A Unified Motion Framework for Simulation, Prediction and Planning
von: Song, Nan, et al.
Veröffentlicht: (2026)
von: Song, Nan, et al.
Veröffentlicht: (2026)
UR$^2$: Unify RAG and Reasoning through Reinforcement Learning
von: Li, Weitao, et al.
Veröffentlicht: (2025)
von: Li, Weitao, et al.
Veröffentlicht: (2025)
Meta Fusion: A Unified Framework For Multimodality Fusion with Mutual Learning
von: Liang, Ziyi, et al.
Veröffentlicht: (2025)
von: Liang, Ziyi, et al.
Veröffentlicht: (2025)
ICT: Image-Object Cross-Level Trusted Intervention for Mitigating Object Hallucination in Large Vision-Language Models
von: Chen, Junzhe, et al.
Veröffentlicht: (2024)
von: Chen, Junzhe, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
TTRL: Test-Time Reinforcement Learning
von: Zuo, Yuxin, et al.
Veröffentlicht: (2025) -
Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling
von: Fu, Xiaolong, et al.
Veröffentlicht: (2025) -
UM-Text: A Unified Multimodal Model for Image Understanding and Visual Text Editing
von: Ma, Lichen, et al.
Veröffentlicht: (2026) -
AQA-TTRL: Self-Adaptation in Audio Question Answering with Test-Time Reinforcement Learning
von: Zhang, Haoyu, et al.
Veröffentlicht: (2025) -
FrequencyBooster: Full-Frequency Modeling for High-Fidelity Pixel Diffusion
von: Ma, Lichen, et al.
Veröffentlicht: (2026)