Salvato in:
| Autori principali: | Song, Zeen, Qiang, Wenwen, Zhao, Siyu, Zheng, Changwen, Hua, Gang |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2505.18065 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Adaptive Uncertainty-Aware Tree Search for Robust Reasoning
di: Song, Zeen, et al.
Pubblicazione: (2026)
di: Song, Zeen, et al.
Pubblicazione: (2026)
Beyond All-to-All: Causal-Aligned Transformer with Dynamic Structure Learning for Multivariate Time Series Forecasting
di: Zhang, Xingyu, et al.
Pubblicazione: (2025)
di: Zhang, Xingyu, et al.
Pubblicazione: (2025)
Not All Frequencies Are Created Equal:Towards a Dynamic Fusion of Frequencies in Time-Series Forecasting
di: Zhang, Xingyu, et al.
Pubblicazione: (2024)
di: Zhang, Xingyu, et al.
Pubblicazione: (2024)
On the Out-of-Distribution Generalization of Self-Supervised Learning
di: Qiang, Wenwen, et al.
Pubblicazione: (2025)
di: Qiang, Wenwen, et al.
Pubblicazione: (2025)
Causal Reward Adjustment: Mitigating Reward Hacking in External Reasoning via Backdoor Correction
di: Song, Ruike, et al.
Pubblicazione: (2025)
di: Song, Ruike, et al.
Pubblicazione: (2025)
Learning to Think: Information-Theoretic Reinforcement Fine-Tuning for LLMs
di: Wang, Jingyao, et al.
Pubblicazione: (2025)
di: Wang, Jingyao, et al.
Pubblicazione: (2025)
Closing the Loop: A Control-Theoretic Framework for Provably Stable Time Series Forecasting with LLMs
di: Zhang, Xingyu, et al.
Pubblicazione: (2026)
di: Zhang, Xingyu, et al.
Pubblicazione: (2026)
Hacking Task Confounder in Meta-Learning
di: Wang, Jingyao, et al.
Pubblicazione: (2023)
di: Wang, Jingyao, et al.
Pubblicazione: (2023)
Group Causal Policy Optimization for Post-Training Large Language Models
di: Gu, Ziyin, et al.
Pubblicazione: (2025)
di: Gu, Ziyin, et al.
Pubblicazione: (2025)
On the Generalization and Causal Explanation in Self-Supervised Learning
di: Qiang, Wenwen, et al.
Pubblicazione: (2024)
di: Qiang, Wenwen, et al.
Pubblicazione: (2024)
Self-Supervised Video Representation Learning in a Heuristic Decoupled Perspective
di: Song, Zeen, et al.
Pubblicazione: (2024)
di: Song, Zeen, et al.
Pubblicazione: (2024)
On the Universality of Self-Supervised Learning
di: Qiang, Wenwen, et al.
Pubblicazione: (2024)
di: Qiang, Wenwen, et al.
Pubblicazione: (2024)
CAMD: Coverage-Aware Multimodal Decoding for Efficient Reasoning of Multimodal Large Language Models
di: Guo, Huijie, et al.
Pubblicazione: (2026)
di: Guo, Huijie, et al.
Pubblicazione: (2026)
Rethinking Meta-Learning from a Learning Lens
di: Wang, Jingyao, et al.
Pubblicazione: (2024)
di: Wang, Jingyao, et al.
Pubblicazione: (2024)
Rethinking Multi-Modal Learning from Gradient Uncertainty
di: Guo, Peizheng, et al.
Pubblicazione: (2025)
di: Guo, Peizheng, et al.
Pubblicazione: (2025)
Learning Invariant Causal Mechanism from Vision-Language Models
di: Song, Zeen, et al.
Pubblicazione: (2024)
di: Song, Zeen, et al.
Pubblicazione: (2024)
Enhancing Large Language Models for Time-Series Forecasting via Vector-Injected In-Context Learning
di: Zhang, Jianqi, et al.
Pubblicazione: (2026)
di: Zhang, Jianqi, et al.
Pubblicazione: (2026)
Neuromodulated Meta-Learning
di: Wang, Jingyao, et al.
Pubblicazione: (2024)
di: Wang, Jingyao, et al.
Pubblicazione: (2024)
Towards the Causal Complete Cause of Multi-Modal Representation Learning
di: Wang, Jingyao, et al.
Pubblicazione: (2024)
di: Wang, Jingyao, et al.
Pubblicazione: (2024)
Towards Generalizable Reasoning: Group Causal Counterfactual Policy Optimization for LLM Reasoning
di: Wang, Jingyao, et al.
Pubblicazione: (2026)
di: Wang, Jingyao, et al.
Pubblicazione: (2026)
Spatio-Temporal Fuzzy-oriented Multi-Modal Meta-Learning for Fine-grained Emotion Recognition
di: Wang, Jingyao, et al.
Pubblicazione: (2024)
di: Wang, Jingyao, et al.
Pubblicazione: (2024)
On the Discriminability of Self-Supervised Representation Learning
di: Song, Zeen, et al.
Pubblicazione: (2024)
di: Song, Zeen, et al.
Pubblicazione: (2024)
From Shallow to Deep: Pinning Semantic Intent via Causal GRPO
di: Zhou, Shuyi, et al.
Pubblicazione: (2026)
di: Zhou, Shuyi, et al.
Pubblicazione: (2026)
On the Plasticity and Stability for Post-Training Large Language Models
di: Qiang, Wenwen, et al.
Pubblicazione: (2026)
di: Qiang, Wenwen, et al.
Pubblicazione: (2026)
AwesomeMeta+: A Mixed-Prototyping Meta-Learning System Supporting AI Application Design Anywhere
di: Wang, Jingyao, et al.
Pubblicazione: (2023)
di: Wang, Jingyao, et al.
Pubblicazione: (2023)
Doubly Debiased Test-Time Prompt Tuning for Vision-Language Models
di: Song, Fei, et al.
Pubblicazione: (2025)
di: Song, Fei, et al.
Pubblicazione: (2025)
Exploring Transferability of Self-Supervised Learning by Task Conflict Calibration
di: Guo, Huijie, et al.
Pubblicazione: (2025)
di: Guo, Huijie, et al.
Pubblicazione: (2025)
Towards Task Sampler Learning for Meta-Learning
di: Wang, Jingyao, et al.
Pubblicazione: (2023)
di: Wang, Jingyao, et al.
Pubblicazione: (2023)
RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time
di: Wang, Haozhe, et al.
Pubblicazione: (2026)
di: Wang, Haozhe, et al.
Pubblicazione: (2026)
On the Transferability and Discriminability of Repersentation Learning in Unsupervised Domain Adaptation
di: Qiang, Wenwen, et al.
Pubblicazione: (2025)
di: Qiang, Wenwen, et al.
Pubblicazione: (2025)
Causal Front-Door Adjustment for Robust Jailbreak Attacks on LLMs
di: Zhou, Yao, et al.
Pubblicazione: (2026)
di: Zhou, Yao, et al.
Pubblicazione: (2026)
Linking Process to Outcome: Conditional Reward Modeling for LLM Reasoning
di: Zhang, Zheng, et al.
Pubblicazione: (2025)
di: Zhang, Zheng, et al.
Pubblicazione: (2025)
ERPO: Token-Level Entropy-Regulated Policy Optimization for Large Reasoning Models
di: Yu, Song, et al.
Pubblicazione: (2026)
di: Yu, Song, et al.
Pubblicazione: (2026)
On the Limits of Test-Time Compute: Sequential Reward Filtering for Better Inference
di: Yu, Yue, et al.
Pubblicazione: (2025)
di: Yu, Yue, et al.
Pubblicazione: (2025)
Exploration-Driven Optimization for Test-Time Large Language Model Reasoning
di: Li, Changhao, et al.
Pubblicazione: (2026)
di: Li, Changhao, et al.
Pubblicazione: (2026)
Interventional Imbalanced Multi-Modal Representation Learning via $β$-Generalization Front-Door Criterion
di: Li, Yi, et al.
Pubblicazione: (2024)
di: Li, Yi, et al.
Pubblicazione: (2024)
RFG: Test-Time Scaling for Diffusion Large Language Model Reasoning with Reward-Free Guidance
di: Chen, Tianlang, et al.
Pubblicazione: (2025)
di: Chen, Tianlang, et al.
Pubblicazione: (2025)
PARM: Multi-Objective Test-Time Alignment via Preference-Aware Autoregressive Reward Model
di: Lin, Baijiong, et al.
Pubblicazione: (2025)
di: Lin, Baijiong, et al.
Pubblicazione: (2025)
M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models
di: Wang, Junxiong, et al.
Pubblicazione: (2025)
di: Wang, Junxiong, et al.
Pubblicazione: (2025)
A Generalized Learning Framework for Self-Supervised Contrastive Learning
di: Si, Lingyu, et al.
Pubblicazione: (2025)
di: Si, Lingyu, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Adaptive Uncertainty-Aware Tree Search for Robust Reasoning
di: Song, Zeen, et al.
Pubblicazione: (2026) -
Beyond All-to-All: Causal-Aligned Transformer with Dynamic Structure Learning for Multivariate Time Series Forecasting
di: Zhang, Xingyu, et al.
Pubblicazione: (2025) -
Not All Frequencies Are Created Equal:Towards a Dynamic Fusion of Frequencies in Time-Series Forecasting
di: Zhang, Xingyu, et al.
Pubblicazione: (2024) -
On the Out-of-Distribution Generalization of Self-Supervised Learning
di: Qiang, Wenwen, et al.
Pubblicazione: (2025) -
Causal Reward Adjustment: Mitigating Reward Hacking in External Reasoning via Backdoor Correction
di: Song, Ruike, et al.
Pubblicazione: (2025)