:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Song, Zeen, Qiang, Wenwen, Zhao, Siyu, Zheng, Changwen, Hua, Gang
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning
Accesso online:	https://arxiv.org/abs/2505.18065
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Adaptive Uncertainty-Aware Tree Search for Robust Reasoning
di: Song, Zeen, et al.
Pubblicazione: (2026)

Beyond All-to-All: Causal-Aligned Transformer with Dynamic Structure Learning for Multivariate Time Series Forecasting
di: Zhang, Xingyu, et al.
Pubblicazione: (2025)

Not All Frequencies Are Created Equal:Towards a Dynamic Fusion of Frequencies in Time-Series Forecasting
di: Zhang, Xingyu, et al.
Pubblicazione: (2024)

On the Out-of-Distribution Generalization of Self-Supervised Learning
di: Qiang, Wenwen, et al.
Pubblicazione: (2025)

Causal Reward Adjustment: Mitigating Reward Hacking in External Reasoning via Backdoor Correction
di: Song, Ruike, et al.
Pubblicazione: (2025)

Learning to Think: Information-Theoretic Reinforcement Fine-Tuning for LLMs
di: Wang, Jingyao, et al.
Pubblicazione: (2025)

Closing the Loop: A Control-Theoretic Framework for Provably Stable Time Series Forecasting with LLMs
di: Zhang, Xingyu, et al.
Pubblicazione: (2026)

Hacking Task Confounder in Meta-Learning
di: Wang, Jingyao, et al.
Pubblicazione: (2023)

Group Causal Policy Optimization for Post-Training Large Language Models
di: Gu, Ziyin, et al.
Pubblicazione: (2025)

On the Generalization and Causal Explanation in Self-Supervised Learning
di: Qiang, Wenwen, et al.
Pubblicazione: (2024)

Self-Supervised Video Representation Learning in a Heuristic Decoupled Perspective
di: Song, Zeen, et al.
Pubblicazione: (2024)

On the Universality of Self-Supervised Learning
di: Qiang, Wenwen, et al.
Pubblicazione: (2024)

CAMD: Coverage-Aware Multimodal Decoding for Efficient Reasoning of Multimodal Large Language Models
di: Guo, Huijie, et al.
Pubblicazione: (2026)

Rethinking Meta-Learning from a Learning Lens
di: Wang, Jingyao, et al.
Pubblicazione: (2024)

Rethinking Multi-Modal Learning from Gradient Uncertainty
di: Guo, Peizheng, et al.
Pubblicazione: (2025)

Learning Invariant Causal Mechanism from Vision-Language Models
di: Song, Zeen, et al.
Pubblicazione: (2024)

Enhancing Large Language Models for Time-Series Forecasting via Vector-Injected In-Context Learning
di: Zhang, Jianqi, et al.
Pubblicazione: (2026)

Neuromodulated Meta-Learning
di: Wang, Jingyao, et al.
Pubblicazione: (2024)

Towards the Causal Complete Cause of Multi-Modal Representation Learning
di: Wang, Jingyao, et al.
Pubblicazione: (2024)

Towards Generalizable Reasoning: Group Causal Counterfactual Policy Optimization for LLM Reasoning
di: Wang, Jingyao, et al.
Pubblicazione: (2026)

Spatio-Temporal Fuzzy-oriented Multi-Modal Meta-Learning for Fine-grained Emotion Recognition
di: Wang, Jingyao, et al.
Pubblicazione: (2024)

On the Discriminability of Self-Supervised Representation Learning
di: Song, Zeen, et al.
Pubblicazione: (2024)

From Shallow to Deep: Pinning Semantic Intent via Causal GRPO
di: Zhou, Shuyi, et al.
Pubblicazione: (2026)

On the Plasticity and Stability for Post-Training Large Language Models
di: Qiang, Wenwen, et al.
Pubblicazione: (2026)

AwesomeMeta+: A Mixed-Prototyping Meta-Learning System Supporting AI Application Design Anywhere
di: Wang, Jingyao, et al.
Pubblicazione: (2023)

Doubly Debiased Test-Time Prompt Tuning for Vision-Language Models
di: Song, Fei, et al.
Pubblicazione: (2025)

Exploring Transferability of Self-Supervised Learning by Task Conflict Calibration
di: Guo, Huijie, et al.
Pubblicazione: (2025)

Towards Task Sampler Learning for Meta-Learning
di: Wang, Jingyao, et al.
Pubblicazione: (2023)

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time
di: Wang, Haozhe, et al.
Pubblicazione: (2026)

On the Transferability and Discriminability of Repersentation Learning in Unsupervised Domain Adaptation
di: Qiang, Wenwen, et al.
Pubblicazione: (2025)

Causal Front-Door Adjustment for Robust Jailbreak Attacks on LLMs
di: Zhou, Yao, et al.
Pubblicazione: (2026)

Linking Process to Outcome: Conditional Reward Modeling for LLM Reasoning
di: Zhang, Zheng, et al.
Pubblicazione: (2025)

ERPO: Token-Level Entropy-Regulated Policy Optimization for Large Reasoning Models
di: Yu, Song, et al.
Pubblicazione: (2026)

On the Limits of Test-Time Compute: Sequential Reward Filtering for Better Inference
di: Yu, Yue, et al.
Pubblicazione: (2025)

Exploration-Driven Optimization for Test-Time Large Language Model Reasoning
di: Li, Changhao, et al.
Pubblicazione: (2026)

Interventional Imbalanced Multi-Modal Representation Learning via $β$-Generalization Front-Door Criterion
di: Li, Yi, et al.
Pubblicazione: (2024)

RFG: Test-Time Scaling for Diffusion Large Language Model Reasoning with Reward-Free Guidance
di: Chen, Tianlang, et al.
Pubblicazione: (2025)

PARM: Multi-Objective Test-Time Alignment via Preference-Aware Autoregressive Reward Model
di: Lin, Baijiong, et al.
Pubblicazione: (2025)

M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models
di: Wang, Junxiong, et al.
Pubblicazione: (2025)

A Generalized Learning Framework for Self-Supervised Contrastive Learning
di: Si, Lingyu, et al.
Pubblicazione: (2025)