Salvato in:
| Autori principali: | Mei, Yuan, Song, Xingyu, Song, Xiaowen, Takeishi, Naoya |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2605.08843 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Deterministic Decomposition of Stochastic Generative Dynamics
di: Song, Xingyu, et al.
Pubblicazione: (2026)
di: Song, Xingyu, et al.
Pubblicazione: (2026)
Estimating counterfactual treatment outcomes over time in complex multiagent scenarios
di: Fujii, Keisuke, et al.
Pubblicazione: (2022)
di: Fujii, Keisuke, et al.
Pubblicazione: (2022)
Data-driven simulator of multi-animal behavior with unknown dynamics via offline and online reinforcement learning
di: Fujii, Keisuke, et al.
Pubblicazione: (2025)
di: Fujii, Keisuke, et al.
Pubblicazione: (2025)
U-Nets as Belief Propagation: Efficient Classification, Denoising, and Diffusion in Generative Hierarchical Models
di: Mei, Song
Pubblicazione: (2024)
di: Mei, Song
Pubblicazione: (2024)
Training-free Heterogeneous Model Merging
di: Xu, Zhengqi, et al.
Pubblicazione: (2024)
di: Xu, Zhengqi, et al.
Pubblicazione: (2024)
Generalized Discrete Diffusion with Self-Correction
di: Wang, Linxuan, et al.
Pubblicazione: (2026)
di: Wang, Linxuan, et al.
Pubblicazione: (2026)
A Neural Model of Rule Discovery with Relatively Short-Term Sequence Memory
di: Arakawa, Naoya
Pubblicazione: (2024)
di: Arakawa, Naoya
Pubblicazione: (2024)
Unified Molecule Pre-training with Flexible 2D and 3D Modalities: Single and Paired Modality Integration
di: Song, Tengwei, et al.
Pubblicazione: (2025)
di: Song, Tengwei, et al.
Pubblicazione: (2025)
On Measuring Long-Range Interactions in Graph Neural Networks
di: Bamberger, Jacob, et al.
Pubblicazione: (2025)
di: Bamberger, Jacob, et al.
Pubblicazione: (2025)
Discrete Markov Bridge
di: Li, Hengli, et al.
Pubblicazione: (2025)
di: Li, Hengli, et al.
Pubblicazione: (2025)
L-MoE: End-to-End Training of a Lightweight Mixture of Low-Rank Adaptation Experts
di: Ji, Shihao, et al.
Pubblicazione: (2025)
di: Ji, Shihao, et al.
Pubblicazione: (2025)
Sparse Training of Discrete Diffusion Models for Graph Generation
di: Qin, Yiming, et al.
Pubblicazione: (2023)
di: Qin, Yiming, et al.
Pubblicazione: (2023)
SlimPipe: Memory-Thrifty and Efficient Pipeline Parallelism for Long-Context LLM Training
di: Li, Zhouyang, et al.
Pubblicazione: (2025)
di: Li, Zhouyang, et al.
Pubblicazione: (2025)
Deep Generative Models for Discrete Genotype Simulation
di: Xie, Sihan, et al.
Pubblicazione: (2025)
di: Xie, Sihan, et al.
Pubblicazione: (2025)
Learning Scenario Reduction for Two-Stage Robust Optimization with Discrete Uncertainty
di: Lin, Tianjue, et al.
Pubblicazione: (2026)
di: Lin, Tianjue, et al.
Pubblicazione: (2026)
A Theoretical Analysis of Discrete Flow Matching Generative Models
di: Su, Maojiang, et al.
Pubblicazione: (2025)
di: Su, Maojiang, et al.
Pubblicazione: (2025)
GPU-accelerated simulated annealing based on p-bits with real-world device-variability modeling
di: Onizawa, Naoya, et al.
Pubblicazione: (2026)
di: Onizawa, Naoya, et al.
Pubblicazione: (2026)
Lightning OPD: Efficient Post-Training for Large Reasoning Models with Offline On-Policy Distillation
di: Wu, Yecheng, et al.
Pubblicazione: (2026)
di: Wu, Yecheng, et al.
Pubblicazione: (2026)
Your Simulation Runs but Solves the Wrong Physics: PDE-Grounded Intent Verification for LLM-Generated Multiphysics Simulation Code
di: Song, Zhenghan, et al.
Pubblicazione: (2026)
di: Song, Zhenghan, et al.
Pubblicazione: (2026)
Training-Free Message Passing for Learning on Hypergraphs
di: Tang, Bohan, et al.
Pubblicazione: (2024)
di: Tang, Bohan, et al.
Pubblicazione: (2024)
UNITE-FND: Reframing Multimodal Fake News Detection through Unimodal Scene Translation
di: Mukherjee, Arka, et al.
Pubblicazione: (2025)
di: Mukherjee, Arka, et al.
Pubblicazione: (2025)
HARP: Hesitation-Aware Reframing in Transformer Inference Pass
di: Storaï, Romain, et al.
Pubblicazione: (2024)
di: Storaï, Romain, et al.
Pubblicazione: (2024)
Physics in Next-token Prediction
di: An, Hongjun, et al.
Pubblicazione: (2024)
di: An, Hongjun, et al.
Pubblicazione: (2024)
Training Data Selection with Gradient Orthogonality for Efficient Domain Adaptation
di: Zhang, Xiyang, et al.
Pubblicazione: (2026)
di: Zhang, Xiyang, et al.
Pubblicazione: (2026)
Unified Algorithms for RL with Decision-Estimation Coefficients: PAC, Reward-Free, Preference-Based Learning, and Beyond
di: Chen, Fan, et al.
Pubblicazione: (2022)
di: Chen, Fan, et al.
Pubblicazione: (2022)
Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization
di: Lee, Deokjae, et al.
Pubblicazione: (2024)
di: Lee, Deokjae, et al.
Pubblicazione: (2024)
On the Error-Correcting Effects of Stochasticity in Discrete Diffusion
di: Yuan, William, et al.
Pubblicazione: (2026)
di: Yuan, William, et al.
Pubblicazione: (2026)
Towards Quantifying Long-Range Interactions in Graph Machine Learning: a Large Graph Dataset and a Measurement
di: Liang, Huidong, et al.
Pubblicazione: (2025)
di: Liang, Huidong, et al.
Pubblicazione: (2025)
DEMO: Reframing Dialogue Interaction with Fine-grained Element Modeling
di: Wang, Minzheng, et al.
Pubblicazione: (2024)
di: Wang, Minzheng, et al.
Pubblicazione: (2024)
COLA: Cross-city Mobility Transformer for Human Trajectory Simulation
di: Wang, Yu, et al.
Pubblicazione: (2024)
di: Wang, Yu, et al.
Pubblicazione: (2024)
Enhancing Stability for Large Language Models Training in Constrained Bandwidth Networks
di: Dai, Yun, et al.
Pubblicazione: (2024)
di: Dai, Yun, et al.
Pubblicazione: (2024)
Correcting Mean Bias in Text Embeddings: A Refined Renormalization with Training-Free Improvements on MMTEB
di: Ren, Xingyu, et al.
Pubblicazione: (2025)
di: Ren, Xingyu, et al.
Pubblicazione: (2025)
Enhancing Pre-Trained Model-Based Class-Incremental Learning through Neural Collapse
di: He, Kun, et al.
Pubblicazione: (2025)
di: He, Kun, et al.
Pubblicazione: (2025)
Equivariant Spatio-Temporal Attentive Graph Networks to Simulate Physical Dynamics
di: Wu, Liming, et al.
Pubblicazione: (2024)
di: Wu, Liming, et al.
Pubblicazione: (2024)
Pre-Training Protein Bi-level Representation Through Span Mask Strategy On 3D Protein Chains
di: Zhao, Jiale, et al.
Pubblicazione: (2024)
di: Zhao, Jiale, et al.
Pubblicazione: (2024)
Simulating Environments with Reasoning Models for Agent Training
di: Li, Yuetai, et al.
Pubblicazione: (2025)
di: Li, Yuetai, et al.
Pubblicazione: (2025)
Entropy-Gated Selective Policy Optimization:Token-Level Gradient Allocation for Hybrid Training of Large Language Models
di: Hu, Yuelin, et al.
Pubblicazione: (2026)
di: Hu, Yuelin, et al.
Pubblicazione: (2026)
GAC: Noise-Aware Adaptive Mixing for Hybrid SFT-RL Post-Training
di: Hu, Yuelin, et al.
Pubblicazione: (2026)
di: Hu, Yuelin, et al.
Pubblicazione: (2026)
A Framework for Quantifying How Pre-Training and Context Benefit In-Context Learning
di: Song, Bingqing, et al.
Pubblicazione: (2025)
di: Song, Bingqing, et al.
Pubblicazione: (2025)
A Comment On "The Illusion of Thinking": Reframing the Reasoning Cliff as an Agentic Gap
di: Khan, Sheraz, et al.
Pubblicazione: (2025)
di: Khan, Sheraz, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Deterministic Decomposition of Stochastic Generative Dynamics
di: Song, Xingyu, et al.
Pubblicazione: (2026) -
Estimating counterfactual treatment outcomes over time in complex multiagent scenarios
di: Fujii, Keisuke, et al.
Pubblicazione: (2022) -
Data-driven simulator of multi-animal behavior with unknown dynamics via offline and online reinforcement learning
di: Fujii, Keisuke, et al.
Pubblicazione: (2025) -
U-Nets as Belief Propagation: Efficient Classification, Denoising, and Diffusion in Generative Hierarchical Models
di: Mei, Song
Pubblicazione: (2024) -
Training-free Heterogeneous Model Merging
di: Xu, Zhengqi, et al.
Pubblicazione: (2024)