Salvato in:
| Autori principali: | Ma, Lichen, Guo, Zipeng, He, Yu, Fu, Xiaolong, Liu, Luohang, Fu, Jingling, Huang, Junshi, Li, Yan |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2605.17759 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
HyperDiT: Hyper-Connected Transformers for High-Fidelity Pixel-Space Diffusion
di: He, Yu, et al.
Pubblicazione: (2026)
di: He, Yu, et al.
Pubblicazione: (2026)
LiWi: Layering in the Wild
di: He, Yu, et al.
Pubblicazione: (2026)
di: He, Yu, et al.
Pubblicazione: (2026)
UM-Text: A Unified Multimodal Model for Image Understanding and Visual Text Editing
di: Ma, Lichen, et al.
Pubblicazione: (2026)
di: Ma, Lichen, et al.
Pubblicazione: (2026)
Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling
di: Fu, Xiaolong, et al.
Pubblicazione: (2025)
di: Fu, Xiaolong, et al.
Pubblicazione: (2025)
Fashion130K: An E-commerce Fashion Dataset for Outfit Generation with Unified Multi-modal Condition
di: He, Yu, et al.
Pubblicazione: (2026)
di: He, Yu, et al.
Pubblicazione: (2026)
RePainter: Empowering E-commerce Object Removal via Spatial-matting Reinforcement Learning
di: Guo, Zipeng, et al.
Pubblicazione: (2025)
di: Guo, Zipeng, et al.
Pubblicazione: (2025)
Not All Noises Are Created Equally:Diffusion Noise Selection and Optimization
di: Qi, Zipeng, et al.
Pubblicazione: (2024)
di: Qi, Zipeng, et al.
Pubblicazione: (2024)
Freditor: High-Fidelity and Transferable NeRF Editing by Frequency Decomposition
di: He, Yisheng, et al.
Pubblicazione: (2024)
di: He, Yisheng, et al.
Pubblicazione: (2024)
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba
di: Fu, Yunxiang, et al.
Pubblicazione: (2024)
di: Fu, Yunxiang, et al.
Pubblicazione: (2024)
Scalable Diffusion Models with State Space Backbone
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)
Diffusion-RWKV: Scaling RWKV-Like Architectures for Diffusion Models
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)
DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation
di: Ma, Zehong, et al.
Pubblicazione: (2025)
di: Ma, Zehong, et al.
Pubblicazione: (2025)
Motion Artifact Removal in Pixel-Frequency Domain via Alternate Masks and Diffusion Model
di: Xu, Jiahua, et al.
Pubblicazione: (2024)
di: Xu, Jiahua, et al.
Pubblicazione: (2024)
KHMP: Frequency-Domain Kalman Refinement for High-Fidelity Human Motion Prediction
di: Wu, Wenhan, et al.
Pubblicazione: (2026)
di: Wu, Wenhan, et al.
Pubblicazione: (2026)
Zigzag Diffusion Sampling: Diffusion Models Can Self-Improve via Self-Reflection
di: Bai, Lichen, et al.
Pubblicazione: (2024)
di: Bai, Lichen, et al.
Pubblicazione: (2024)
Frequency-aware Event Cloud Network
di: Ren, Hongwei, et al.
Pubblicazione: (2024)
di: Ren, Hongwei, et al.
Pubblicazione: (2024)
Dimba: Transformer-Mamba Diffusion Models
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)
Dual Frequency Branch Framework with Reconstructed Sliding Windows Attention for AI-Generated Image Detection
di: Yan, Jiazhen, et al.
Pubblicazione: (2025)
di: Yan, Jiazhen, et al.
Pubblicazione: (2025)
Frequency-Aware Vision Transformers for High-Fidelity Super-Resolution of Earth System Models
di: Zeraatkar, Ehsan, et al.
Pubblicazione: (2025)
di: Zeraatkar, Ehsan, et al.
Pubblicazione: (2025)
FreSca: Scaling in Frequency Space Enhances Diffusion Models
di: Huang, Chao, et al.
Pubblicazione: (2025)
di: Huang, Chao, et al.
Pubblicazione: (2025)
PixelCraft: A Multi-Agent System for High-Fidelity Visual Reasoning on Structured Images
di: Zhang, Shuoshuo, et al.
Pubblicazione: (2025)
di: Zhang, Shuoshuo, et al.
Pubblicazione: (2025)
Pixel Is Not a Barrier: An Effective Evasion Attack for Pixel-Domain Diffusion Models
di: Shih, Chun-Yen, et al.
Pubblicazione: (2024)
di: Shih, Chun-Yen, et al.
Pubblicazione: (2024)
Equilibrated Diffusion: Frequency-aware Textual Embedding for Equilibrated Image Customization
di: Ma, Liyuan, et al.
Pubblicazione: (2026)
di: Ma, Liyuan, et al.
Pubblicazione: (2026)
CharGen: High Accurate Character-Level Visual Text Generation Model with MultiModal Encoder
di: Ma, Lichen, et al.
Pubblicazione: (2024)
di: Ma, Lichen, et al.
Pubblicazione: (2024)
Frequency Regulation for Exposure Bias Mitigation in Diffusion Models
di: Yu, Meng, et al.
Pubblicazione: (2025)
di: Yu, Meng, et al.
Pubblicazione: (2025)
Frequency-aware Feature Fusion for Dense Image Prediction
di: Chen, Linwei, et al.
Pubblicazione: (2024)
di: Chen, Linwei, et al.
Pubblicazione: (2024)
Scaling Diffusion Transformers to 16 Billion Parameters
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)
Frequency-Adaptive Dilated Convolution for Semantic Segmentation
di: Chen, Linwei, et al.
Pubblicazione: (2024)
di: Chen, Linwei, et al.
Pubblicazione: (2024)
When Semantic Segmentation Meets Frequency Aliasing
di: Chen, Linwei, et al.
Pubblicazione: (2024)
di: Chen, Linwei, et al.
Pubblicazione: (2024)
PixelLM: Pixel Reasoning with Large Multimodal Model
di: Ren, Zhongwei, et al.
Pubblicazione: (2023)
di: Ren, Zhongwei, et al.
Pubblicazione: (2023)
FREAK: Frequency-modulated High-fidelity and Real-time Audio-driven Talking Portrait Synthesis
di: Ni, Ziqi, et al.
Pubblicazione: (2025)
di: Ni, Ziqi, et al.
Pubblicazione: (2025)
Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models
di: Wu, Qi, et al.
Pubblicazione: (2024)
di: Wu, Qi, et al.
Pubblicazione: (2024)
Improving Out-of-Domain Robustness with Targeted Augmentation in Frequency and Pixel Spaces
di: Wang, Ruoqi, et al.
Pubblicazione: (2025)
di: Wang, Ruoqi, et al.
Pubblicazione: (2025)
Seeing Through the Rain: Resolving High-Frequency Conflicts in Deraining and Super-Resolution via Diffusion Guidance
di: Li, Wenjie, et al.
Pubblicazione: (2025)
di: Li, Wenjie, et al.
Pubblicazione: (2025)
FRCNet Frequency and Region Consistency for Semi-supervised Medical Image Segmentation
di: He, Along, et al.
Pubblicazione: (2024)
di: He, Along, et al.
Pubblicazione: (2024)
Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain
di: Pei, Gaozheng, et al.
Pubblicazione: (2025)
di: Pei, Gaozheng, et al.
Pubblicazione: (2025)
Frequency Dynamic Convolution for Dense Image Prediction
di: Chen, Linwei, et al.
Pubblicazione: (2025)
di: Chen, Linwei, et al.
Pubblicazione: (2025)
Beyond Spatial Frequency: Pixel-wise Temporal Frequency-based Deepfake Video Detection
di: Kim, Taehoon, et al.
Pubblicazione: (2025)
di: Kim, Taehoon, et al.
Pubblicazione: (2025)
Physics-Informed Untrained Learning for RGB-Guided Superresolution Single-Pixel Hyperspectral Imaging
di: Zhang, Hao, et al.
Pubblicazione: (2026)
di: Zhang, Hao, et al.
Pubblicazione: (2026)
FIA-Edit: Frequency-Interactive Attention for Efficient and High-Fidelity Inversion-Free Text-Guided Image Editing
di: Yang, Kaixiang, et al.
Pubblicazione: (2025)
di: Yang, Kaixiang, et al.
Pubblicazione: (2025)
Documenti analoghi
-
HyperDiT: Hyper-Connected Transformers for High-Fidelity Pixel-Space Diffusion
di: He, Yu, et al.
Pubblicazione: (2026) -
LiWi: Layering in the Wild
di: He, Yu, et al.
Pubblicazione: (2026) -
UM-Text: A Unified Multimodal Model for Image Understanding and Visual Text Editing
di: Ma, Lichen, et al.
Pubblicazione: (2026) -
Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling
di: Fu, Xiaolong, et al.
Pubblicazione: (2025) -
Fashion130K: An E-commerce Fashion Dataset for Outfit Generation with Unified Multi-modal Condition
di: He, Yu, et al.
Pubblicazione: (2026)