:: Library Catalog

Salvato in:

Dettagli Bibliografici
Autori principali:	Ma, Lichen, Guo, Zipeng, He, Yu, Fu, Xiaolong, Liu, Luohang, Fu, Jingling, Huang, Junshi, Li, Yan
Natura:	Preprint
Pubblicazione:	2026
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2605.17759
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

HyperDiT: Hyper-Connected Transformers for High-Fidelity Pixel-Space Diffusion
di: He, Yu, et al.
Pubblicazione: (2026)

LiWi: Layering in the Wild
di: He, Yu, et al.
Pubblicazione: (2026)

UM-Text: A Unified Multimodal Model for Image Understanding and Visual Text Editing
di: Ma, Lichen, et al.
Pubblicazione: (2026)

Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling
di: Fu, Xiaolong, et al.
Pubblicazione: (2025)

Fashion130K: An E-commerce Fashion Dataset for Outfit Generation with Unified Multi-modal Condition
di: He, Yu, et al.
Pubblicazione: (2026)

RePainter: Empowering E-commerce Object Removal via Spatial-matting Reinforcement Learning
di: Guo, Zipeng, et al.
Pubblicazione: (2025)

Not All Noises Are Created Equally:Diffusion Noise Selection and Optimization
di: Qi, Zipeng, et al.
Pubblicazione: (2024)

Freditor: High-Fidelity and Transferable NeRF Editing by Frequency Decomposition
di: He, Yisheng, et al.
Pubblicazione: (2024)

LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba
di: Fu, Yunxiang, et al.
Pubblicazione: (2024)

Scalable Diffusion Models with State Space Backbone
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)

Diffusion-RWKV: Scaling RWKV-Like Architectures for Diffusion Models
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)

DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation
di: Ma, Zehong, et al.
Pubblicazione: (2025)

Motion Artifact Removal in Pixel-Frequency Domain via Alternate Masks and Diffusion Model
di: Xu, Jiahua, et al.
Pubblicazione: (2024)

KHMP: Frequency-Domain Kalman Refinement for High-Fidelity Human Motion Prediction
di: Wu, Wenhan, et al.
Pubblicazione: (2026)

Zigzag Diffusion Sampling: Diffusion Models Can Self-Improve via Self-Reflection
di: Bai, Lichen, et al.
Pubblicazione: (2024)

Frequency-aware Event Cloud Network
di: Ren, Hongwei, et al.
Pubblicazione: (2024)

Dimba: Transformer-Mamba Diffusion Models
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)

Dual Frequency Branch Framework with Reconstructed Sliding Windows Attention for AI-Generated Image Detection
di: Yan, Jiazhen, et al.
Pubblicazione: (2025)

Frequency-Aware Vision Transformers for High-Fidelity Super-Resolution of Earth System Models
di: Zeraatkar, Ehsan, et al.
Pubblicazione: (2025)

FreSca: Scaling in Frequency Space Enhances Diffusion Models
di: Huang, Chao, et al.
Pubblicazione: (2025)

PixelCraft: A Multi-Agent System for High-Fidelity Visual Reasoning on Structured Images
di: Zhang, Shuoshuo, et al.
Pubblicazione: (2025)

Pixel Is Not a Barrier: An Effective Evasion Attack for Pixel-Domain Diffusion Models
di: Shih, Chun-Yen, et al.
Pubblicazione: (2024)

Equilibrated Diffusion: Frequency-aware Textual Embedding for Equilibrated Image Customization
di: Ma, Liyuan, et al.
Pubblicazione: (2026)

CharGen: High Accurate Character-Level Visual Text Generation Model with MultiModal Encoder
di: Ma, Lichen, et al.
Pubblicazione: (2024)

Frequency Regulation for Exposure Bias Mitigation in Diffusion Models
di: Yu, Meng, et al.
Pubblicazione: (2025)

Frequency-aware Feature Fusion for Dense Image Prediction
di: Chen, Linwei, et al.
Pubblicazione: (2024)

Scaling Diffusion Transformers to 16 Billion Parameters
di: Fei, Zhengcong, et al.
Pubblicazione: (2024)

Frequency-Adaptive Dilated Convolution for Semantic Segmentation
di: Chen, Linwei, et al.
Pubblicazione: (2024)

When Semantic Segmentation Meets Frequency Aliasing
di: Chen, Linwei, et al.
Pubblicazione: (2024)

PixelLM: Pixel Reasoning with Large Multimodal Model
di: Ren, Zhongwei, et al.
Pubblicazione: (2023)

FREAK: Frequency-modulated High-fidelity and Real-time Audio-driven Talking Portrait Synthesis
di: Ni, Ziqi, et al.
Pubblicazione: (2025)

Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models
di: Wu, Qi, et al.
Pubblicazione: (2024)

Improving Out-of-Domain Robustness with Targeted Augmentation in Frequency and Pixel Spaces
di: Wang, Ruoqi, et al.
Pubblicazione: (2025)

Seeing Through the Rain: Resolving High-Frequency Conflicts in Deraining and Super-Resolution via Diffusion Guidance
di: Li, Wenjie, et al.
Pubblicazione: (2025)

FRCNet Frequency and Region Consistency for Semi-supervised Medical Image Segmentation
di: He, Along, et al.
Pubblicazione: (2024)

Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain
di: Pei, Gaozheng, et al.
Pubblicazione: (2025)

Frequency Dynamic Convolution for Dense Image Prediction
di: Chen, Linwei, et al.
Pubblicazione: (2025)

Beyond Spatial Frequency: Pixel-wise Temporal Frequency-based Deepfake Video Detection
di: Kim, Taehoon, et al.
Pubblicazione: (2025)

Physics-Informed Untrained Learning for RGB-Guided Superresolution Single-Pixel Hyperspectral Imaging
di: Zhang, Hao, et al.
Pubblicazione: (2026)

FIA-Edit: Frequency-Interactive Attention for Efficient and High-Fidelity Inversion-Free Text-Guided Image Editing
di: Yang, Kaixiang, et al.
Pubblicazione: (2025)