Gespeichert in:
| Hauptverfasser: | Pu, Yifan, Zhao, Yiming, Tang, Zhicong, Yin, Ruihong, Ye, Haoxing, Yuan, Yuhui, Chen, Dong, Bao, Jianmin, Zhang, Sirui, Wang, Yanbin, Liang, Lin, Wang, Lijuan, Li, Ji, Li, Xiu, Lian, Zhouhui, Huang, Gao, Guo, Baining |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2502.18364 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Diffusion Models without Classifier-free Guidance
von: Tang, Zhicong, et al.
Veröffentlicht: (2025)
von: Tang, Zhicong, et al.
Veröffentlicht: (2025)
Pano2Room: Novel View Synthesis from a Single Indoor Panorama
von: Pu, Guo, et al.
Veröffentlicht: (2024)
von: Pu, Guo, et al.
Veröffentlicht: (2024)
MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale
von: Tang, Zhicong, et al.
Veröffentlicht: (2026)
von: Tang, Zhicong, et al.
Veröffentlicht: (2026)
VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder
von: Tang, Zhicong, et al.
Veröffentlicht: (2023)
von: Tang, Zhicong, et al.
Veröffentlicht: (2023)
Dynamic Texture Transfer using PatchMatch and Transformers
von: Pu, Guo, et al.
Veröffentlicht: (2024)
von: Pu, Guo, et al.
Veröffentlicht: (2024)
ActMVS: Active Scene Reconstruction with Monocular Multi-View Stereo
von: Pu, Guo, et al.
Veröffentlicht: (2026)
von: Pu, Guo, et al.
Veröffentlicht: (2026)
HFH-Font: Few-shot Chinese Font Synthesis with Higher Quality, Faster Speed, and Higher Resolution
von: Li, Hua, et al.
Veröffentlicht: (2024)
von: Li, Hua, et al.
Veröffentlicht: (2024)
PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models
von: Chen, Junwen, et al.
Veröffentlicht: (2025)
von: Chen, Junwen, et al.
Veröffentlicht: (2025)
CCEdit: Creative and Controllable Video Editing via Diffusion Models
von: Feng, Ruoyu, et al.
Veröffentlicht: (2023)
von: Feng, Ruoyu, et al.
Veröffentlicht: (2023)
RSUniVLM: A Unified Vision Language Model for Remote Sensing via Granularity-oriented Mixture of Experts
von: Liu, Xu, et al.
Veröffentlicht: (2024)
von: Liu, Xu, et al.
Veröffentlicht: (2024)
Sharper Generalization Bounds for Transformer
von: Li, Yawen, et al.
Veröffentlicht: (2026)
von: Li, Yawen, et al.
Veröffentlicht: (2026)
ResidualTransformer: Residual Low-Rank Learning with Weight-Sharing for Transformer Layers
von: Wang, Yiming, et al.
Veröffentlicht: (2023)
von: Wang, Yiming, et al.
Veröffentlicht: (2023)
Beyond Patches: Global-aware Autoregressive Model for Multimodal Few-Shot Font Generation
von: Cai, Haonan, et al.
Veröffentlicht: (2026)
von: Cai, Haonan, et al.
Veröffentlicht: (2026)
CalliRewrite: Recovering Handwriting Behaviors from Calligraphy Images without Supervision
von: Luo, Yuxuan, et al.
Veröffentlicht: (2024)
von: Luo, Yuxuan, et al.
Veröffentlicht: (2024)
VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions
von: Xia, Zeqing, et al.
Veröffentlicht: (2023)
von: Xia, Zeqing, et al.
Veröffentlicht: (2023)
Creating Your Editable 3D Photorealistic Avatar with Tetrahedron-constrained Gaussian Splatting
von: Liu, Hanxi, et al.
Veröffentlicht: (2025)
von: Liu, Hanxi, et al.
Veröffentlicht: (2025)
Simplified Diffusion Schrödinger Bridge
von: Tang, Zhicong, et al.
Veröffentlicht: (2024)
von: Tang, Zhicong, et al.
Veröffentlicht: (2024)
Incorporating Pre-trained Diffusion Models in Solving the Schrödinger Bridge Problem
von: Tang, Zhicong, et al.
Veröffentlicht: (2025)
von: Tang, Zhicong, et al.
Veröffentlicht: (2025)
Efficient Diffusion Transformer with Step-wise Dynamic Attention Mediators
von: Pu, Yifan, et al.
Veröffentlicht: (2024)
von: Pu, Yifan, et al.
Veröffentlicht: (2024)
MageBench: Bridging Large Multimodal Models to Agents
von: Zhang, Miaosen, et al.
Veröffentlicht: (2024)
von: Zhang, Miaosen, et al.
Veröffentlicht: (2024)
Neural-Polyptych: Content Controllable Painting Recreation for Diverse Genres
von: Zhao, Yiming, et al.
Veröffentlicht: (2024)
von: Zhao, Yiming, et al.
Veröffentlicht: (2024)
Efficient Diffusion Training via Min-SNR Weighting Strategy
von: Hang, Tiankai, et al.
Veröffentlicht: (2023)
von: Hang, Tiankai, et al.
Veröffentlicht: (2023)
When to Commit? Towards Variable-Size Self-Contained Blocks for Discrete Diffusion Language Models
von: Wang, Danny, et al.
Veröffentlicht: (2026)
von: Wang, Danny, et al.
Veröffentlicht: (2026)
ART: Articulated Reconstruction Transformer
von: Li, Zizhang, et al.
Veröffentlicht: (2025)
von: Li, Zizhang, et al.
Veröffentlicht: (2025)
UTDesign: A Unified Framework for Stylized Text Editing and Generation in Graphic Design Images
von: Zhao, Yiming, et al.
Veröffentlicht: (2025)
von: Zhao, Yiming, et al.
Veröffentlicht: (2025)
MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning
von: Luo, Yuxuan, et al.
Veröffentlicht: (2025)
von: Luo, Yuxuan, et al.
Veröffentlicht: (2025)
Linear Differential Vision Transformer: Learning Visual Contrasts via Pairwise Differentials
von: Pu, Yifan, et al.
Veröffentlicht: (2025)
von: Pu, Yifan, et al.
Veröffentlicht: (2025)
Glyph-ByT5-v2: A Strong Aesthetic Baseline for Accurate Multilingual Visual Text Rendering
von: Liu, Zeyu, et al.
Veröffentlicht: (2024)
von: Liu, Zeyu, et al.
Veröffentlicht: (2024)
Transformers in Protein: A Survey
von: Ling, Xiaowen, et al.
Veröffentlicht: (2025)
von: Ling, Xiaowen, et al.
Veröffentlicht: (2025)
Stochastic Layer-Wise Shuffle for Improving Vision Mamba Training
von: Huang, Zizheng, et al.
Veröffentlicht: (2024)
von: Huang, Zizheng, et al.
Veröffentlicht: (2024)
Sensitivity of simulated MJO to model vertical resolution in GAMIL3
von: He Wang, et al.
Veröffentlicht: (2024)
von: He Wang, et al.
Veröffentlicht: (2024)
Continuous Multi-Task Pre-training for Malicious URL Detection and Webpage Classification
von: Li, Yujie, et al.
Veröffentlicht: (2024)
von: Li, Yujie, et al.
Veröffentlicht: (2024)
GRA: Detecting Oriented Objects through Group-wise Rotating and Attention
von: Wang, Jiangshan, et al.
Veröffentlicht: (2024)
von: Wang, Jiangshan, et al.
Veröffentlicht: (2024)
Almost Optimal Algorithms for Token Collision in Anonymous Networks
von: Bai, Sirui, et al.
Veröffentlicht: (2024)
von: Bai, Sirui, et al.
Veröffentlicht: (2024)
IndoorUAV: Benchmarking Vision-Language UAV Navigation in Continuous Indoor Environments
von: Liu, Xu, et al.
Veröffentlicht: (2025)
von: Liu, Xu, et al.
Veröffentlicht: (2025)
Machine Learning-Assisted High-Dimensional Matrix Estimation
von: Tian, Wan, et al.
Veröffentlicht: (2026)
von: Tian, Wan, et al.
Veröffentlicht: (2026)
CalliReader: Contextualizing Chinese Calligraphy via an Embedding-Aligned Vision-Language Model
von: Luo, Yuxuan, et al.
Veröffentlicht: (2025)
von: Luo, Yuxuan, et al.
Veröffentlicht: (2025)
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation
von: Lin, Yukang, et al.
Veröffentlicht: (2025)
von: Lin, Yukang, et al.
Veröffentlicht: (2025)
COLE: A Hierarchical Generation Framework for Multi-Layered and Editable Graphic Design
von: Jia, Peidong, et al.
Veröffentlicht: (2023)
von: Jia, Peidong, et al.
Veröffentlicht: (2023)
Retrospective Analysis of the Impact of a Collaborative Multidisciplinary Care Model on the Efficiency of Emergency Care and Neurological Function and Prognosis of Comatose Patients With Emergency Cerebral Hemorrhage
von: Yanbin Li, et al.
Veröffentlicht: (2025)
von: Yanbin Li, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Diffusion Models without Classifier-free Guidance
von: Tang, Zhicong, et al.
Veröffentlicht: (2025) -
Pano2Room: Novel View Synthesis from a Single Indoor Panorama
von: Pu, Guo, et al.
Veröffentlicht: (2024) -
MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale
von: Tang, Zhicong, et al.
Veröffentlicht: (2026) -
VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder
von: Tang, Zhicong, et al.
Veröffentlicht: (2023) -
Dynamic Texture Transfer using PatchMatch and Transformers
von: Pu, Guo, et al.
Veröffentlicht: (2024)