:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Pu, Yifan, Zhao, Yiming, Tang, Zhicong, Yin, Ruihong, Ye, Haoxing, Yuan, Yuhui, Chen, Dong, Bao, Jianmin, Zhang, Sirui, Wang, Yanbin, Liang, Lin, Wang, Lijuan, Li, Ji, Li, Xiu, Lian, Zhouhui, Huang, Gao, Guo, Baining
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Computer Vision and Pattern Recognition
Online-Zugang:	https://arxiv.org/abs/2502.18364
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Diffusion Models without Classifier-free Guidance
von: Tang, Zhicong, et al.
Veröffentlicht: (2025)

Pano2Room: Novel View Synthesis from a Single Indoor Panorama
von: Pu, Guo, et al.
Veröffentlicht: (2024)

MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale
von: Tang, Zhicong, et al.
Veröffentlicht: (2026)

VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder
von: Tang, Zhicong, et al.
Veröffentlicht: (2023)

Dynamic Texture Transfer using PatchMatch and Transformers
von: Pu, Guo, et al.
Veröffentlicht: (2024)

ActMVS: Active Scene Reconstruction with Monocular Multi-View Stereo
von: Pu, Guo, et al.
Veröffentlicht: (2026)

HFH-Font: Few-shot Chinese Font Synthesis with Higher Quality, Faster Speed, and Higher Resolution
von: Li, Hua, et al.
Veröffentlicht: (2024)

PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models
von: Chen, Junwen, et al.
Veröffentlicht: (2025)

CCEdit: Creative and Controllable Video Editing via Diffusion Models
von: Feng, Ruoyu, et al.
Veröffentlicht: (2023)

RSUniVLM: A Unified Vision Language Model for Remote Sensing via Granularity-oriented Mixture of Experts
von: Liu, Xu, et al.
Veröffentlicht: (2024)

Sharper Generalization Bounds for Transformer
von: Li, Yawen, et al.
Veröffentlicht: (2026)

ResidualTransformer: Residual Low-Rank Learning with Weight-Sharing for Transformer Layers
von: Wang, Yiming, et al.
Veröffentlicht: (2023)

Beyond Patches: Global-aware Autoregressive Model for Multimodal Few-Shot Font Generation
von: Cai, Haonan, et al.
Veröffentlicht: (2026)

CalliRewrite: Recovering Handwriting Behaviors from Calligraphy Images without Supervision
von: Luo, Yuxuan, et al.
Veröffentlicht: (2024)

VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions
von: Xia, Zeqing, et al.
Veröffentlicht: (2023)

Creating Your Editable 3D Photorealistic Avatar with Tetrahedron-constrained Gaussian Splatting
von: Liu, Hanxi, et al.
Veröffentlicht: (2025)

Simplified Diffusion Schrödinger Bridge
von: Tang, Zhicong, et al.
Veröffentlicht: (2024)

Incorporating Pre-trained Diffusion Models in Solving the Schrödinger Bridge Problem
von: Tang, Zhicong, et al.
Veröffentlicht: (2025)

Efficient Diffusion Transformer with Step-wise Dynamic Attention Mediators
von: Pu, Yifan, et al.
Veröffentlicht: (2024)

MageBench: Bridging Large Multimodal Models to Agents
von: Zhang, Miaosen, et al.
Veröffentlicht: (2024)

Neural-Polyptych: Content Controllable Painting Recreation for Diverse Genres
von: Zhao, Yiming, et al.
Veröffentlicht: (2024)

Efficient Diffusion Training via Min-SNR Weighting Strategy
von: Hang, Tiankai, et al.
Veröffentlicht: (2023)

When to Commit? Towards Variable-Size Self-Contained Blocks for Discrete Diffusion Language Models
von: Wang, Danny, et al.
Veröffentlicht: (2026)

ART: Articulated Reconstruction Transformer
von: Li, Zizhang, et al.
Veröffentlicht: (2025)

UTDesign: A Unified Framework for Stylized Text Editing and Generation in Graphic Design Images
von: Zhao, Yiming, et al.
Veröffentlicht: (2025)

MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning
von: Luo, Yuxuan, et al.
Veröffentlicht: (2025)

Linear Differential Vision Transformer: Learning Visual Contrasts via Pairwise Differentials
von: Pu, Yifan, et al.
Veröffentlicht: (2025)

Glyph-ByT5-v2: A Strong Aesthetic Baseline for Accurate Multilingual Visual Text Rendering
von: Liu, Zeyu, et al.
Veröffentlicht: (2024)

Transformers in Protein: A Survey
von: Ling, Xiaowen, et al.
Veröffentlicht: (2025)

Stochastic Layer-Wise Shuffle for Improving Vision Mamba Training
von: Huang, Zizheng, et al.
Veröffentlicht: (2024)

Sensitivity of simulated MJO to model vertical resolution in GAMIL3
von: He Wang, et al.
Veröffentlicht: (2024)

Continuous Multi-Task Pre-training for Malicious URL Detection and Webpage Classification
von: Li, Yujie, et al.
Veröffentlicht: (2024)

GRA: Detecting Oriented Objects through Group-wise Rotating and Attention
von: Wang, Jiangshan, et al.
Veröffentlicht: (2024)

Almost Optimal Algorithms for Token Collision in Anonymous Networks
von: Bai, Sirui, et al.
Veröffentlicht: (2024)

IndoorUAV: Benchmarking Vision-Language UAV Navigation in Continuous Indoor Environments
von: Liu, Xu, et al.
Veröffentlicht: (2025)

Machine Learning-Assisted High-Dimensional Matrix Estimation
von: Tian, Wan, et al.
Veröffentlicht: (2026)

CalliReader: Contextualizing Chinese Calligraphy via an Embedding-Aligned Vision-Language Model
von: Luo, Yuxuan, et al.
Veröffentlicht: (2025)

InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation
von: Lin, Yukang, et al.
Veröffentlicht: (2025)

COLE: A Hierarchical Generation Framework for Multi-Layered and Editable Graphic Design
von: Jia, Peidong, et al.
Veröffentlicht: (2023)

Retrospective Analysis of the Impact of a Collaborative Multidisciplinary Care Model on the Efficiency of Emergency Care and Neurological Function and Prognosis of Comatose Patients With Emergency Cerebral Hemorrhage
von: Yanbin Li, et al.
Veröffentlicht: (2025)