:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Chen, Guanjie, Zhao, Xinyu, Zhou, Yucheng, Qu, Xiaoye, Chen, Tianlong, Cheng, Yu
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Computer Vision and Pattern Recognition
Online-Zugang:	https://arxiv.org/abs/2411.17616
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Flash-DMD: Towards High-Fidelity Few-Step Image Generation with Efficient Distillation and Joint Reinforcement Learning
von: Chen, Guanjie, et al.
Veröffentlicht: (2025)

From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration
von: Song, Mingyang, et al.
Veröffentlicht: (2025)

SURf: Teaching Large Vision-Language Models to Selectively Utilize Retrieved Information
von: Sun, Jiashuo, et al.
Veröffentlicht: (2024)

DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models
von: He, Zefeng, et al.
Veröffentlicht: (2025)

Step-level Reward for Free in RL-based T2I Diffusion Model Fine-tuning
von: Liao, Xinyao, et al.
Veröffentlicht: (2025)

SATORI-R1: Incentivizing Multimodal Reasoning through Explicit Visual Anchoring
von: Shen, Chuming, et al.
Veröffentlicht: (2025)

CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling
von: Zhang, Jihai, et al.
Veröffentlicht: (2024)

Predict to Skip: Linear Multistep Feature Forecasting for Efficient Diffusion Transformers
von: Cui, Hanshuai, et al.
Veröffentlicht: (2026)

ExFusion: Efficient Transformer Training via Multi-Experts Fusion
von: Ruan, Jiacheng, et al.
Veröffentlicht: (2026)

FrameThinker: Learning to Think with Long Videos via Multi-Turn Frame Spotlighting
von: He, Zefeng, et al.
Veröffentlicht: (2025)

GM-Skip: Metric-Guided Transformer Block Skipping for Efficient Vision-Language Models
von: Huang, Lianming, et al.
Veröffentlicht: (2025)

OpenThinkIMG: Learning to Think with Images via Visual Tool Reinforcement Learning
von: Su, Zhaochen, et al.
Veröffentlicht: (2025)

A Space-Time Transformer for Precipitation Nowcasting
von: Harris, Levi, et al.
Veröffentlicht: (2025)

SkipViT: Speeding Up Vision Transformers with a Token-Level Skip Connection
von: Ataiefard, Foozhan, et al.
Veröffentlicht: (2024)

FreeText: Training-Free Text Rendering in Diffusion Transformers via Attention Localization and Spectral Glyph Injection
von: Zhang, Ruiqiang, et al.
Veröffentlicht: (2026)

Spectral-Structured Diffusion for Single-Image Rain Removal
von: Xing, Yucheng, et al.
Veröffentlicht: (2026)

SSI-DM: Singularity Skipping Inversion of Diffusion Models
von: Min, Chen, et al.
Veröffentlicht: (2026)

Skip and Skip: Segmenting Medical Images with Prompts
von: Chen, Jiawei, et al.
Veröffentlicht: (2024)

On the Vulnerability of Skip Connections to Model Inversion Attacks
von: Koh, Jun Hao, et al.
Veröffentlicht: (2024)

Optimization of Layer Skipping and Frequency Scaling for Convolutional Neural Networks under Latency Constraint
von: Chan, Minh David Thao, et al.
Veröffentlicht: (2025)

UNet--: Memory-Efficient and Feature-Enhanced Network Architecture based on U-Net with Reduced Skip-Connections
von: Yin, Lingxiao, et al.
Veröffentlicht: (2024)

A Survey of Attacks on Large Vision-Language Models: Resources, Advances, and Future Trends
von: Liu, Daizong, et al.
Veröffentlicht: (2024)

Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path Reasoning
von: Qu, Xiaoye, et al.
Veröffentlicht: (2024)

SkipVAR: Accelerating Visual Autoregressive Modeling via Adaptive Frequency-Aware Skipping
von: Li, Jiajun, et al.
Veröffentlicht: (2025)

Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval Using Language
von: Fang, Xiang, et al.
Veröffentlicht: (2026)

Training-Free Style and Content Transfer by Leveraging U-Net Skip Connections in Stable Diffusion
von: Schaerf, Ludovica, et al.
Veröffentlicht: (2025)

SkiP: When to Skip and When to Refine for Efficient Robot Manipulation
von: Dai, Mingtong, et al.
Veröffentlicht: (2026)

Memory-Efficient Fine-Tuning Diffusion Transformers via Dynamic Patch Sampling and Block Skipping
von: Park, Sunghyun, et al.
Veröffentlicht: (2026)

SkipSR: Faster Super Resolution with Token Skipping
von: Choudhury, Rohan, et al.
Veröffentlicht: (2025)

Soft Masked Transformer for Point Cloud Processing with Skip Attention-Based Upsampling
von: He, Yong, et al.
Veröffentlicht: (2024)

GRIT-LP: Graph Transformer with Long-Range Skip Connection and Partitioned Spatial Graphs for Accurate Ice Layer Thickness Prediction
von: Liu, Zesheng, et al.
Veröffentlicht: (2025)

Forecast then Calibrate: Feature Caching as ODE for Efficient Diffusion Transformers
von: Zheng, Shikang, et al.
Veröffentlicht: (2025)

SkipGS: Post-Densification Backward Skipping for Efficient 3DGS Training
von: Li, Jingxing, et al.
Veröffentlicht: (2026)

TransGUNet: Transformer Meets Graph-based Skip Connection for Medical Image Segmentation
von: Nam, Ju-Hyeon, et al.
Veröffentlicht: (2025)

Beyond Skip Connection: Pooling and Unpooling Design for Elimination Singularities
von: Sun, Chengkun, et al.
Veröffentlicht: (2024)

Forecast the Principal, Stabilize the Residual: Subspace-Aware Feature Caching for Efficient Diffusion Transformers
von: Chen, Guantao, et al.
Veröffentlicht: (2026)

VideoSSR: Video Self-Supervised Reinforcement Learning
von: He, Zefeng, et al.
Veröffentlicht: (2025)

Rethinking Skip Connections: Additive U-Net for Robust and Interpretable Denoising
von: Lakkavalli, Vikram R
Veröffentlicht: (2026)

Enhancing Feature Fusion of U-like Networks with Dynamic Skip Connections
von: Cao, Yue, et al.
Veröffentlicht: (2025)

Skip-Vision: Efficient and Scalable Acceleration of Vision-Language Models via Adaptive Token Skipping
von: Zeng, Weili, et al.
Veröffentlicht: (2025)