Gespeichert in:
| Hauptverfasser: | Chen, Guanjie, Zhao, Xinyu, Zhou, Yucheng, Qu, Xiaoye, Chen, Tianlong, Cheng, Yu |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2411.17616 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Flash-DMD: Towards High-Fidelity Few-Step Image Generation with Efficient Distillation and Joint Reinforcement Learning
von: Chen, Guanjie, et al.
Veröffentlicht: (2025)
von: Chen, Guanjie, et al.
Veröffentlicht: (2025)
From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration
von: Song, Mingyang, et al.
Veröffentlicht: (2025)
von: Song, Mingyang, et al.
Veröffentlicht: (2025)
SURf: Teaching Large Vision-Language Models to Selectively Utilize Retrieved Information
von: Sun, Jiashuo, et al.
Veröffentlicht: (2024)
von: Sun, Jiashuo, et al.
Veröffentlicht: (2024)
DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models
von: He, Zefeng, et al.
Veröffentlicht: (2025)
von: He, Zefeng, et al.
Veröffentlicht: (2025)
Step-level Reward for Free in RL-based T2I Diffusion Model Fine-tuning
von: Liao, Xinyao, et al.
Veröffentlicht: (2025)
von: Liao, Xinyao, et al.
Veröffentlicht: (2025)
SATORI-R1: Incentivizing Multimodal Reasoning through Explicit Visual Anchoring
von: Shen, Chuming, et al.
Veröffentlicht: (2025)
von: Shen, Chuming, et al.
Veröffentlicht: (2025)
CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling
von: Zhang, Jihai, et al.
Veröffentlicht: (2024)
von: Zhang, Jihai, et al.
Veröffentlicht: (2024)
Predict to Skip: Linear Multistep Feature Forecasting for Efficient Diffusion Transformers
von: Cui, Hanshuai, et al.
Veröffentlicht: (2026)
von: Cui, Hanshuai, et al.
Veröffentlicht: (2026)
ExFusion: Efficient Transformer Training via Multi-Experts Fusion
von: Ruan, Jiacheng, et al.
Veröffentlicht: (2026)
von: Ruan, Jiacheng, et al.
Veröffentlicht: (2026)
FrameThinker: Learning to Think with Long Videos via Multi-Turn Frame Spotlighting
von: He, Zefeng, et al.
Veröffentlicht: (2025)
von: He, Zefeng, et al.
Veröffentlicht: (2025)
GM-Skip: Metric-Guided Transformer Block Skipping for Efficient Vision-Language Models
von: Huang, Lianming, et al.
Veröffentlicht: (2025)
von: Huang, Lianming, et al.
Veröffentlicht: (2025)
OpenThinkIMG: Learning to Think with Images via Visual Tool Reinforcement Learning
von: Su, Zhaochen, et al.
Veröffentlicht: (2025)
von: Su, Zhaochen, et al.
Veröffentlicht: (2025)
A Space-Time Transformer for Precipitation Nowcasting
von: Harris, Levi, et al.
Veröffentlicht: (2025)
von: Harris, Levi, et al.
Veröffentlicht: (2025)
SkipViT: Speeding Up Vision Transformers with a Token-Level Skip Connection
von: Ataiefard, Foozhan, et al.
Veröffentlicht: (2024)
von: Ataiefard, Foozhan, et al.
Veröffentlicht: (2024)
FreeText: Training-Free Text Rendering in Diffusion Transformers via Attention Localization and Spectral Glyph Injection
von: Zhang, Ruiqiang, et al.
Veröffentlicht: (2026)
von: Zhang, Ruiqiang, et al.
Veröffentlicht: (2026)
Spectral-Structured Diffusion for Single-Image Rain Removal
von: Xing, Yucheng, et al.
Veröffentlicht: (2026)
von: Xing, Yucheng, et al.
Veröffentlicht: (2026)
SSI-DM: Singularity Skipping Inversion of Diffusion Models
von: Min, Chen, et al.
Veröffentlicht: (2026)
von: Min, Chen, et al.
Veröffentlicht: (2026)
Skip and Skip: Segmenting Medical Images with Prompts
von: Chen, Jiawei, et al.
Veröffentlicht: (2024)
von: Chen, Jiawei, et al.
Veröffentlicht: (2024)
On the Vulnerability of Skip Connections to Model Inversion Attacks
von: Koh, Jun Hao, et al.
Veröffentlicht: (2024)
von: Koh, Jun Hao, et al.
Veröffentlicht: (2024)
Optimization of Layer Skipping and Frequency Scaling for Convolutional Neural Networks under Latency Constraint
von: Chan, Minh David Thao, et al.
Veröffentlicht: (2025)
von: Chan, Minh David Thao, et al.
Veröffentlicht: (2025)
UNet--: Memory-Efficient and Feature-Enhanced Network Architecture based on U-Net with Reduced Skip-Connections
von: Yin, Lingxiao, et al.
Veröffentlicht: (2024)
von: Yin, Lingxiao, et al.
Veröffentlicht: (2024)
A Survey of Attacks on Large Vision-Language Models: Resources, Advances, and Future Trends
von: Liu, Daizong, et al.
Veröffentlicht: (2024)
von: Liu, Daizong, et al.
Veröffentlicht: (2024)
Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path Reasoning
von: Qu, Xiaoye, et al.
Veröffentlicht: (2024)
von: Qu, Xiaoye, et al.
Veröffentlicht: (2024)
SkipVAR: Accelerating Visual Autoregressive Modeling via Adaptive Frequency-Aware Skipping
von: Li, Jiajun, et al.
Veröffentlicht: (2025)
von: Li, Jiajun, et al.
Veröffentlicht: (2025)
Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval Using Language
von: Fang, Xiang, et al.
Veröffentlicht: (2026)
von: Fang, Xiang, et al.
Veröffentlicht: (2026)
Training-Free Style and Content Transfer by Leveraging U-Net Skip Connections in Stable Diffusion
von: Schaerf, Ludovica, et al.
Veröffentlicht: (2025)
von: Schaerf, Ludovica, et al.
Veröffentlicht: (2025)
SkiP: When to Skip and When to Refine for Efficient Robot Manipulation
von: Dai, Mingtong, et al.
Veröffentlicht: (2026)
von: Dai, Mingtong, et al.
Veröffentlicht: (2026)
Memory-Efficient Fine-Tuning Diffusion Transformers via Dynamic Patch Sampling and Block Skipping
von: Park, Sunghyun, et al.
Veröffentlicht: (2026)
von: Park, Sunghyun, et al.
Veröffentlicht: (2026)
SkipSR: Faster Super Resolution with Token Skipping
von: Choudhury, Rohan, et al.
Veröffentlicht: (2025)
von: Choudhury, Rohan, et al.
Veröffentlicht: (2025)
Soft Masked Transformer for Point Cloud Processing with Skip Attention-Based Upsampling
von: He, Yong, et al.
Veröffentlicht: (2024)
von: He, Yong, et al.
Veröffentlicht: (2024)
GRIT-LP: Graph Transformer with Long-Range Skip Connection and Partitioned Spatial Graphs for Accurate Ice Layer Thickness Prediction
von: Liu, Zesheng, et al.
Veröffentlicht: (2025)
von: Liu, Zesheng, et al.
Veröffentlicht: (2025)
Forecast then Calibrate: Feature Caching as ODE for Efficient Diffusion Transformers
von: Zheng, Shikang, et al.
Veröffentlicht: (2025)
von: Zheng, Shikang, et al.
Veröffentlicht: (2025)
SkipGS: Post-Densification Backward Skipping for Efficient 3DGS Training
von: Li, Jingxing, et al.
Veröffentlicht: (2026)
von: Li, Jingxing, et al.
Veröffentlicht: (2026)
TransGUNet: Transformer Meets Graph-based Skip Connection for Medical Image Segmentation
von: Nam, Ju-Hyeon, et al.
Veröffentlicht: (2025)
von: Nam, Ju-Hyeon, et al.
Veröffentlicht: (2025)
Beyond Skip Connection: Pooling and Unpooling Design for Elimination Singularities
von: Sun, Chengkun, et al.
Veröffentlicht: (2024)
von: Sun, Chengkun, et al.
Veröffentlicht: (2024)
Forecast the Principal, Stabilize the Residual: Subspace-Aware Feature Caching for Efficient Diffusion Transformers
von: Chen, Guantao, et al.
Veröffentlicht: (2026)
von: Chen, Guantao, et al.
Veröffentlicht: (2026)
VideoSSR: Video Self-Supervised Reinforcement Learning
von: He, Zefeng, et al.
Veröffentlicht: (2025)
von: He, Zefeng, et al.
Veröffentlicht: (2025)
Rethinking Skip Connections: Additive U-Net for Robust and Interpretable Denoising
von: Lakkavalli, Vikram R
Veröffentlicht: (2026)
von: Lakkavalli, Vikram R
Veröffentlicht: (2026)
Enhancing Feature Fusion of U-like Networks with Dynamic Skip Connections
von: Cao, Yue, et al.
Veröffentlicht: (2025)
von: Cao, Yue, et al.
Veröffentlicht: (2025)
Skip-Vision: Efficient and Scalable Acceleration of Vision-Language Models via Adaptive Token Skipping
von: Zeng, Weili, et al.
Veröffentlicht: (2025)
von: Zeng, Weili, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Flash-DMD: Towards High-Fidelity Few-Step Image Generation with Efficient Distillation and Joint Reinforcement Learning
von: Chen, Guanjie, et al.
Veröffentlicht: (2025) -
From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration
von: Song, Mingyang, et al.
Veröffentlicht: (2025) -
SURf: Teaching Large Vision-Language Models to Selectively Utilize Retrieved Information
von: Sun, Jiashuo, et al.
Veröffentlicht: (2024) -
DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models
von: He, Zefeng, et al.
Veröffentlicht: (2025) -
Step-level Reward for Free in RL-based T2I Diffusion Model Fine-tuning
von: Liao, Xinyao, et al.
Veröffentlicht: (2025)