Salvato in:
| Autori principali: | Cheng, Weijin, Liu, Jianzhi, Deng, Jiawen, Ren, Fuji |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2401.01128 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
SSP-SAM: SAM with Semantic-Spatial Prompt for Referring Expression Segmentation
di: Tang, Wei, et al.
Pubblicazione: (2026)
di: Tang, Wei, et al.
Pubblicazione: (2026)
F3-Pruning: A Training-Free and Generalized Pruning Strategy towards Faster and Finer Text-to-Video Synthesis
di: Su, Sitong, et al.
Pubblicazione: (2023)
di: Su, Sitong, et al.
Pubblicazione: (2023)
Road Rage Reasoning with Vision-language Models (VLMs): Task Definition and Evaluation Dataset
di: Weng, Yibing, et al.
Pubblicazione: (2025)
di: Weng, Yibing, et al.
Pubblicazione: (2025)
PromptSafe: Gated Prompt Tuning for Safe Text-to-Image Generation
di: Jing, Zonglei, et al.
Pubblicazione: (2025)
di: Jing, Zonglei, et al.
Pubblicazione: (2025)
SSP-IR: Semantic and Structure Priors for Diffusion-based Realistic Image Restoration
di: Zhang, Yuhong, et al.
Pubblicazione: (2024)
di: Zhang, Yuhong, et al.
Pubblicazione: (2024)
Cross-head mutual Mean-Teaching for semi-supervised medical image segmentation
di: Li, Wei, et al.
Pubblicazione: (2023)
di: Li, Wei, et al.
Pubblicazione: (2023)
MSSTNet: A Multi-Scale Spatio-Temporal CNN-Transformer Network for Dynamic Facial Expression Recognition
di: Wang, Linhuang, et al.
Pubblicazione: (2024)
di: Wang, Linhuang, et al.
Pubblicazione: (2024)
PromptEnhancer: A Simple Approach to Enhance Text-to-Image Models via Chain-of-Thought Prompt Rewriting
di: Wang, Linqing, et al.
Pubblicazione: (2025)
di: Wang, Linqing, et al.
Pubblicazione: (2025)
Prompt2Fashion: An automatically generated fashion dataset
di: Argyrou, Georgia, et al.
Pubblicazione: (2024)
di: Argyrou, Georgia, et al.
Pubblicazione: (2024)
SSG-Dit: A Spatial Signal Guided Framework for Controllable Video Generation
di: Hu, Peng, et al.
Pubblicazione: (2025)
di: Hu, Peng, et al.
Pubblicazione: (2025)
StyleSSP: Sampling StartPoint Enhancement for Training-free Diffusion-based Method for Style Transfer
di: Xu, Ruojun, et al.
Pubblicazione: (2025)
di: Xu, Ruojun, et al.
Pubblicazione: (2025)
Toward Generalist Anomaly Detection via In-context Residual Learning with Few-shot Sample Prompts
di: Zhu, Jiawen, et al.
Pubblicazione: (2024)
di: Zhu, Jiawen, et al.
Pubblicazione: (2024)
TransUNext: towards a more advanced U-shaped framework for automatic vessel segmentation in the fundus image
di: Li, Xiang, et al.
Pubblicazione: (2024)
di: Li, Xiang, et al.
Pubblicazione: (2024)
Multi-view learning for automatic classification of multi-wavelength auroral images
di: Yang, Qiuju, et al.
Pubblicazione: (2023)
di: Yang, Qiuju, et al.
Pubblicazione: (2023)
Physics-informed simulation framework for realistic sonar image generation and statistical validation
di: S, Kamal Basha, et al.
Pubblicazione: (2026)
di: S, Kamal Basha, et al.
Pubblicazione: (2026)
OCCO: LVM-guided Infrared and Visible Image Fusion Framework based on Object-aware and Contextual COntrastive Learning
di: Li, Hui, et al.
Pubblicazione: (2025)
di: Li, Hui, et al.
Pubblicazione: (2025)
SSP-GNN: Learning to Track via Bilevel Optimization
di: Golias, Griffin, et al.
Pubblicazione: (2024)
di: Golias, Griffin, et al.
Pubblicazione: (2024)
AICL: Action In-Context Learning for Video Diffusion Model
di: Liu, Jianzhi, et al.
Pubblicazione: (2024)
di: Liu, Jianzhi, et al.
Pubblicazione: (2024)
ManipLVM-R1: Reinforcement Learning for Reasoning in Embodied Manipulation with Large Vision-Language Models
di: Song, Zirui, et al.
Pubblicazione: (2025)
di: Song, Zirui, et al.
Pubblicazione: (2025)
Exploring Kolmogorov-Arnold networks for realistic image sharpness assessment
di: Yu, Shaode, et al.
Pubblicazione: (2024)
di: Yu, Shaode, et al.
Pubblicazione: (2024)
Knowledge-Guided Prompt Learning for Deepfake Facial Image Detection
di: Wang, Hao, et al.
Pubblicazione: (2025)
di: Wang, Hao, et al.
Pubblicazione: (2025)
Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection
di: Zhu, Jiawen, et al.
Pubblicazione: (2024)
di: Zhu, Jiawen, et al.
Pubblicazione: (2024)
Toward distortion-aware change detection in realistic scenarios
di: Zhao, Yitao, et al.
Pubblicazione: (2024)
di: Zhao, Yitao, et al.
Pubblicazione: (2024)
Safe-SD: Safe and Traceable Stable Diffusion with Text Prompt Trigger for Invisible Generative Watermarking
di: Ma, Zhiyuan, et al.
Pubblicazione: (2024)
di: Ma, Zhiyuan, et al.
Pubblicazione: (2024)
Improving image synthesis with diffusion-negative sampling
di: Desai, Alakh, et al.
Pubblicazione: (2024)
di: Desai, Alakh, et al.
Pubblicazione: (2024)
SUTrack: Towards Simple and Unified Single Object Tracking
di: Chen, Xin, et al.
Pubblicazione: (2024)
di: Chen, Xin, et al.
Pubblicazione: (2024)
FACT: A Simple and Efficient Framework for Active Finetuning
di: Xu, Wenshuai, et al.
Pubblicazione: (2026)
di: Xu, Wenshuai, et al.
Pubblicazione: (2026)
SimpleProc: Fully Procedural Synthetic Data from Simple Rules for Multi-View Stereo
di: Ma, Zeyu, et al.
Pubblicazione: (2026)
di: Ma, Zeyu, et al.
Pubblicazione: (2026)
Universal Prompt Optimizer for Safe Text-to-Image Generation
di: Wu, Zongyu, et al.
Pubblicazione: (2024)
di: Wu, Zongyu, et al.
Pubblicazione: (2024)
SSP-RACL: Classification of Noisy Fundus Images with Self-Supervised Pretraining and Robust Adaptive Credal Loss
di: Ye, Mengwen, et al.
Pubblicazione: (2024)
di: Ye, Mengwen, et al.
Pubblicazione: (2024)
A Simple and Effective Point-based Network for Event Camera 6-DOFs Pose Relocalization
di: Ren, Hongwei, et al.
Pubblicazione: (2024)
di: Ren, Hongwei, et al.
Pubblicazione: (2024)
DCPT: Darkness Clue-Prompted Tracking in Nighttime UAVs
di: Zhu, Jiawen, et al.
Pubblicazione: (2023)
di: Zhu, Jiawen, et al.
Pubblicazione: (2023)
Leveraging a realistic synthetic database to learn Shape-from-Shading for estimating the colon depth in colonoscopy images
di: Ruano, Josué, et al.
Pubblicazione: (2023)
di: Ruano, Josué, et al.
Pubblicazione: (2023)
Towards synthetic generation of realistic wooden logs
di: Zolotarev, Fedor, et al.
Pubblicazione: (2025)
di: Zolotarev, Fedor, et al.
Pubblicazione: (2025)
SimpleFusion: A Simple Fusion Framework for Infrared and Visible Images
di: Chen, Ming, et al.
Pubblicazione: (2024)
di: Chen, Ming, et al.
Pubblicazione: (2024)
NSFW-Classifier Guided Prompt Sanitization for Safe Text-to-Image Generation
di: Xie, Yu, et al.
Pubblicazione: (2025)
di: Xie, Yu, et al.
Pubblicazione: (2025)
Generative Technology for Human Emotion Recognition: A Scope Review
di: Ma, Fei, et al.
Pubblicazione: (2024)
di: Ma, Fei, et al.
Pubblicazione: (2024)
ArtisanGS: Interactive Tools for Gaussian Splat Selection with AI and Human in the Loop
di: Tsang, Clement Fuji, et al.
Pubblicazione: (2026)
di: Tsang, Clement Fuji, et al.
Pubblicazione: (2026)
Segmentation by registration-enabled SAM prompt engineering using five reference images
di: Chen, Yaxi, et al.
Pubblicazione: (2024)
di: Chen, Yaxi, et al.
Pubblicazione: (2024)
TIPS Over Tricks: Simple Prompts for Effective Zero-shot Anomaly Detection
di: Salehi, Alireza, et al.
Pubblicazione: (2026)
di: Salehi, Alireza, et al.
Pubblicazione: (2026)
Documenti analoghi
-
SSP-SAM: SAM with Semantic-Spatial Prompt for Referring Expression Segmentation
di: Tang, Wei, et al.
Pubblicazione: (2026) -
F3-Pruning: A Training-Free and Generalized Pruning Strategy towards Faster and Finer Text-to-Video Synthesis
di: Su, Sitong, et al.
Pubblicazione: (2023) -
Road Rage Reasoning with Vision-language Models (VLMs): Task Definition and Evaluation Dataset
di: Weng, Yibing, et al.
Pubblicazione: (2025) -
PromptSafe: Gated Prompt Tuning for Safe Text-to-Image Generation
di: Jing, Zonglei, et al.
Pubblicazione: (2025) -
SSP-IR: Semantic and Structure Priors for Diffusion-based Realistic Image Restoration
di: Zhang, Yuhong, et al.
Pubblicazione: (2024)