Enregistré dans:
| Auteurs principaux: | Tang, Zhengmi, Mitsui, Yuto, Miyazaki, Tomo, Omachi, Shinichiro |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2505.06855 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Towards Cross-Domain Multi-Targeted Adversarial Attacks
par: Gonçalves, Taïga, et autres
Publié: (2025)
par: Gonçalves, Taïga, et autres
Publié: (2025)
Controlling Rate, Distortion, and Realism: Towards a Single Comprehensive Neural Image Compression Model
par: Iwai, Shoma, et autres
Publié: (2024)
par: Iwai, Shoma, et autres
Publié: (2024)
GPSMamba: A Global Phase and Spectral Prompt-guided Mamba for Infrared Image Super-Resolution
par: Huang, Yongsong, et autres
Publié: (2025)
par: Huang, Yongsong, et autres
Publié: (2025)
Class-agnostic 3D Segmentation by Granularity-Consistent Automatic 2D Mask Tracking
par: Wang, Juan, et autres
Publié: (2025)
par: Wang, Juan, et autres
Publié: (2025)
IRSRMamba: Infrared Image Super-Resolution via Mamba-based Wavelet Transform Feature Modulation Model
par: Huang, Yongsong, et autres
Publié: (2024)
par: Huang, Yongsong, et autres
Publié: (2024)
Infrared Image Super-Resolution: Systematic Review, and Future Trends
par: Huang, Yongsong, et autres
Publié: (2022)
par: Huang, Yongsong, et autres
Publié: (2022)
Texture and Noise Dual Adaptation for Infrared Image Super-Resolution
par: Huang, Yongsong, et autres
Publié: (2023)
par: Huang, Yongsong, et autres
Publié: (2023)
POCA: Pareto-Optimal Curriculum Alignment for Visual Text Generation
par: Fan, Yaohou, et autres
Publié: (2026)
par: Fan, Yaohou, et autres
Publié: (2026)
GTFMN: Guided Texture and Feature Modulation Network for Low-Light Image Enhancement and Super-Resolution
par: Huang, Yongsong, et autres
Publié: (2026)
par: Huang, Yongsong, et autres
Publié: (2026)
U-Harmony: Enhancing Joint Training for Segmentation Models with Universal Harmonization
par: Ma, Weiwei, et autres
Publié: (2026)
par: Ma, Weiwei, et autres
Publié: (2026)
Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model
par: Iwai, Shoma, et autres
Publié: (2024)
par: Iwai, Shoma, et autres
Publié: (2024)
DiCTI: Diffusion-based Clothing Designer via Text-guided Input
par: Lampe, Ajda, et autres
Publié: (2024)
par: Lampe, Ajda, et autres
Publié: (2024)
Learning Joint ID-Textual Representation for ID-Preserving Image Synthesis
par: Liu, Zichuan, et autres
Publié: (2025)
par: Liu, Zichuan, et autres
Publié: (2025)
Learning Multiple Representations with Inconsistency-Guided Detail Regularization for Mask-Guided Matting
par: Jiang, Weihao, et autres
Publié: (2024)
par: Jiang, Weihao, et autres
Publié: (2024)
MaskSem: Semantic-Guided Masking for Learning 3D Hybrid High-Order Motion Representation
par: Wei, Wei, et autres
Publié: (2025)
par: Wei, Wei, et autres
Publié: (2025)
Textual Query-Driven Mask Transformer for Domain Generalized Segmentation
par: Pak, Byeonghyun, et autres
Publié: (2024)
par: Pak, Byeonghyun, et autres
Publié: (2024)
Multiplicative Loss for Enhancing Semantic Segmentation in Medical and Cellular Images
par: Yokoi, Yuto, et autres
Publié: (2025)
par: Yokoi, Yuto, et autres
Publié: (2025)
MarkushGrapher: Joint Visual and Textual Recognition of Markush Structures
par: Morin, Lucas, et autres
Publié: (2025)
par: Morin, Lucas, et autres
Publié: (2025)
Multiple Instance Learning Framework with Masked Hard Instance Mining for Gigapixel Histopathology Image Analysis
par: Tang, Wenhao, et autres
Publié: (2025)
par: Tang, Wenhao, et autres
Publié: (2025)
PRIOR: Prototype Representation Joint Learning from Medical Images and Reports
par: Cheng, Pujin, et autres
Publié: (2023)
par: Cheng, Pujin, et autres
Publié: (2023)
MaskFi: Unsupervised Learning of WiFi and Vision Representations for Multimodal Human Activity Recognition
par: Yang, Jianfei, et autres
Publié: (2024)
par: Yang, Jianfei, et autres
Publié: (2024)
Anatomical 3D Style Transfer Enabling Efficient Federated Learning with Extremely Low Communication Costs
par: Shibata, Yuto, et autres
Publié: (2024)
par: Shibata, Yuto, et autres
Publié: (2024)
Multitask Learning for SAR Ship Detection with Gaussian-Mask Joint Segmentation
par: Zhao, Ming, et autres
Publié: (2024)
par: Zhao, Ming, et autres
Publié: (2024)
Thoughts on Objectives of Sparse and Hierarchical Masked Image Model
par: Miyazaki, Asahi, et autres
Publié: (2025)
par: Miyazaki, Asahi, et autres
Publié: (2025)
Robust Representation Learning in Masked Autoencoders
par: Shrivastava, Anika, et autres
Publié: (2026)
par: Shrivastava, Anika, et autres
Publié: (2026)
Better, Stronger, Faster: Tackling the Trilemma in MLLM-based Segmentation with Simultaneous Textual Mask Prediction
par: Liu, Jiazhen, et autres
Publié: (2025)
par: Liu, Jiazhen, et autres
Publié: (2025)
Joint-Embedding Predictive Architecture for Self-Supervised Learning of Mask Classification Architecture
par: Kim, Dong-Hee, et autres
Publié: (2024)
par: Kim, Dong-Hee, et autres
Publié: (2024)
BIMM: Brain Inspired Masked Modeling for Video Representation Learning
par: Wan, Zhifan, et autres
Publié: (2024)
par: Wan, Zhifan, et autres
Publié: (2024)
T-MAE: Temporal Masked Autoencoders for Point Cloud Representation Learning
par: Wei, Weijie, et autres
Publié: (2023)
par: Wei, Weijie, et autres
Publié: (2023)
Improving Image Restoration through Removing Degradations in Textual Representations
par: Lin, Jingbo, et autres
Publié: (2023)
par: Lin, Jingbo, et autres
Publié: (2023)
Instance-aware Image Colorization with Controllable Textual Descriptions and Segmentation Masks
par: An, Yanru, et autres
Publié: (2025)
par: An, Yanru, et autres
Publié: (2025)
MaskFuser: Masked Fusion of Joint Multi-Modal Tokenization for End-to-End Autonomous Driving
par: Duan, Yiqun, et autres
Publié: (2024)
par: Duan, Yiqun, et autres
Publié: (2024)
TrackMAE: Video Representation Learning via Track Mask and Predict
par: Vandeghen, Renaud, et autres
Publié: (2026)
par: Vandeghen, Renaud, et autres
Publié: (2026)
Unbiasing through Textual Descriptions: Mitigating Representation Bias in Video Benchmarks
par: Shvetsova, Nina, et autres
Publié: (2025)
par: Shvetsova, Nina, et autres
Publié: (2025)
SARMAE: Masked Autoencoder for SAR Representation Learning
par: Liu, Danxu, et autres
Publié: (2025)
par: Liu, Danxu, et autres
Publié: (2025)
Multiple Random Masking Autoencoder Ensembles for Robust Multimodal Semi-supervised Learning
par: Todoran, Alexandru-Raul, et autres
Publié: (2024)
par: Todoran, Alexandru-Raul, et autres
Publié: (2024)
MaskGaussian: Adaptive 3D Gaussian Representation from Probabilistic Masks
par: Liu, Yifei, et autres
Publié: (2024)
par: Liu, Yifei, et autres
Publié: (2024)
LV-MAE: Learning Long Video Representations through Masked-Embedding Autoencoders
par: Naiman, Ilan, et autres
Publié: (2025)
par: Naiman, Ilan, et autres
Publié: (2025)
MLIP: Medical Language-Image Pre-training with Masked Local Representation Learning
par: Liu, Jiarun, et autres
Publié: (2024)
par: Liu, Jiarun, et autres
Publié: (2024)
Learning Unsupervised Gaze Representation via Eye Mask Driven Information Bottleneck
par: Jiang, Yangzhou, et autres
Publié: (2024)
par: Jiang, Yangzhou, et autres
Publié: (2024)
Documents similaires
-
Towards Cross-Domain Multi-Targeted Adversarial Attacks
par: Gonçalves, Taïga, et autres
Publié: (2025) -
Controlling Rate, Distortion, and Realism: Towards a Single Comprehensive Neural Image Compression Model
par: Iwai, Shoma, et autres
Publié: (2024) -
GPSMamba: A Global Phase and Spectral Prompt-guided Mamba for Infrared Image Super-Resolution
par: Huang, Yongsong, et autres
Publié: (2025) -
Class-agnostic 3D Segmentation by Granularity-Consistent Automatic 2D Mask Tracking
par: Wang, Juan, et autres
Publié: (2025) -
IRSRMamba: Infrared Image Super-Resolution via Mamba-based Wavelet Transform Feature Modulation Model
par: Huang, Yongsong, et autres
Publié: (2024)