:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Tang, Zhengmi, Mitsui, Yuto, Miyazaki, Tomo, Omachi, Shinichiro
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2505.06855
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Towards Cross-Domain Multi-Targeted Adversarial Attacks
par: Gonçalves, Taïga, et autres
Publié: (2025)

Controlling Rate, Distortion, and Realism: Towards a Single Comprehensive Neural Image Compression Model
par: Iwai, Shoma, et autres
Publié: (2024)

GPSMamba: A Global Phase and Spectral Prompt-guided Mamba for Infrared Image Super-Resolution
par: Huang, Yongsong, et autres
Publié: (2025)

Class-agnostic 3D Segmentation by Granularity-Consistent Automatic 2D Mask Tracking
par: Wang, Juan, et autres
Publié: (2025)

IRSRMamba: Infrared Image Super-Resolution via Mamba-based Wavelet Transform Feature Modulation Model
par: Huang, Yongsong, et autres
Publié: (2024)

Infrared Image Super-Resolution: Systematic Review, and Future Trends
par: Huang, Yongsong, et autres
Publié: (2022)

Texture and Noise Dual Adaptation for Infrared Image Super-Resolution
par: Huang, Yongsong, et autres
Publié: (2023)

POCA: Pareto-Optimal Curriculum Alignment for Visual Text Generation
par: Fan, Yaohou, et autres
Publié: (2026)

GTFMN: Guided Texture and Feature Modulation Network for Low-Light Image Enhancement and Super-Resolution
par: Huang, Yongsong, et autres
Publié: (2026)

U-Harmony: Enhancing Joint Training for Segmentation Models with Universal Harmonization
par: Ma, Weiwei, et autres
Publié: (2026)

Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model
par: Iwai, Shoma, et autres
Publié: (2024)

DiCTI: Diffusion-based Clothing Designer via Text-guided Input
par: Lampe, Ajda, et autres
Publié: (2024)

Learning Joint ID-Textual Representation for ID-Preserving Image Synthesis
par: Liu, Zichuan, et autres
Publié: (2025)

Learning Multiple Representations with Inconsistency-Guided Detail Regularization for Mask-Guided Matting
par: Jiang, Weihao, et autres
Publié: (2024)

MaskSem: Semantic-Guided Masking for Learning 3D Hybrid High-Order Motion Representation
par: Wei, Wei, et autres
Publié: (2025)

Textual Query-Driven Mask Transformer for Domain Generalized Segmentation
par: Pak, Byeonghyun, et autres
Publié: (2024)

Multiplicative Loss for Enhancing Semantic Segmentation in Medical and Cellular Images
par: Yokoi, Yuto, et autres
Publié: (2025)

MarkushGrapher: Joint Visual and Textual Recognition of Markush Structures
par: Morin, Lucas, et autres
Publié: (2025)

Multiple Instance Learning Framework with Masked Hard Instance Mining for Gigapixel Histopathology Image Analysis
par: Tang, Wenhao, et autres
Publié: (2025)

PRIOR: Prototype Representation Joint Learning from Medical Images and Reports
par: Cheng, Pujin, et autres
Publié: (2023)

MaskFi: Unsupervised Learning of WiFi and Vision Representations for Multimodal Human Activity Recognition
par: Yang, Jianfei, et autres
Publié: (2024)

Anatomical 3D Style Transfer Enabling Efficient Federated Learning with Extremely Low Communication Costs
par: Shibata, Yuto, et autres
Publié: (2024)

Multitask Learning for SAR Ship Detection with Gaussian-Mask Joint Segmentation
par: Zhao, Ming, et autres
Publié: (2024)

Thoughts on Objectives of Sparse and Hierarchical Masked Image Model
par: Miyazaki, Asahi, et autres
Publié: (2025)

Robust Representation Learning in Masked Autoencoders
par: Shrivastava, Anika, et autres
Publié: (2026)

Better, Stronger, Faster: Tackling the Trilemma in MLLM-based Segmentation with Simultaneous Textual Mask Prediction
par: Liu, Jiazhen, et autres
Publié: (2025)

Joint-Embedding Predictive Architecture for Self-Supervised Learning of Mask Classification Architecture
par: Kim, Dong-Hee, et autres
Publié: (2024)

BIMM: Brain Inspired Masked Modeling for Video Representation Learning
par: Wan, Zhifan, et autres
Publié: (2024)

T-MAE: Temporal Masked Autoencoders for Point Cloud Representation Learning
par: Wei, Weijie, et autres
Publié: (2023)

Improving Image Restoration through Removing Degradations in Textual Representations
par: Lin, Jingbo, et autres
Publié: (2023)

Instance-aware Image Colorization with Controllable Textual Descriptions and Segmentation Masks
par: An, Yanru, et autres
Publié: (2025)

MaskFuser: Masked Fusion of Joint Multi-Modal Tokenization for End-to-End Autonomous Driving
par: Duan, Yiqun, et autres
Publié: (2024)

TrackMAE: Video Representation Learning via Track Mask and Predict
par: Vandeghen, Renaud, et autres
Publié: (2026)

Unbiasing through Textual Descriptions: Mitigating Representation Bias in Video Benchmarks
par: Shvetsova, Nina, et autres
Publié: (2025)

SARMAE: Masked Autoencoder for SAR Representation Learning
par: Liu, Danxu, et autres
Publié: (2025)

Multiple Random Masking Autoencoder Ensembles for Robust Multimodal Semi-supervised Learning
par: Todoran, Alexandru-Raul, et autres
Publié: (2024)

MaskGaussian: Adaptive 3D Gaussian Representation from Probabilistic Masks
par: Liu, Yifei, et autres
Publié: (2024)

LV-MAE: Learning Long Video Representations through Masked-Embedding Autoencoders
par: Naiman, Ilan, et autres
Publié: (2025)

MLIP: Medical Language-Image Pre-training with Masked Local Representation Learning
par: Liu, Jiarun, et autres
Publié: (2024)

Learning Unsupervised Gaze Representation via Eye Mask Driven Information Bottleneck
par: Jiang, Yangzhou, et autres
Publié: (2024)