:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Qiu, Jielin, Han, William, Zhao, Xuandong, Long, Shangbang, Faloutsos, Christos, Li, Lei
Format:	Preprint
Publié:	2024
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2406.03728
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Entity6K: A Large Open-Domain Evaluation Dataset for Real-World Entity Recognition
par: Qiu, Jielin, et autres
Publié: (2024)

SnapNTell: Enhancing Entity-Centric Visual Question Answering with Retrieval Augmented Multimodal LLM
par: Qiu, Jielin, et autres
Publié: (2024)

Benchmarking Robustness of Multimodal Image-Text Models under Distribution Shift
par: Qiu, Jielin, et autres
Publié: (2022)

Mask Image Watermarking
par: Hu, Runyi, et autres
Publié: (2025)

Invisible Image Watermarks Are Provably Removable Using Generative AI
par: Zhao, Xuandong, et autres
Publié: (2023)

VideoShield: Regulating Diffusion-based Video Generation Models via Watermarking
par: Hu, Runyi, et autres
Publié: (2025)

What Color Is It? A Text-Interference Multimodal Hallucination Benchmark
par: Zhao, Jinkun, et autres
Publié: (2025)

SuperMark: Robust and Training-free Image Watermarking via Diffusion-based Super-Resolution
par: Hu, Runyi, et autres
Publié: (2024)

ResGuard: Enhancing Robustness Against Known Original Attacks in Deep Watermarking
par: Wang, Hanyi, et autres
Publié: (2026)

GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation
par: Zong, Yi, et autres
Publié: (2024)

Adversarial Shallow Watermarking
par: Li, Guobiao, et autres
Publié: (2025)

ENC-Bench: A Benchmark for Evaluating Multimodal Large Language Models in Electronic Navigational Chart Understanding
par: Cheng, Ao, et autres
Publié: (2026)

Warfare:Breaking the Watermark Protection of AI-Generated Content
par: Li, Guanlin, et autres
Publié: (2023)

NeuroABench: A Multimodal Evaluation Benchmark for Neurosurgical Anatomy Identification
par: Song, Ziyang, et autres
Publié: (2025)

VP-Bench: A Comprehensive Benchmark for Visual Prompting in Multimodal Large Language Models
par: Xu, Mingjie, et autres
Publié: (2025)

SONIC-O1: A Real-World Benchmark for Evaluating Multimodal Large Language Models on Audio-Video Understanding
par: Radwan, Ahmed Y., et autres
Publié: (2026)

SHIELD : An Evaluation Benchmark for Face Spoofing and Forgery Detection with Multimodal Large Language Models
par: Shi, Yichen, et autres
Publié: (2024)

WMVLM: Evaluating Diffusion Model Image Watermarking via Vision-Language Models
par: Yang, Zijin, et autres
Publié: (2026)

TouchUp-G: Improving Feature Representation through Graph-Centric Finetuning
par: Zhu, Jing, et autres
Publié: (2023)

LongInsightBench: A Comprehensive Benchmark for Evaluating Omni-Modal Models on Human-Centric Long-Video Understanding
par: Han, ZhaoYang, et autres
Publié: (2025)

RAW: Robust Avatar Watermarking -- Benchmarking and Baseline
par: Parry, Jack, et autres
Publié: (2026)

DisasterInsight: A Multimodal Benchmark for Function-Aware and Grounded Disaster Assessment
par: Tehrani, Sara, et autres
Publié: (2026)

DIS-CO: Discovering Copyrighted Content in VLMs Training Data
par: Duarte, André V., et autres
Publié: (2025)

MMT-Bench: A Comprehensive Multimodal Benchmark for Evaluating Large Vision-Language Models Towards Multitask AGI
par: Ying, Kaining, et autres
Publié: (2024)

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models
par: Fu, Chaoyou, et autres
Publié: (2023)

UniM: A Unified Any-to-Any Interleaved Multimodal Benchmark
par: Li, Yanlin, et autres
Publié: (2026)

Are Watermarked Images Editable? SafeMark for Watermark-Preserving Text-Guided Image Editing
par: Wu, Xiaodong, et autres
Publié: (2026)

VB-Mitigator: An Open-source Framework for Evaluating and Advancing Visual Bias Mitigation
par: Sarridis, Ioannis, et autres
Publié: (2025)

CSVQA: A Chinese Multimodal Benchmark for Evaluating STEM Reasoning Capabilities of VLMs
par: Jian, Ai, et autres
Publié: (2025)

Meta-FC: Meta-Learning with Feature Consistency for Robust and Generalizable Watermarking
par: Li, Yuheng, et autres
Publié: (2026)

LMOD+: A Comprehensive Multimodal Dataset and Benchmark for Developing and Evaluating Multimodal Large Language Models in Ophthalmology
par: Qin, Zhenyue, et autres
Publié: (2025)

Deep Robust Reversible Watermarking
par: Chen, Jiale, et autres
Publié: (2025)

Benchmarking Multimodal Mathematical Reasoning with Explicit Visual Dependency
par: Wang, Zhikai, et autres
Publié: (2025)

MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning
par: Liang, Yiqing, et autres
Publié: (2025)

Evaluation of Security of ML-based Watermarking: Copy and Removal Attacks
par: Kinakh, Vitaliy, et autres
Publié: (2024)

MDK12-Bench: A Multi-Discipline Benchmark for Evaluating Reasoning in Multimodal Large Language Models
par: Zhou, Pengfei, et autres
Publié: (2025)

SSyncOA: Self-synchronizing Object-aligned Watermarking to Resist Cropping-paste Attacks
par: Zhao, Chengxin, et autres
Publié: (2024)

MCF-VC: Mitigate Catastrophic Forgetting in Class-Incremental Learning for Multimodal Video Captioning
par: Xiong, Huiyu, et autres
Publié: (2024)

Safe-Sora: Safe Text-to-Video Generation via Graphical Watermarking
par: Su, Zihan, et autres
Publié: (2025)

Spy-Watermark: Robust Invisible Watermarking for Backdoor Attack
par: Wang, Ruofei, et autres
Publié: (2024)