Enregistré dans:
| Auteurs principaux: | Qiu, Jielin, Han, William, Zhao, Xuandong, Long, Shangbang, Faloutsos, Christos, Li, Lei |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2406.03728 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Entity6K: A Large Open-Domain Evaluation Dataset for Real-World Entity Recognition
par: Qiu, Jielin, et autres
Publié: (2024)
par: Qiu, Jielin, et autres
Publié: (2024)
SnapNTell: Enhancing Entity-Centric Visual Question Answering with Retrieval Augmented Multimodal LLM
par: Qiu, Jielin, et autres
Publié: (2024)
par: Qiu, Jielin, et autres
Publié: (2024)
Benchmarking Robustness of Multimodal Image-Text Models under Distribution Shift
par: Qiu, Jielin, et autres
Publié: (2022)
par: Qiu, Jielin, et autres
Publié: (2022)
Mask Image Watermarking
par: Hu, Runyi, et autres
Publié: (2025)
par: Hu, Runyi, et autres
Publié: (2025)
Invisible Image Watermarks Are Provably Removable Using Generative AI
par: Zhao, Xuandong, et autres
Publié: (2023)
par: Zhao, Xuandong, et autres
Publié: (2023)
VideoShield: Regulating Diffusion-based Video Generation Models via Watermarking
par: Hu, Runyi, et autres
Publié: (2025)
par: Hu, Runyi, et autres
Publié: (2025)
What Color Is It? A Text-Interference Multimodal Hallucination Benchmark
par: Zhao, Jinkun, et autres
Publié: (2025)
par: Zhao, Jinkun, et autres
Publié: (2025)
SuperMark: Robust and Training-free Image Watermarking via Diffusion-based Super-Resolution
par: Hu, Runyi, et autres
Publié: (2024)
par: Hu, Runyi, et autres
Publié: (2024)
ResGuard: Enhancing Robustness Against Known Original Attacks in Deep Watermarking
par: Wang, Hanyi, et autres
Publié: (2026)
par: Wang, Hanyi, et autres
Publié: (2026)
GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation
par: Zong, Yi, et autres
Publié: (2024)
par: Zong, Yi, et autres
Publié: (2024)
Adversarial Shallow Watermarking
par: Li, Guobiao, et autres
Publié: (2025)
par: Li, Guobiao, et autres
Publié: (2025)
ENC-Bench: A Benchmark for Evaluating Multimodal Large Language Models in Electronic Navigational Chart Understanding
par: Cheng, Ao, et autres
Publié: (2026)
par: Cheng, Ao, et autres
Publié: (2026)
Warfare:Breaking the Watermark Protection of AI-Generated Content
par: Li, Guanlin, et autres
Publié: (2023)
par: Li, Guanlin, et autres
Publié: (2023)
NeuroABench: A Multimodal Evaluation Benchmark for Neurosurgical Anatomy Identification
par: Song, Ziyang, et autres
Publié: (2025)
par: Song, Ziyang, et autres
Publié: (2025)
VP-Bench: A Comprehensive Benchmark for Visual Prompting in Multimodal Large Language Models
par: Xu, Mingjie, et autres
Publié: (2025)
par: Xu, Mingjie, et autres
Publié: (2025)
SONIC-O1: A Real-World Benchmark for Evaluating Multimodal Large Language Models on Audio-Video Understanding
par: Radwan, Ahmed Y., et autres
Publié: (2026)
par: Radwan, Ahmed Y., et autres
Publié: (2026)
SHIELD : An Evaluation Benchmark for Face Spoofing and Forgery Detection with Multimodal Large Language Models
par: Shi, Yichen, et autres
Publié: (2024)
par: Shi, Yichen, et autres
Publié: (2024)
WMVLM: Evaluating Diffusion Model Image Watermarking via Vision-Language Models
par: Yang, Zijin, et autres
Publié: (2026)
par: Yang, Zijin, et autres
Publié: (2026)
TouchUp-G: Improving Feature Representation through Graph-Centric Finetuning
par: Zhu, Jing, et autres
Publié: (2023)
par: Zhu, Jing, et autres
Publié: (2023)
LongInsightBench: A Comprehensive Benchmark for Evaluating Omni-Modal Models on Human-Centric Long-Video Understanding
par: Han, ZhaoYang, et autres
Publié: (2025)
par: Han, ZhaoYang, et autres
Publié: (2025)
RAW: Robust Avatar Watermarking -- Benchmarking and Baseline
par: Parry, Jack, et autres
Publié: (2026)
par: Parry, Jack, et autres
Publié: (2026)
DisasterInsight: A Multimodal Benchmark for Function-Aware and Grounded Disaster Assessment
par: Tehrani, Sara, et autres
Publié: (2026)
par: Tehrani, Sara, et autres
Publié: (2026)
DIS-CO: Discovering Copyrighted Content in VLMs Training Data
par: Duarte, André V., et autres
Publié: (2025)
par: Duarte, André V., et autres
Publié: (2025)
MMT-Bench: A Comprehensive Multimodal Benchmark for Evaluating Large Vision-Language Models Towards Multitask AGI
par: Ying, Kaining, et autres
Publié: (2024)
par: Ying, Kaining, et autres
Publié: (2024)
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models
par: Fu, Chaoyou, et autres
Publié: (2023)
par: Fu, Chaoyou, et autres
Publié: (2023)
UniM: A Unified Any-to-Any Interleaved Multimodal Benchmark
par: Li, Yanlin, et autres
Publié: (2026)
par: Li, Yanlin, et autres
Publié: (2026)
Are Watermarked Images Editable? SafeMark for Watermark-Preserving Text-Guided Image Editing
par: Wu, Xiaodong, et autres
Publié: (2026)
par: Wu, Xiaodong, et autres
Publié: (2026)
VB-Mitigator: An Open-source Framework for Evaluating and Advancing Visual Bias Mitigation
par: Sarridis, Ioannis, et autres
Publié: (2025)
par: Sarridis, Ioannis, et autres
Publié: (2025)
CSVQA: A Chinese Multimodal Benchmark for Evaluating STEM Reasoning Capabilities of VLMs
par: Jian, Ai, et autres
Publié: (2025)
par: Jian, Ai, et autres
Publié: (2025)
Meta-FC: Meta-Learning with Feature Consistency for Robust and Generalizable Watermarking
par: Li, Yuheng, et autres
Publié: (2026)
par: Li, Yuheng, et autres
Publié: (2026)
LMOD+: A Comprehensive Multimodal Dataset and Benchmark for Developing and Evaluating Multimodal Large Language Models in Ophthalmology
par: Qin, Zhenyue, et autres
Publié: (2025)
par: Qin, Zhenyue, et autres
Publié: (2025)
Deep Robust Reversible Watermarking
par: Chen, Jiale, et autres
Publié: (2025)
par: Chen, Jiale, et autres
Publié: (2025)
Benchmarking Multimodal Mathematical Reasoning with Explicit Visual Dependency
par: Wang, Zhikai, et autres
Publié: (2025)
par: Wang, Zhikai, et autres
Publié: (2025)
MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning
par: Liang, Yiqing, et autres
Publié: (2025)
par: Liang, Yiqing, et autres
Publié: (2025)
Evaluation of Security of ML-based Watermarking: Copy and Removal Attacks
par: Kinakh, Vitaliy, et autres
Publié: (2024)
par: Kinakh, Vitaliy, et autres
Publié: (2024)
MDK12-Bench: A Multi-Discipline Benchmark for Evaluating Reasoning in Multimodal Large Language Models
par: Zhou, Pengfei, et autres
Publié: (2025)
par: Zhou, Pengfei, et autres
Publié: (2025)
SSyncOA: Self-synchronizing Object-aligned Watermarking to Resist Cropping-paste Attacks
par: Zhao, Chengxin, et autres
Publié: (2024)
par: Zhao, Chengxin, et autres
Publié: (2024)
MCF-VC: Mitigate Catastrophic Forgetting in Class-Incremental Learning for Multimodal Video Captioning
par: Xiong, Huiyu, et autres
Publié: (2024)
par: Xiong, Huiyu, et autres
Publié: (2024)
Safe-Sora: Safe Text-to-Video Generation via Graphical Watermarking
par: Su, Zihan, et autres
Publié: (2025)
par: Su, Zihan, et autres
Publié: (2025)
Spy-Watermark: Robust Invisible Watermarking for Backdoor Attack
par: Wang, Ruofei, et autres
Publié: (2024)
par: Wang, Ruofei, et autres
Publié: (2024)
Documents similaires
-
Entity6K: A Large Open-Domain Evaluation Dataset for Real-World Entity Recognition
par: Qiu, Jielin, et autres
Publié: (2024) -
SnapNTell: Enhancing Entity-Centric Visual Question Answering with Retrieval Augmented Multimodal LLM
par: Qiu, Jielin, et autres
Publié: (2024) -
Benchmarking Robustness of Multimodal Image-Text Models under Distribution Shift
par: Qiu, Jielin, et autres
Publié: (2022) -
Mask Image Watermarking
par: Hu, Runyi, et autres
Publié: (2025) -
Invisible Image Watermarks Are Provably Removable Using Generative AI
par: Zhao, Xuandong, et autres
Publié: (2023)