:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Hu, Zongxiang, Zhang, Zhaosheng
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Computer Vision and Pattern Recognition
Online-Zugang:	https://arxiv.org/abs/2407.03634
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images
von: Huang, Chaoqin, et al.
Veröffentlicht: (2024)

AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
von: Gao, Bin-Bin, et al.
Veröffentlicht: (2025)

Anomaly Detection by Adapting a pre-trained Vision Language Model
von: Cai, Yuxuan, et al.
Veröffentlicht: (2024)

Language Models Meet Anomaly Detection for Better Interpretability and Generalizability
von: Li, Jun, et al.
Veröffentlicht: (2024)

Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion Models
von: Jiang, Yankai, et al.
Veröffentlicht: (2025)

Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus
von: Kandakji, Lynn, et al.
Veröffentlicht: (2025)

Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities
von: Cai, Kaiwen, et al.
Veröffentlicht: (2024)

From CNN to CNN + RNN: Adapting Visualization Techniques for Time-Series Anomaly Detection
von: Poirier, Fabien
Veröffentlicht: (2024)

Beyond Text: Frozen Large Language Models in Visual Signal Comprehension
von: Zhu, Lei, et al.
Veröffentlicht: (2024)

Anomize: Better Open Vocabulary Video Anomaly Detection
von: Li, Fei, et al.
Veröffentlicht: (2025)

MonoSOWA: Scalable monocular 3D Object detector Without human Annotations
von: Skvrna, Jan, et al.
Veröffentlicht: (2025)

MIRAGE: Model-agnostic Industrial Realistic Anomaly Generation and Evaluation for Visual Anomaly Detection
von: Hu, Jinwei, et al.
Veröffentlicht: (2026)

Cross-level Attention with Overlapped Windows for Camouflaged Object Detection
von: Li, Jiepan, et al.
Veröffentlicht: (2023)

Customizing Visual-Language Foundation Models for Multi-modal Anomaly Detection and Reasoning
von: Xu, Xiaohao, et al.
Veröffentlicht: (2024)

Steering and Rectifying Latent Representation Manifolds in Frozen Multi-modal LLMs for Video Anomaly Detection
von: Cai, Zhaolin, et al.
Veröffentlicht: (2026)

AnomalyMoE: Towards a Language-free Generalist Model for Unified Visual Anomaly Detection
von: Gu, Zhaopeng, et al.
Veröffentlicht: (2025)

MediCLIP: Adapting CLIP for Few-shot Medical Image Anomaly Detection
von: Zhang, Ximiao, et al.
Veröffentlicht: (2024)

Chat-CBM: Towards Interactive Concept Bottleneck Models with Frozen Large Language Models
von: He, Hangzhou, et al.
Veröffentlicht: (2025)

Window Token Concatenation for Efficient Visual Large Language Models
von: Li, Yifan, et al.
Veröffentlicht: (2025)

Breaking the Bias: Recalibrating the Attention of Industrial Anomaly Detection
von: Chen, Xin, et al.
Veröffentlicht: (2024)

CoSwin: Convolution Enhanced Hierarchical Shifted Window Attention For Small-Scale Vision
von: Khadka, Puskal, et al.
Veröffentlicht: (2025)

Referring Camouflaged Object Detection With Multi-Context Overlapped Windows Cross-Attention
von: Wen, Yu, et al.
Veröffentlicht: (2025)

Hierarchical Windowed Graph Attention Network and a Large Scale Dataset for Isolated Indian Sign Language Recognition
von: Patra, Suvajit, et al.
Veröffentlicht: (2024)

YOLO-FDA: Integrating Hierarchical Attention and Detail Enhancement for Surface Defect Detection
von: Hu, Jiawei
Veröffentlicht: (2025)

AdaCLIP: Adapting CLIP with Hybrid Learnable Prompts for Zero-Shot Anomaly Detection
von: Cao, Yunkang, et al.
Veröffentlicht: (2024)

Self-Supervised Training with Autoencoders for Visual Anomaly Detection
von: Bauer, Alexander, et al.
Veröffentlicht: (2022)

VMAD: Visual-enhanced Multimodal Large Language Model for Zero-Shot Anomaly Detection
von: Deng, Huilin, et al.
Veröffentlicht: (2024)

GATE-AD: Graph Attention Network Encoding For Few-Shot Industrial Visual Anomaly Detection
von: Psiris, Aggelos, et al.
Veröffentlicht: (2026)

AtrousMamaba: An Atrous-Window Scanning Visual State Space Model for Remote Sensing Change Detection
von: Wang, Tao, et al.
Veröffentlicht: (2025)

GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection
von: Yao, Hang, et al.
Veröffentlicht: (2024)

Attention Fusion Reverse Distillation for Multi-Lighting Image Anomaly Detection
von: Zhang, Yiheng, et al.
Veröffentlicht: (2024)

Topo-R1: Detecting Topological Anomalies via Vision-Language Models
von: Xu, Meilong, et al.
Veröffentlicht: (2026)

TAU-R1: Visual Language Model for Traffic Anomaly Understanding
von: Lin, Yuqiang, et al.
Veröffentlicht: (2026)

DINO-AD: Unsupervised Anomaly Detection with Frozen DINO-V3 Features
von: Huo, Jiayu, et al.
Veröffentlicht: (2026)

Improving Anomaly Detection with Foundation-Model Synthesis and Wavelet-Domain Attention
von: Wu, Wensheng, et al.
Veröffentlicht: (2026)

IAD-GPT: Advancing Visual Knowledge in Multimodal Large Language Model for Industrial Anomaly Detection
von: Li, Zewen, et al.
Veröffentlicht: (2025)

Frozen Transformers in Language Models Are Effective Visual Encoder Layers
von: Pang, Ziqi, et al.
Veröffentlicht: (2023)

Seeing Is Believing? A Benchmark for Multimodal Large Language Models on Visual Illusions and Anomalies
von: Hou, Wenjin, et al.
Veröffentlicht: (2026)

Hierarchical Gaussian Mixture Normalizing Flow Modeling for Unified Anomaly Detection
von: Yao, Xincheng, et al.
Veröffentlicht: (2024)

FrozenSeg: Harmonizing Frozen Foundation Models for Open-Vocabulary Segmentation
von: Chen, Xi, et al.
Veröffentlicht: (2024)