Gespeichert in:
| Hauptverfasser: | Hu, Zongxiang, Zhang, Zhaosheng |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2407.03634 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images
von: Huang, Chaoqin, et al.
Veröffentlicht: (2024)
von: Huang, Chaoqin, et al.
Veröffentlicht: (2024)
AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
von: Gao, Bin-Bin, et al.
Veröffentlicht: (2025)
von: Gao, Bin-Bin, et al.
Veröffentlicht: (2025)
Anomaly Detection by Adapting a pre-trained Vision Language Model
von: Cai, Yuxuan, et al.
Veröffentlicht: (2024)
von: Cai, Yuxuan, et al.
Veröffentlicht: (2024)
Language Models Meet Anomaly Detection for Better Interpretability and Generalizability
von: Li, Jun, et al.
Veröffentlicht: (2024)
von: Li, Jun, et al.
Veröffentlicht: (2024)
Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion Models
von: Jiang, Yankai, et al.
Veröffentlicht: (2025)
von: Jiang, Yankai, et al.
Veröffentlicht: (2025)
Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus
von: Kandakji, Lynn, et al.
Veröffentlicht: (2025)
von: Kandakji, Lynn, et al.
Veröffentlicht: (2025)
Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities
von: Cai, Kaiwen, et al.
Veröffentlicht: (2024)
von: Cai, Kaiwen, et al.
Veröffentlicht: (2024)
From CNN to CNN + RNN: Adapting Visualization Techniques for Time-Series Anomaly Detection
von: Poirier, Fabien
Veröffentlicht: (2024)
von: Poirier, Fabien
Veröffentlicht: (2024)
Beyond Text: Frozen Large Language Models in Visual Signal Comprehension
von: Zhu, Lei, et al.
Veröffentlicht: (2024)
von: Zhu, Lei, et al.
Veröffentlicht: (2024)
Anomize: Better Open Vocabulary Video Anomaly Detection
von: Li, Fei, et al.
Veröffentlicht: (2025)
von: Li, Fei, et al.
Veröffentlicht: (2025)
MonoSOWA: Scalable monocular 3D Object detector Without human Annotations
von: Skvrna, Jan, et al.
Veröffentlicht: (2025)
von: Skvrna, Jan, et al.
Veröffentlicht: (2025)
MIRAGE: Model-agnostic Industrial Realistic Anomaly Generation and Evaluation for Visual Anomaly Detection
von: Hu, Jinwei, et al.
Veröffentlicht: (2026)
von: Hu, Jinwei, et al.
Veröffentlicht: (2026)
Cross-level Attention with Overlapped Windows for Camouflaged Object Detection
von: Li, Jiepan, et al.
Veröffentlicht: (2023)
von: Li, Jiepan, et al.
Veröffentlicht: (2023)
Customizing Visual-Language Foundation Models for Multi-modal Anomaly Detection and Reasoning
von: Xu, Xiaohao, et al.
Veröffentlicht: (2024)
von: Xu, Xiaohao, et al.
Veröffentlicht: (2024)
Steering and Rectifying Latent Representation Manifolds in Frozen Multi-modal LLMs for Video Anomaly Detection
von: Cai, Zhaolin, et al.
Veröffentlicht: (2026)
von: Cai, Zhaolin, et al.
Veröffentlicht: (2026)
AnomalyMoE: Towards a Language-free Generalist Model for Unified Visual Anomaly Detection
von: Gu, Zhaopeng, et al.
Veröffentlicht: (2025)
von: Gu, Zhaopeng, et al.
Veröffentlicht: (2025)
MediCLIP: Adapting CLIP for Few-shot Medical Image Anomaly Detection
von: Zhang, Ximiao, et al.
Veröffentlicht: (2024)
von: Zhang, Ximiao, et al.
Veröffentlicht: (2024)
Chat-CBM: Towards Interactive Concept Bottleneck Models with Frozen Large Language Models
von: He, Hangzhou, et al.
Veröffentlicht: (2025)
von: He, Hangzhou, et al.
Veröffentlicht: (2025)
Window Token Concatenation for Efficient Visual Large Language Models
von: Li, Yifan, et al.
Veröffentlicht: (2025)
von: Li, Yifan, et al.
Veröffentlicht: (2025)
Breaking the Bias: Recalibrating the Attention of Industrial Anomaly Detection
von: Chen, Xin, et al.
Veröffentlicht: (2024)
von: Chen, Xin, et al.
Veröffentlicht: (2024)
CoSwin: Convolution Enhanced Hierarchical Shifted Window Attention For Small-Scale Vision
von: Khadka, Puskal, et al.
Veröffentlicht: (2025)
von: Khadka, Puskal, et al.
Veröffentlicht: (2025)
Referring Camouflaged Object Detection With Multi-Context Overlapped Windows Cross-Attention
von: Wen, Yu, et al.
Veröffentlicht: (2025)
von: Wen, Yu, et al.
Veröffentlicht: (2025)
Hierarchical Windowed Graph Attention Network and a Large Scale Dataset for Isolated Indian Sign Language Recognition
von: Patra, Suvajit, et al.
Veröffentlicht: (2024)
von: Patra, Suvajit, et al.
Veröffentlicht: (2024)
YOLO-FDA: Integrating Hierarchical Attention and Detail Enhancement for Surface Defect Detection
von: Hu, Jiawei
Veröffentlicht: (2025)
von: Hu, Jiawei
Veröffentlicht: (2025)
AdaCLIP: Adapting CLIP with Hybrid Learnable Prompts for Zero-Shot Anomaly Detection
von: Cao, Yunkang, et al.
Veröffentlicht: (2024)
von: Cao, Yunkang, et al.
Veröffentlicht: (2024)
Self-Supervised Training with Autoencoders for Visual Anomaly Detection
von: Bauer, Alexander, et al.
Veröffentlicht: (2022)
von: Bauer, Alexander, et al.
Veröffentlicht: (2022)
VMAD: Visual-enhanced Multimodal Large Language Model for Zero-Shot Anomaly Detection
von: Deng, Huilin, et al.
Veröffentlicht: (2024)
von: Deng, Huilin, et al.
Veröffentlicht: (2024)
GATE-AD: Graph Attention Network Encoding For Few-Shot Industrial Visual Anomaly Detection
von: Psiris, Aggelos, et al.
Veröffentlicht: (2026)
von: Psiris, Aggelos, et al.
Veröffentlicht: (2026)
AtrousMamaba: An Atrous-Window Scanning Visual State Space Model for Remote Sensing Change Detection
von: Wang, Tao, et al.
Veröffentlicht: (2025)
von: Wang, Tao, et al.
Veröffentlicht: (2025)
GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection
von: Yao, Hang, et al.
Veröffentlicht: (2024)
von: Yao, Hang, et al.
Veröffentlicht: (2024)
Attention Fusion Reverse Distillation for Multi-Lighting Image Anomaly Detection
von: Zhang, Yiheng, et al.
Veröffentlicht: (2024)
von: Zhang, Yiheng, et al.
Veröffentlicht: (2024)
Topo-R1: Detecting Topological Anomalies via Vision-Language Models
von: Xu, Meilong, et al.
Veröffentlicht: (2026)
von: Xu, Meilong, et al.
Veröffentlicht: (2026)
TAU-R1: Visual Language Model for Traffic Anomaly Understanding
von: Lin, Yuqiang, et al.
Veröffentlicht: (2026)
von: Lin, Yuqiang, et al.
Veröffentlicht: (2026)
DINO-AD: Unsupervised Anomaly Detection with Frozen DINO-V3 Features
von: Huo, Jiayu, et al.
Veröffentlicht: (2026)
von: Huo, Jiayu, et al.
Veröffentlicht: (2026)
Improving Anomaly Detection with Foundation-Model Synthesis and Wavelet-Domain Attention
von: Wu, Wensheng, et al.
Veröffentlicht: (2026)
von: Wu, Wensheng, et al.
Veröffentlicht: (2026)
IAD-GPT: Advancing Visual Knowledge in Multimodal Large Language Model for Industrial Anomaly Detection
von: Li, Zewen, et al.
Veröffentlicht: (2025)
von: Li, Zewen, et al.
Veröffentlicht: (2025)
Frozen Transformers in Language Models Are Effective Visual Encoder Layers
von: Pang, Ziqi, et al.
Veröffentlicht: (2023)
von: Pang, Ziqi, et al.
Veröffentlicht: (2023)
Seeing Is Believing? A Benchmark for Multimodal Large Language Models on Visual Illusions and Anomalies
von: Hou, Wenjin, et al.
Veröffentlicht: (2026)
von: Hou, Wenjin, et al.
Veröffentlicht: (2026)
Hierarchical Gaussian Mixture Normalizing Flow Modeling for Unified Anomaly Detection
von: Yao, Xincheng, et al.
Veröffentlicht: (2024)
von: Yao, Xincheng, et al.
Veröffentlicht: (2024)
FrozenSeg: Harmonizing Frozen Foundation Models for Open-Vocabulary Segmentation
von: Chen, Xi, et al.
Veröffentlicht: (2024)
von: Chen, Xi, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images
von: Huang, Chaoqin, et al.
Veröffentlicht: (2024) -
AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
von: Gao, Bin-Bin, et al.
Veröffentlicht: (2025) -
Anomaly Detection by Adapting a pre-trained Vision Language Model
von: Cai, Yuxuan, et al.
Veröffentlicht: (2024) -
Language Models Meet Anomaly Detection for Better Interpretability and Generalizability
von: Li, Jun, et al.
Veröffentlicht: (2024) -
Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion Models
von: Jiang, Yankai, et al.
Veröffentlicht: (2025)