:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Akhlaq, Filza, Arshad, Alina, Hayati, Muhammad Yehya, Shamsi, Jawwad A., Khan, Muhammad Burhan
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2411.15773
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

TRACES: Temporal Recall with Contextual Embeddings for Real-Time Video Anomaly Detection
di: Siddiqui, Yousuf Ahmed, et al.
Pubblicazione: (2025)

DeepDetect: Learning All-in-One Dense Keypoints
di: Tareen, Shaharyar Ahmed Khan, et al.
Pubblicazione: (2025)

EMF: Event Meta Formers for Event-based Real-time Traffic Object Detection
di: Khan, Muhammad Ahmed Ullah, et al.
Pubblicazione: (2025)

Optimally Deep Networks -- Adapting Model Depth to Datasets for Superior Efficiency
di: Tareen, Shaharyar Ahmed Khan, et al.
Pubblicazione: (2025)

CLIP-Decoder : ZeroShot Multilabel Classification using Multimodal CLIP Aligned Representation
di: Ali, Muhammad, et al.
Pubblicazione: (2024)

Robust and Label-Efficient Deep Waste Detection
di: Abid, Hassan, et al.
Pubblicazione: (2025)

Temperature-Driven Robust Disease Detection in Brain and Gastrointestinal Disorders via Context-Aware Adaptive Knowledge Distillation
di: Khan, Saif Ur Rehman, et al.
Pubblicazione: (2025)

VideoGPT+: Integrating Image and Video Encoders for Enhanced Video Understanding
di: Maaz, Muhammad, et al.
Pubblicazione: (2024)

Composed Video Retrieval via Enriched Context and Discriminative Embeddings
di: Thawakar, Omkar, et al.
Pubblicazione: (2024)

Early Detection of Late Blight Tomato Disease using Histogram Oriented Gradient based Support Vector Machine
di: Alhwaiti, Yousef, et al.
Pubblicazione: (2023)

A Tumor Aware DenseNet Swin Hybrid Learning with Boosted and Hierarchical Feature Spaces for Large-Scale Brain MRI Classification
di: Shah, Muhammad Ali, et al.
Pubblicazione: (2026)

Hybrid CNN-ViT Framework for Motion-Blurred Scene Text Restoration
di: Rashid, Umar, et al.
Pubblicazione: (2025)

Clustering Aided Weakly Supervised Training to Detect Anomalous Events in Surveillance Videos
di: Zaheer, Muhammad Zaigham, et al.
Pubblicazione: (2022)

Enhanced Multimodal Content Moderation of Children's Videos using Audiovisual Fusion
di: Ahmed, Syed Hammad, et al.
Pubblicazione: (2024)

Noise Crystallization and Liquid Noise: Zero-shot Video Generation using Image Diffusion Models
di: Khan, Muhammad Haaris, et al.
Pubblicazione: (2024)

Not All Modalities Are Equal: Instruction-Aware Gating for Multimodal Videos
di: Ding, Bonan, et al.
Pubblicazione: (2026)

Underwater Object Detection Enhancement via Channel Stabilization
di: Ali, Muhammad, et al.
Pubblicazione: (2024)

How Good is my Video LMM? Complex Video Reasoning and Robustness Evaluation Suite for Video-LMMs
di: Khattak, Muhammad Uzair, et al.
Pubblicazione: (2024)

Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models
di: Maaz, Muhammad, et al.
Pubblicazione: (2023)

EventVAD: Training-Free Event-Aware Video Anomaly Detection
di: Shao, Yihua, et al.
Pubblicazione: (2025)

VFace: A Training-Free Approach for Diffusion-Based Video Face Swapping
di: Baliah, Sanoojan, et al.
Pubblicazione: (2026)

SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking
di: Khan, Muhammad Saif Ullah, et al.
Pubblicazione: (2026)

Video-R2: Reinforcing Consistent and Grounded Reasoning in Multimodal Language Models
di: Maaz, Muhammad, et al.
Pubblicazione: (2025)

Hybrid State-Space and GRU-based Graph Tokenization Mamba for Hyperspectral Image Classification
di: Ahmad, Muhammad, et al.
Pubblicazione: (2025)

Computer Aided Detection and Classification of mammograms using Convolutional Neural Network
di: Ishaq, Kashif, et al.
Pubblicazione: (2024)

Improving Single Domain-Generalized Object Detection: A Focus on Diversification and Alignment
di: Danish, Muhammad Sohail, et al.
Pubblicazione: (2024)

Uncertainty-Aware and Decoder-Aligned Learning for Video Summarization
di: Tariq, Omer, et al.
Pubblicazione: (2026)

Mobile-VideoGPT: Fast and Accurate Model for Mobile Video Understanding
di: Shaker, Abdelrahman, et al.
Pubblicazione: (2025)

Contrastive-SDXL: Annotation-Preserving Night-Time Augmentation for Pedestrian Detection
di: George, Franky, et al.
Pubblicazione: (2026)

Human Pose Descriptions and Subject-Focused Attention for Improved Zero-Shot Transfer in Human-Centric Classification Tasks
di: Khan, Muhammad Saif Ullah, et al.
Pubblicazione: (2024)

CICA: Content-Injected Contrastive Alignment for Zero-Shot Document Image Classification
di: Sinha, Sankalp, et al.
Pubblicazione: (2024)

CountZES: Counting via Zero-Shot Exemplar Selection
di: Siddiqui, Muhammad Ibraheem, et al.
Pubblicazione: (2025)

Through the Lens of Doubt: Robust and Efficient Uncertainty Estimation for Visual Place Recognition
di: Miller, Emily, et al.
Pubblicazione: (2025)

Video-CoM: Interactive Video Reasoning via Chain of Manipulations
di: Rasheed, Hanoona, et al.
Pubblicazione: (2025)

Dynamic Memory Transformer for Hyperspectral Image Classification
di: Ahmad, Muhammad
Pubblicazione: (2025)

Depth-Aware Image and Video Orientation Estimation
di: Alam, Muhammad Z., et al.
Pubblicazione: (2026)

Subjective evaluation of UHD video coded using VVC with LCEVC and ML-VVC
di: Ramzan, Naeem, et al.
Pubblicazione: (2026)

CATVis: Context-Aware Thought Visualization
di: Mehmood, Tariq, et al.
Pubblicazione: (2025)

TLAC: Two-stage LMM Augmented CLIP for Zero-Shot Classification
di: Munir, Ans, et al.
Pubblicazione: (2025)

Sharpend Cosine Similarity based Neural Network for Hyperspectral Image Classification
di: Ahmad, Muhammad
Pubblicazione: (2023)