Salvato in:
| Autori principali: | Akhlaq, Filza, Arshad, Alina, Hayati, Muhammad Yehya, Shamsi, Jawwad A., Khan, Muhammad Burhan |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2411.15773 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
TRACES: Temporal Recall with Contextual Embeddings for Real-Time Video Anomaly Detection
di: Siddiqui, Yousuf Ahmed, et al.
Pubblicazione: (2025)
di: Siddiqui, Yousuf Ahmed, et al.
Pubblicazione: (2025)
DeepDetect: Learning All-in-One Dense Keypoints
di: Tareen, Shaharyar Ahmed Khan, et al.
Pubblicazione: (2025)
di: Tareen, Shaharyar Ahmed Khan, et al.
Pubblicazione: (2025)
EMF: Event Meta Formers for Event-based Real-time Traffic Object Detection
di: Khan, Muhammad Ahmed Ullah, et al.
Pubblicazione: (2025)
di: Khan, Muhammad Ahmed Ullah, et al.
Pubblicazione: (2025)
Optimally Deep Networks -- Adapting Model Depth to Datasets for Superior Efficiency
di: Tareen, Shaharyar Ahmed Khan, et al.
Pubblicazione: (2025)
di: Tareen, Shaharyar Ahmed Khan, et al.
Pubblicazione: (2025)
CLIP-Decoder : ZeroShot Multilabel Classification using Multimodal CLIP Aligned Representation
di: Ali, Muhammad, et al.
Pubblicazione: (2024)
di: Ali, Muhammad, et al.
Pubblicazione: (2024)
Robust and Label-Efficient Deep Waste Detection
di: Abid, Hassan, et al.
Pubblicazione: (2025)
di: Abid, Hassan, et al.
Pubblicazione: (2025)
Temperature-Driven Robust Disease Detection in Brain and Gastrointestinal Disorders via Context-Aware Adaptive Knowledge Distillation
di: Khan, Saif Ur Rehman, et al.
Pubblicazione: (2025)
di: Khan, Saif Ur Rehman, et al.
Pubblicazione: (2025)
VideoGPT+: Integrating Image and Video Encoders for Enhanced Video Understanding
di: Maaz, Muhammad, et al.
Pubblicazione: (2024)
di: Maaz, Muhammad, et al.
Pubblicazione: (2024)
Composed Video Retrieval via Enriched Context and Discriminative Embeddings
di: Thawakar, Omkar, et al.
Pubblicazione: (2024)
di: Thawakar, Omkar, et al.
Pubblicazione: (2024)
Early Detection of Late Blight Tomato Disease using Histogram Oriented Gradient based Support Vector Machine
di: Alhwaiti, Yousef, et al.
Pubblicazione: (2023)
di: Alhwaiti, Yousef, et al.
Pubblicazione: (2023)
A Tumor Aware DenseNet Swin Hybrid Learning with Boosted and Hierarchical Feature Spaces for Large-Scale Brain MRI Classification
di: Shah, Muhammad Ali, et al.
Pubblicazione: (2026)
di: Shah, Muhammad Ali, et al.
Pubblicazione: (2026)
Hybrid CNN-ViT Framework for Motion-Blurred Scene Text Restoration
di: Rashid, Umar, et al.
Pubblicazione: (2025)
di: Rashid, Umar, et al.
Pubblicazione: (2025)
Clustering Aided Weakly Supervised Training to Detect Anomalous Events in Surveillance Videos
di: Zaheer, Muhammad Zaigham, et al.
Pubblicazione: (2022)
di: Zaheer, Muhammad Zaigham, et al.
Pubblicazione: (2022)
Enhanced Multimodal Content Moderation of Children's Videos using Audiovisual Fusion
di: Ahmed, Syed Hammad, et al.
Pubblicazione: (2024)
di: Ahmed, Syed Hammad, et al.
Pubblicazione: (2024)
Noise Crystallization and Liquid Noise: Zero-shot Video Generation using Image Diffusion Models
di: Khan, Muhammad Haaris, et al.
Pubblicazione: (2024)
di: Khan, Muhammad Haaris, et al.
Pubblicazione: (2024)
Not All Modalities Are Equal: Instruction-Aware Gating for Multimodal Videos
di: Ding, Bonan, et al.
Pubblicazione: (2026)
di: Ding, Bonan, et al.
Pubblicazione: (2026)
Underwater Object Detection Enhancement via Channel Stabilization
di: Ali, Muhammad, et al.
Pubblicazione: (2024)
di: Ali, Muhammad, et al.
Pubblicazione: (2024)
How Good is my Video LMM? Complex Video Reasoning and Robustness Evaluation Suite for Video-LMMs
di: Khattak, Muhammad Uzair, et al.
Pubblicazione: (2024)
di: Khattak, Muhammad Uzair, et al.
Pubblicazione: (2024)
Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models
di: Maaz, Muhammad, et al.
Pubblicazione: (2023)
di: Maaz, Muhammad, et al.
Pubblicazione: (2023)
EventVAD: Training-Free Event-Aware Video Anomaly Detection
di: Shao, Yihua, et al.
Pubblicazione: (2025)
di: Shao, Yihua, et al.
Pubblicazione: (2025)
VFace: A Training-Free Approach for Diffusion-Based Video Face Swapping
di: Baliah, Sanoojan, et al.
Pubblicazione: (2026)
di: Baliah, Sanoojan, et al.
Pubblicazione: (2026)
SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking
di: Khan, Muhammad Saif Ullah, et al.
Pubblicazione: (2026)
di: Khan, Muhammad Saif Ullah, et al.
Pubblicazione: (2026)
Video-R2: Reinforcing Consistent and Grounded Reasoning in Multimodal Language Models
di: Maaz, Muhammad, et al.
Pubblicazione: (2025)
di: Maaz, Muhammad, et al.
Pubblicazione: (2025)
Hybrid State-Space and GRU-based Graph Tokenization Mamba for Hyperspectral Image Classification
di: Ahmad, Muhammad, et al.
Pubblicazione: (2025)
di: Ahmad, Muhammad, et al.
Pubblicazione: (2025)
Computer Aided Detection and Classification of mammograms using Convolutional Neural Network
di: Ishaq, Kashif, et al.
Pubblicazione: (2024)
di: Ishaq, Kashif, et al.
Pubblicazione: (2024)
Improving Single Domain-Generalized Object Detection: A Focus on Diversification and Alignment
di: Danish, Muhammad Sohail, et al.
Pubblicazione: (2024)
di: Danish, Muhammad Sohail, et al.
Pubblicazione: (2024)
Uncertainty-Aware and Decoder-Aligned Learning for Video Summarization
di: Tariq, Omer, et al.
Pubblicazione: (2026)
di: Tariq, Omer, et al.
Pubblicazione: (2026)
Mobile-VideoGPT: Fast and Accurate Model for Mobile Video Understanding
di: Shaker, Abdelrahman, et al.
Pubblicazione: (2025)
di: Shaker, Abdelrahman, et al.
Pubblicazione: (2025)
Contrastive-SDXL: Annotation-Preserving Night-Time Augmentation for Pedestrian Detection
di: George, Franky, et al.
Pubblicazione: (2026)
di: George, Franky, et al.
Pubblicazione: (2026)
Human Pose Descriptions and Subject-Focused Attention for Improved Zero-Shot Transfer in Human-Centric Classification Tasks
di: Khan, Muhammad Saif Ullah, et al.
Pubblicazione: (2024)
di: Khan, Muhammad Saif Ullah, et al.
Pubblicazione: (2024)
CICA: Content-Injected Contrastive Alignment for Zero-Shot Document Image Classification
di: Sinha, Sankalp, et al.
Pubblicazione: (2024)
di: Sinha, Sankalp, et al.
Pubblicazione: (2024)
CountZES: Counting via Zero-Shot Exemplar Selection
di: Siddiqui, Muhammad Ibraheem, et al.
Pubblicazione: (2025)
di: Siddiqui, Muhammad Ibraheem, et al.
Pubblicazione: (2025)
Through the Lens of Doubt: Robust and Efficient Uncertainty Estimation for Visual Place Recognition
di: Miller, Emily, et al.
Pubblicazione: (2025)
di: Miller, Emily, et al.
Pubblicazione: (2025)
Video-CoM: Interactive Video Reasoning via Chain of Manipulations
di: Rasheed, Hanoona, et al.
Pubblicazione: (2025)
di: Rasheed, Hanoona, et al.
Pubblicazione: (2025)
Dynamic Memory Transformer for Hyperspectral Image Classification
di: Ahmad, Muhammad
Pubblicazione: (2025)
di: Ahmad, Muhammad
Pubblicazione: (2025)
Depth-Aware Image and Video Orientation Estimation
di: Alam, Muhammad Z., et al.
Pubblicazione: (2026)
di: Alam, Muhammad Z., et al.
Pubblicazione: (2026)
Subjective evaluation of UHD video coded using VVC with LCEVC and ML-VVC
di: Ramzan, Naeem, et al.
Pubblicazione: (2026)
di: Ramzan, Naeem, et al.
Pubblicazione: (2026)
CATVis: Context-Aware Thought Visualization
di: Mehmood, Tariq, et al.
Pubblicazione: (2025)
di: Mehmood, Tariq, et al.
Pubblicazione: (2025)
TLAC: Two-stage LMM Augmented CLIP for Zero-Shot Classification
di: Munir, Ans, et al.
Pubblicazione: (2025)
di: Munir, Ans, et al.
Pubblicazione: (2025)
Sharpend Cosine Similarity based Neural Network for Hyperspectral Image Classification
di: Ahmad, Muhammad
Pubblicazione: (2023)
di: Ahmad, Muhammad
Pubblicazione: (2023)
Documenti analoghi
-
TRACES: Temporal Recall with Contextual Embeddings for Real-Time Video Anomaly Detection
di: Siddiqui, Yousuf Ahmed, et al.
Pubblicazione: (2025) -
DeepDetect: Learning All-in-One Dense Keypoints
di: Tareen, Shaharyar Ahmed Khan, et al.
Pubblicazione: (2025) -
EMF: Event Meta Formers for Event-based Real-time Traffic Object Detection
di: Khan, Muhammad Ahmed Ullah, et al.
Pubblicazione: (2025) -
Optimally Deep Networks -- Adapting Model Depth to Datasets for Superior Efficiency
di: Tareen, Shaharyar Ahmed Khan, et al.
Pubblicazione: (2025) -
CLIP-Decoder : ZeroShot Multilabel Classification using Multimodal CLIP Aligned Representation
di: Ali, Muhammad, et al.
Pubblicazione: (2024)