Gespeichert in:
| Hauptverfasser: | Gedik, Hakan Emre, Martin, Andrew, Munir, Mustafa, Baser, Oguzhan, Marculescu, Radu, Chinchali, Sandeep P., Bovik, Alan C. |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2509.25570 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
EMCAD: Efficient Multi-scale Convolutional Attention Decoding for Medical Image Segmentation
von: Rahman, Md Mostafijur, et al.
Veröffentlicht: (2024)
von: Rahman, Md Mostafijur, et al.
Veröffentlicht: (2024)
Subjective and Objective Analysis of Indian Social Media Video Quality
von: Mishra, Sandeep, et al.
Veröffentlicht: (2024)
von: Mishra, Sandeep, et al.
Veröffentlicht: (2024)
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs
von: Munir, Mustafa, et al.
Veröffentlicht: (2024)
von: Munir, Mustafa, et al.
Veröffentlicht: (2024)
Constructing Per-Shot Bitrate Ladders using Visual Information Fidelity
von: Durbha, Krishna Srikar, et al.
Veröffentlicht: (2024)
von: Durbha, Krishna Srikar, et al.
Veröffentlicht: (2024)
Subjective Quality Assessment of Compressed Tone-Mapped High Dynamic Range Videos
von: Venkataramanan, Abhinau K., et al.
Veröffentlicht: (2024)
von: Venkataramanan, Abhinau K., et al.
Veröffentlicht: (2024)
AdaptViG: Adaptive Vision GNN with Exponential Decay Gating
von: Munir, Mustafa, et al.
Veröffentlicht: (2025)
von: Munir, Mustafa, et al.
Veröffentlicht: (2025)
GADA: Graph Attention-based Detection Aggregation for Ultrasound Video Classification
von: Chen, Li, et al.
Veröffentlicht: (2025)
von: Chen, Li, et al.
Veröffentlicht: (2025)
Bitrate Ladder Construction using Visual Information Fidelity
von: Durbha, Krishna Srikar, et al.
Veröffentlicht: (2023)
von: Durbha, Krishna Srikar, et al.
Veröffentlicht: (2023)
Multi-Scale High-Resolution Logarithmic Grapher Module for Efficient Vision GNNs
von: Munir, Mustafa, et al.
Veröffentlicht: (2025)
von: Munir, Mustafa, et al.
Veröffentlicht: (2025)
ConvShareViT: Enhancing Vision Transformers with Convolutional Attention Mechanisms for Free-Space Optical Accelerators
von: Ibadulla, Riad, et al.
Veröffentlicht: (2025)
von: Ibadulla, Riad, et al.
Veröffentlicht: (2025)
ELFATT: Efficient Linear Fast Attention for Vision Transformers
von: Wu, Chong, et al.
Veröffentlicht: (2025)
von: Wu, Chong, et al.
Veröffentlicht: (2025)
Compound Attention and Neighbor Matching Network for Multi-contrast MRI Super-resolution
von: Chen, Wenxuan, et al.
Veröffentlicht: (2023)
von: Chen, Wenxuan, et al.
Veröffentlicht: (2023)
Convex Hull Prediction for Adaptive Video Streaming by Recurrent Learning
von: Paul, Somdyuti, et al.
Veröffentlicht: (2022)
von: Paul, Somdyuti, et al.
Veröffentlicht: (2022)
TRIQA: Image Quality Assessment by Contrastive Pretraining on Ordered Distortion Triplets
von: Sureddi, Rajesh, et al.
Veröffentlicht: (2025)
von: Sureddi, Rajesh, et al.
Veröffentlicht: (2025)
GameScope: A Multi-Attribute, Multi-Codec Benchmark Dataset for Gaming Video Quality Assessment
von: Sureddi, Rajesh, et al.
Veröffentlicht: (2026)
von: Sureddi, Rajesh, et al.
Veröffentlicht: (2026)
ATFusion: An Alternate Cross-Attention Transformer Network for Infrared and Visible Image Fusion
von: Yan, Han, et al.
Veröffentlicht: (2024)
von: Yan, Han, et al.
Veröffentlicht: (2024)
Saliency-aware End-to-end Learned Variable-Bitrate 360-degree Image Compression
von: Gungordu, Oguzhan, et al.
Veröffentlicht: (2024)
von: Gungordu, Oguzhan, et al.
Veröffentlicht: (2024)
MaxViT-UNet: Multi-Axis Attention for Medical Image Segmentation
von: Khan, Abdul Rehman, et al.
Veröffentlicht: (2023)
von: Khan, Abdul Rehman, et al.
Veröffentlicht: (2023)
Quality Prediction of AI Generated Images and Videos: Emerging Trends and Opportunities
von: Ghildyal, Abhijay, et al.
Veröffentlicht: (2024)
von: Ghildyal, Abhijay, et al.
Veröffentlicht: (2024)
Brain Tumor Classification using Vision Transformer with Selective Cross-Attention Mechanism and Feature Calibration
von: Khaniki, Mohammad Ali Labbaf, et al.
Veröffentlicht: (2024)
von: Khaniki, Mohammad Ali Labbaf, et al.
Veröffentlicht: (2024)
Stroke Lesion Segmentation using Multi-Stage Cross-Scale Attention
von: Shang, Liang, et al.
Veröffentlicht: (2025)
von: Shang, Liang, et al.
Veröffentlicht: (2025)
BetterNet: An Efficient CNN Architecture with Residual Learning and Attention for Precision Polyp Segmentation
von: Singh, Owen, et al.
Veröffentlicht: (2024)
von: Singh, Owen, et al.
Veröffentlicht: (2024)
Cut-FUNQUE: An Objective Quality Model for Compressed Tone-Mapped High Dynamic Range Videos
von: Venkataramanan, Abhinau K., et al.
Veröffentlicht: (2024)
von: Venkataramanan, Abhinau K., et al.
Veröffentlicht: (2024)
Joint Quality Assessment and Example-Guided Image Processing by Disentangling Picture Appearance from Content
von: Venkataramanan, Abhinau K., et al.
Veröffentlicht: (2024)
von: Venkataramanan, Abhinau K., et al.
Veröffentlicht: (2024)
Subjective and Objective Quality Assessment of Rendered Human Avatar Videos in Virtual Reality
von: Chen, Yu-Chih, et al.
Veröffentlicht: (2024)
von: Chen, Yu-Chih, et al.
Veröffentlicht: (2024)
Adaptive-avg-pooling based Attention Vision Transformer for Face Anti-spoofing
von: Yang, Jichen, et al.
Veröffentlicht: (2024)
von: Yang, Jichen, et al.
Veröffentlicht: (2024)
Invited Paper: BitMedViT: Ternary-Quantized Vision Transformer for Medical AI Assistants on the Edge
von: Walczak, Mikolaj, et al.
Veröffentlicht: (2025)
von: Walczak, Mikolaj, et al.
Veröffentlicht: (2025)
Leveraging Compression to Construct Transferable Bitrate Ladders
von: Durbha, Krishna Srikar, et al.
Veröffentlicht: (2025)
von: Durbha, Krishna Srikar, et al.
Veröffentlicht: (2025)
HAAT: Hybrid Attention Aggregation Transformer for Image Super-Resolution
von: Lai, Song-Jiang, et al.
Veröffentlicht: (2024)
von: Lai, Song-Jiang, et al.
Veröffentlicht: (2024)
MarsSQE: Stereo Quality Enhancement for Martian Images Using Bi-level Cross-view Attention
von: Xu, Mai, et al.
Veröffentlicht: (2024)
von: Xu, Mai, et al.
Veröffentlicht: (2024)
Dual-Stream Attention Network for Hyperspectral Image Unmixing
von: Wang, Yufang, et al.
Veröffentlicht: (2024)
von: Wang, Yufang, et al.
Veröffentlicht: (2024)
MedSAM-CA: A CNN-Augmented ViT with Attention-Enhanced Multi-Scale Fusion for Medical Image Segmentation
von: Tian, Peiting, et al.
Veröffentlicht: (2025)
von: Tian, Peiting, et al.
Veröffentlicht: (2025)
MIDOG 2025: Mitotic Figure Detection with Attention-Guided False Positive Correction
von: Broad, Andrew, et al.
Veröffentlicht: (2025)
von: Broad, Andrew, et al.
Veröffentlicht: (2025)
SaViD: Spectravista Aesthetic Vision Integration for Robust and Discerning 3D Object Detection in Challenging Environments
von: Dam, Tanmoy, et al.
Veröffentlicht: (2025)
von: Dam, Tanmoy, et al.
Veröffentlicht: (2025)
TKwinFormer: Top k Window Attention in Vision Transformers for Feature Matching
von: Liao, Yun, et al.
Veröffentlicht: (2023)
von: Liao, Yun, et al.
Veröffentlicht: (2023)
Attention-Guided Fair AI Modeling for Skin Cancer Diagnosis
von: Zhu, Mingcheng, et al.
Veröffentlicht: (2025)
von: Zhu, Mingcheng, et al.
Veröffentlicht: (2025)
SPOT: Sparsification with Attention Dynamics via Token Relevance in Vision Transformers
von: Schlesinger, Oded, et al.
Veröffentlicht: (2025)
von: Schlesinger, Oded, et al.
Veröffentlicht: (2025)
Dual Cross-Attention for Medical Image Segmentation
von: Ates, Gorkem Can, et al.
Veröffentlicht: (2023)
von: Ates, Gorkem Can, et al.
Veröffentlicht: (2023)
Global and Local Attention-Based Transformer for Hyperspectral Image Change Detection
von: Wang, Ziyi, et al.
Veröffentlicht: (2024)
von: Wang, Ziyi, et al.
Veröffentlicht: (2024)
Parallel Context Modeling for Sliding Window Attention in Neural Video Coding
von: Kopte, Alexander, et al.
Veröffentlicht: (2026)
von: Kopte, Alexander, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
EMCAD: Efficient Multi-scale Convolutional Attention Decoding for Medical Image Segmentation
von: Rahman, Md Mostafijur, et al.
Veröffentlicht: (2024) -
Subjective and Objective Analysis of Indian Social Media Video Quality
von: Mishra, Sandeep, et al.
Veröffentlicht: (2024) -
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs
von: Munir, Mustafa, et al.
Veröffentlicht: (2024) -
Constructing Per-Shot Bitrate Ladders using Visual Information Fidelity
von: Durbha, Krishna Srikar, et al.
Veröffentlicht: (2024) -
Subjective Quality Assessment of Compressed Tone-Mapped High Dynamic Range Videos
von: Venkataramanan, Abhinau K., et al.
Veröffentlicht: (2024)