Gespeichert in:
| Hauptverfasser: | Chen, Xiangyong, Lin, Xiaochuan, Liu, Haoran, Li, Xuan, Su, Yichen, Guo, Xiangwei |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2604.09704 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
DeCoT: Decomposing Complex Instructions for Enhanced Text-to-Image Generation with Large Language Models
von: Lin, Xiaochuan, et al.
Veröffentlicht: (2025)
von: Lin, Xiaochuan, et al.
Veröffentlicht: (2025)
Improving Visual Storytelling with Multimodal Large Language Models
von: Lin, Xiaochuan, et al.
Veröffentlicht: (2024)
von: Lin, Xiaochuan, et al.
Veröffentlicht: (2024)
VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank
von: Wu, Tianhe, et al.
Veröffentlicht: (2025)
von: Wu, Tianhe, et al.
Veröffentlicht: (2025)
IQA-Spider: Unifying Multi-Granularity Image Quality Assessment with Reasoning, Grounding and Referring
von: Peng, Xinge, et al.
Veröffentlicht: (2026)
von: Peng, Xinge, et al.
Veröffentlicht: (2026)
Improving the Reasoning of Multi-Image Grounding in MLLMs via Reinforcement Learning
von: Zhang, Bob, et al.
Veröffentlicht: (2025)
von: Zhang, Bob, et al.
Veröffentlicht: (2025)
Reasoning as Representation: Rethinking Visual Reinforcement Learning in Image Quality Assessment
von: Zhao, Shijie, et al.
Veröffentlicht: (2025)
von: Zhao, Shijie, et al.
Veröffentlicht: (2025)
AI-Generated Image Quality Assessment Based on Task-Specific Prompt and Multi-Granularity Similarity
von: Xia, Jili, et al.
Veröffentlicht: (2024)
von: Xia, Jili, et al.
Veröffentlicht: (2024)
Zoom-IQA: Image Quality Assessment with Reliable Region-Aware Reasoning
von: Liang, Guoqiang, et al.
Veröffentlicht: (2026)
von: Liang, Guoqiang, et al.
Veröffentlicht: (2026)
Subject-Aware Multi-Granularity Alignment for Zero-Shot EEG-to-Image Retrieval
von: Jiang, Lin, et al.
Veröffentlicht: (2026)
von: Jiang, Lin, et al.
Veröffentlicht: (2026)
Localization-Aware Multi-Scale Representation Learning for Repetitive Action Counting
von: Wang, Sujia, et al.
Veröffentlicht: (2025)
von: Wang, Sujia, et al.
Veröffentlicht: (2025)
Cascaded Multi-Scale Attention for Enhanced Multi-Scale Feature Extraction and Interaction with Low-Resolution Images
von: Lu, Xiangyong, et al.
Veröffentlicht: (2024)
von: Lu, Xiangyong, et al.
Veröffentlicht: (2024)
ME-IQA: Memory-Enhanced Image Quality Assessment via Re-Ranking
von: Fan, Kanglong, et al.
Veröffentlicht: (2026)
von: Fan, Kanglong, et al.
Veröffentlicht: (2026)
GAPNet: A Lightweight Framework for Image and Video Salient Object Detection via Granularity-Aware Paradigm
von: Wu, Yu-Huan, et al.
Veröffentlicht: (2025)
von: Wu, Yu-Huan, et al.
Veröffentlicht: (2025)
MSRAMIE: Multimodal Structured Reasoning Agent for Multi-instruction Image Editing
von: Qiu, Zhaoyuan, et al.
Veröffentlicht: (2026)
von: Qiu, Zhaoyuan, et al.
Veröffentlicht: (2026)
Self-Evolving Vision-Language Models for Image Quality Assessment via Voting and Ranking
von: Wen, Wen, et al.
Veröffentlicht: (2025)
von: Wen, Wen, et al.
Veröffentlicht: (2025)
ExIQA: Explainable Image Quality Assessment Using Distortion Attributes
von: Ranjbar, Sepehr Kazemi, et al.
Veröffentlicht: (2024)
von: Ranjbar, Sepehr Kazemi, et al.
Veröffentlicht: (2024)
Learning Attribute-Aware Hash Codes for Fine-Grained Image Retrieval via Query Optimization
von: Wang, Peng, et al.
Veröffentlicht: (2025)
von: Wang, Peng, et al.
Veröffentlicht: (2025)
Multilevel Semantic-Aware Model for AI-Generated Video Quality Assessment
von: Li, Jiaze, et al.
Veröffentlicht: (2025)
von: Li, Jiaze, et al.
Veröffentlicht: (2025)
Q-Tacit: Image Quality Assessment via Latent Visual Reasoning
von: Jiang, Yuxuan, et al.
Veröffentlicht: (2026)
von: Jiang, Yuxuan, et al.
Veröffentlicht: (2026)
MIRG-RL: Multi-Image Reasoning and Grounding with Reinforcement Learning
von: Zheng, Lihao, et al.
Veröffentlicht: (2025)
von: Zheng, Lihao, et al.
Veröffentlicht: (2025)
Spatial-Aware Self-Supervision for Medical 3D Imaging with Multi-Granularity Observable Tasks
von: Zhang, Yiqin, et al.
Veröffentlicht: (2025)
von: Zhang, Yiqin, et al.
Veröffentlicht: (2025)
HiRQA: Hierarchical Ranking and Quality Alignment for Opinion-Unaware Image Quality Assessment
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)
MGIMM: Multi-Granularity Instruction Multimodal Model for Attribute-Guided Remote Sensing Image Detailed Description
von: Yang, Cong, et al.
Veröffentlicht: (2024)
von: Yang, Cong, et al.
Veröffentlicht: (2024)
Semantic Granularity Navigation in Image Editing
von: Lu, Liangsi, et al.
Veröffentlicht: (2026)
von: Lu, Liangsi, et al.
Veröffentlicht: (2026)
Refine-IQA: Multi-Stage Reinforcement Finetuning for Perceptual Image Quality Assessment
von: Jia, Ziheng, et al.
Veröffentlicht: (2025)
von: Jia, Ziheng, et al.
Veröffentlicht: (2025)
Multimodal Label Relevance Ranking via Reinforcement Learning
von: Guo, Taian, et al.
Veröffentlicht: (2024)
von: Guo, Taian, et al.
Veröffentlicht: (2024)
Image Quality Assessment: Exploring Quality Awareness via Memory-driven Distortion Patterns Matching
von: Lan, Xuting, et al.
Veröffentlicht: (2026)
von: Lan, Xuting, et al.
Veröffentlicht: (2026)
Chain-of-Restoration: Multi-Task Image Restoration Models are Zero-Shot Step-by-Step Universal Image Restorers
von: Cao, Jin, et al.
Veröffentlicht: (2024)
von: Cao, Jin, et al.
Veröffentlicht: (2024)
RankDVQA-mini: Knowledge Distillation-Driven Deep Video Quality Assessment
von: Feng, Chen, et al.
Veröffentlicht: (2023)
von: Feng, Chen, et al.
Veröffentlicht: (2023)
Multi-Modal Prompt Learning on Blind Image Quality Assessment
von: Pan, Wensheng, et al.
Veröffentlicht: (2024)
von: Pan, Wensheng, et al.
Veröffentlicht: (2024)
Pose-Aware Multi-Level Motion Parsing for Action Quality Assessment
von: Zhu, Shuaikang, et al.
Veröffentlicht: (2025)
von: Zhu, Shuaikang, et al.
Veröffentlicht: (2025)
Burst Image Quality Assessment: A New Benchmark and Unified Framework for Multiple Downstream Tasks
von: Liang, Xiaoye, et al.
Veröffentlicht: (2025)
von: Liang, Xiaoye, et al.
Veröffentlicht: (2025)
LOGO: A Long-Form Video Dataset for Group Action Quality Assessment
von: Zhang, Shiyi, et al.
Veröffentlicht: (2024)
von: Zhang, Shiyi, et al.
Veröffentlicht: (2024)
One Model, Two Minds: Task-Conditioned Reasoning for Unified Image Quality and Aesthetic Assessment
von: Yin, Wen, et al.
Veröffentlicht: (2026)
von: Yin, Wen, et al.
Veröffentlicht: (2026)
Video-KTR: Reinforcing Video Reasoning via Key Token Attribution
von: Wang, Ziyue, et al.
Veröffentlicht: (2026)
von: Wang, Ziyue, et al.
Veröffentlicht: (2026)
Rank-based No-reference Quality Assessment for Face Swapping
von: Zhou, Xinghui, et al.
Veröffentlicht: (2024)
von: Zhou, Xinghui, et al.
Veröffentlicht: (2024)
Learn to Rank: Visual Attribution by Learning Importance Ranking
von: Schinagl, David, et al.
Veröffentlicht: (2026)
von: Schinagl, David, et al.
Veröffentlicht: (2026)
Ultra-High-Definition Image Quality Assessment via Graph Representation Learning
von: Yu, Shaode, et al.
Veröffentlicht: (2026)
von: Yu, Shaode, et al.
Veröffentlicht: (2026)
Building Reasonable Inference for Vision-Language Models in Blind Image Quality Assessment
von: Li, Yuan, et al.
Veröffentlicht: (2025)
von: Li, Yuan, et al.
Veröffentlicht: (2025)
RL-ScanIQA: Reinforcement-Learned Scanpaths for Blind 360°Image Quality Assessment
von: Wang, Yujia, et al.
Veröffentlicht: (2026)
von: Wang, Yujia, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
DeCoT: Decomposing Complex Instructions for Enhanced Text-to-Image Generation with Large Language Models
von: Lin, Xiaochuan, et al.
Veröffentlicht: (2025) -
Improving Visual Storytelling with Multimodal Large Language Models
von: Lin, Xiaochuan, et al.
Veröffentlicht: (2024) -
VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank
von: Wu, Tianhe, et al.
Veröffentlicht: (2025) -
IQA-Spider: Unifying Multi-Granularity Image Quality Assessment with Reasoning, Grounding and Referring
von: Peng, Xinge, et al.
Veröffentlicht: (2026) -
Improving the Reasoning of Multi-Image Grounding in MLLMs via Reinforcement Learning
von: Zhang, Bob, et al.
Veröffentlicht: (2025)