:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Sun, Jianqiao, Su, Yudi, Zhang, Hao, Cheng, Ziheng, Zeng, Zequn, Wang, Zhengjue, Chen, Bo, Yuan, Xin
Format:	Preprint
Publié:	2024
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2401.04903
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

HICEScore: A Hierarchical Metric for Image Captioning Evaluation
par: Zeng, Zequn, et autres
Publié: (2024)

MeaCap: Memory-Augmented Zero-shot Image Captioning
par: Zeng, Zequn, et autres
Publié: (2024)

Explaining Domain Shifts in Language: Concept erasing for Interpretable Image Classification
par: Zeng, Zequn, et autres
Publié: (2025)

Motion-aware Dynamic Graph Neural Network for Video Compressive Sensing
par: Lu, Ruiying, et autres
Publié: (2022)

Discovering Fine-Grained Visual-Concept Relations by Disentangled Optimal Transport Concept Bottleneck Models
par: Xie, Yan, et autres
Publié: (2025)

Deep Optics for Video Snapshot Compressive Imaging
par: Wang, Ping, et autres
Publié: (2024)

Hierarchical Separable Video Transformer for Snapshot Compressive Imaging
par: Wang, Ping, et autres
Publié: (2024)

Block Modulating Video Compression: An Ultra Low Complexity Image Compression Encoder for Resource Limited Platforms
par: Zheng, Siming, et autres
Publié: (2022)

A Simple Low-bit Quantization Framework for Video Snapshot Compressive Imaging
par: Cao, Miao, et autres
Publié: (2024)

VidCompress: Memory-Enhanced Temporal Compression for Video Understanding in Large Language Models
par: Lan, Xiaohan, et autres
Publié: (2024)

AuroraCap: Efficient, Performant Video Detailed Captioning and a New Benchmark
par: Chai, Wenhao, et autres
Publié: (2024)

Video ReCap: Recursive Captioning of Hour-Long Videos
par: Islam, Md Mohaiminul, et autres
Publié: (2024)

MambaSCI: Efficient Mamba-UNet for Quad-Bayer Patterned Video Snapshot Compressive Imaging
par: Pan, Zhenghao, et autres
Publié: (2024)

Untrained Neural Nets for Snapshot Compressive Imaging: Theory and Algorithms
par: Zhao, Mengyu, et autres
Publié: (2024)

Cooperative Hardware-Prompt Learning for Snapshot Compressive Imaging
par: Wang, Jiamian, et autres
Publié: (2023)

GLaVE-Cap: Global-Local Aligned Video Captioning with Vision Expert Integration
par: Xu, Wan, et autres
Publié: (2025)

OwlCap: Harmonizing Motion-Detail for Video Captioning via HMD-270K and Caption Set Equivalence Reward
par: Zhong, Chunlin, et autres
Publié: (2025)

IF-VidCap: Can Video Caption Models Follow Instructions?
par: Li, Shihao, et autres
Publié: (2025)

Accurate and Fast Compressed Video Captioning
par: Shen, Yaojie, et autres
Publié: (2023)

RobustSCI: Beyond Reconstruction to Restoration for Snapshot Compressive Imaging under Real-World Degradations
par: Wang, Hao, et autres
Publié: (2026)

Learning Radiance Fields from a Single Snapshot Compressive Image
par: Li, Yunhao, et autres
Publié: (2024)

VoCap: Video Object Captioning and Segmentation from Any Prompt
par: Uijlings, Jasper, et autres
Publié: (2025)

VideoCap-R1: Enhancing MLLMs for Video Captioning via Structured Thinking
par: Meng, Desen, et autres
Publié: (2025)

SuperCap: Multi-resolution Superpixel-based Image Captioning
par: Senior, Henry, et autres
Publié: (2025)

3One2: One-step Regression Plus One-step Diffusion for One-hot Modulation in Dual-path Video Snapshot Compressive Imaging
par: Wang, Ge, et autres
Publié: (2025)

ControlCap: Controllable Region-level Captioning
par: Zhao, Yuzhong, et autres
Publié: (2024)

CapArena: Benchmarking and Analyzing Detailed Image Captioning in the LLM Era
par: Cheng, Kanzhi, et autres
Publié: (2025)

Detail Matters: Mamba-Inspired Joint Unfolding Network for Snapshot Spectral Compressive Imaging
par: Qin, Mengjie, et autres
Publié: (2025)

FingerCap: Fine-grained Finger-level Hand Motion Captioning
par: Shen, Xin, et autres
Publié: (2025)

TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes
par: Jin, Bu, et autres
Publié: (2024)

CodecCap: High-Fidelity Codec-Inspired Residual Modeling for Dense Video Captioning
par: Lin, Zihan, et autres
Publié: (2026)

Latent Diffusion Prior Enhanced Deep Unfolding for Snapshot Spectral Compressive Imaging
par: Wu, Zongliang, et autres
Publié: (2023)

Edit As You Wish: Video Caption Editing with Multi-grained User Control
par: Yao, Linli, et autres
Publié: (2023)

SCINeRF: Neural Radiance Fields from a Snapshot Compressive Image
par: Li, Yunhao, et autres
Publié: (2024)

Self-Supervised One-Step Diffusion Refinement for Snapshot Compressive Imaging
par: Huang, Shaoguang, et autres
Publié: (2024)

Event-Enhanced Snapshot Compressive Videography at 10K FPS
par: Zhang, Bo, et autres
Publié: (2024)

Phy-CoSF: Physics-Guided Continuous Spectral Fields Reconstruction and Super-Resolution for Snapshot Compressive Imaging
par: Chen, Wudi, et autres
Publié: (2026)

SCIGS: 3D Gaussians Splatting from a Snapshot Compressive Image
par: Wang, Zixu, et autres
Publié: (2024)

StyleShot: A Snapshot on Any Style
par: Gao, Junyao, et autres
Publié: (2024)

InstanceCap: Improving Text-to-Video Generation via Instance-aware Structured Caption
par: Fan, Tiehan, et autres
Publié: (2024)