Enregistré dans:
| Auteurs principaux: | Sun, Jianqiao, Su, Yudi, Zhang, Hao, Cheng, Ziheng, Zeng, Zequn, Wang, Zhengjue, Chen, Bo, Yuan, Xin |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2401.04903 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
HICEScore: A Hierarchical Metric for Image Captioning Evaluation
par: Zeng, Zequn, et autres
Publié: (2024)
par: Zeng, Zequn, et autres
Publié: (2024)
MeaCap: Memory-Augmented Zero-shot Image Captioning
par: Zeng, Zequn, et autres
Publié: (2024)
par: Zeng, Zequn, et autres
Publié: (2024)
Explaining Domain Shifts in Language: Concept erasing for Interpretable Image Classification
par: Zeng, Zequn, et autres
Publié: (2025)
par: Zeng, Zequn, et autres
Publié: (2025)
Motion-aware Dynamic Graph Neural Network for Video Compressive Sensing
par: Lu, Ruiying, et autres
Publié: (2022)
par: Lu, Ruiying, et autres
Publié: (2022)
Discovering Fine-Grained Visual-Concept Relations by Disentangled Optimal Transport Concept Bottleneck Models
par: Xie, Yan, et autres
Publié: (2025)
par: Xie, Yan, et autres
Publié: (2025)
Deep Optics for Video Snapshot Compressive Imaging
par: Wang, Ping, et autres
Publié: (2024)
par: Wang, Ping, et autres
Publié: (2024)
Hierarchical Separable Video Transformer for Snapshot Compressive Imaging
par: Wang, Ping, et autres
Publié: (2024)
par: Wang, Ping, et autres
Publié: (2024)
Block Modulating Video Compression: An Ultra Low Complexity Image Compression Encoder for Resource Limited Platforms
par: Zheng, Siming, et autres
Publié: (2022)
par: Zheng, Siming, et autres
Publié: (2022)
A Simple Low-bit Quantization Framework for Video Snapshot Compressive Imaging
par: Cao, Miao, et autres
Publié: (2024)
par: Cao, Miao, et autres
Publié: (2024)
VidCompress: Memory-Enhanced Temporal Compression for Video Understanding in Large Language Models
par: Lan, Xiaohan, et autres
Publié: (2024)
par: Lan, Xiaohan, et autres
Publié: (2024)
AuroraCap: Efficient, Performant Video Detailed Captioning and a New Benchmark
par: Chai, Wenhao, et autres
Publié: (2024)
par: Chai, Wenhao, et autres
Publié: (2024)
Video ReCap: Recursive Captioning of Hour-Long Videos
par: Islam, Md Mohaiminul, et autres
Publié: (2024)
par: Islam, Md Mohaiminul, et autres
Publié: (2024)
MambaSCI: Efficient Mamba-UNet for Quad-Bayer Patterned Video Snapshot Compressive Imaging
par: Pan, Zhenghao, et autres
Publié: (2024)
par: Pan, Zhenghao, et autres
Publié: (2024)
Untrained Neural Nets for Snapshot Compressive Imaging: Theory and Algorithms
par: Zhao, Mengyu, et autres
Publié: (2024)
par: Zhao, Mengyu, et autres
Publié: (2024)
Cooperative Hardware-Prompt Learning for Snapshot Compressive Imaging
par: Wang, Jiamian, et autres
Publié: (2023)
par: Wang, Jiamian, et autres
Publié: (2023)
GLaVE-Cap: Global-Local Aligned Video Captioning with Vision Expert Integration
par: Xu, Wan, et autres
Publié: (2025)
par: Xu, Wan, et autres
Publié: (2025)
OwlCap: Harmonizing Motion-Detail for Video Captioning via HMD-270K and Caption Set Equivalence Reward
par: Zhong, Chunlin, et autres
Publié: (2025)
par: Zhong, Chunlin, et autres
Publié: (2025)
IF-VidCap: Can Video Caption Models Follow Instructions?
par: Li, Shihao, et autres
Publié: (2025)
par: Li, Shihao, et autres
Publié: (2025)
Accurate and Fast Compressed Video Captioning
par: Shen, Yaojie, et autres
Publié: (2023)
par: Shen, Yaojie, et autres
Publié: (2023)
RobustSCI: Beyond Reconstruction to Restoration for Snapshot Compressive Imaging under Real-World Degradations
par: Wang, Hao, et autres
Publié: (2026)
par: Wang, Hao, et autres
Publié: (2026)
Learning Radiance Fields from a Single Snapshot Compressive Image
par: Li, Yunhao, et autres
Publié: (2024)
par: Li, Yunhao, et autres
Publié: (2024)
VoCap: Video Object Captioning and Segmentation from Any Prompt
par: Uijlings, Jasper, et autres
Publié: (2025)
par: Uijlings, Jasper, et autres
Publié: (2025)
VideoCap-R1: Enhancing MLLMs for Video Captioning via Structured Thinking
par: Meng, Desen, et autres
Publié: (2025)
par: Meng, Desen, et autres
Publié: (2025)
SuperCap: Multi-resolution Superpixel-based Image Captioning
par: Senior, Henry, et autres
Publié: (2025)
par: Senior, Henry, et autres
Publié: (2025)
3One2: One-step Regression Plus One-step Diffusion for One-hot Modulation in Dual-path Video Snapshot Compressive Imaging
par: Wang, Ge, et autres
Publié: (2025)
par: Wang, Ge, et autres
Publié: (2025)
ControlCap: Controllable Region-level Captioning
par: Zhao, Yuzhong, et autres
Publié: (2024)
par: Zhao, Yuzhong, et autres
Publié: (2024)
CapArena: Benchmarking and Analyzing Detailed Image Captioning in the LLM Era
par: Cheng, Kanzhi, et autres
Publié: (2025)
par: Cheng, Kanzhi, et autres
Publié: (2025)
Detail Matters: Mamba-Inspired Joint Unfolding Network for Snapshot Spectral Compressive Imaging
par: Qin, Mengjie, et autres
Publié: (2025)
par: Qin, Mengjie, et autres
Publié: (2025)
FingerCap: Fine-grained Finger-level Hand Motion Captioning
par: Shen, Xin, et autres
Publié: (2025)
par: Shen, Xin, et autres
Publié: (2025)
TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes
par: Jin, Bu, et autres
Publié: (2024)
par: Jin, Bu, et autres
Publié: (2024)
CodecCap: High-Fidelity Codec-Inspired Residual Modeling for Dense Video Captioning
par: Lin, Zihan, et autres
Publié: (2026)
par: Lin, Zihan, et autres
Publié: (2026)
Latent Diffusion Prior Enhanced Deep Unfolding for Snapshot Spectral Compressive Imaging
par: Wu, Zongliang, et autres
Publié: (2023)
par: Wu, Zongliang, et autres
Publié: (2023)
Edit As You Wish: Video Caption Editing with Multi-grained User Control
par: Yao, Linli, et autres
Publié: (2023)
par: Yao, Linli, et autres
Publié: (2023)
SCINeRF: Neural Radiance Fields from a Snapshot Compressive Image
par: Li, Yunhao, et autres
Publié: (2024)
par: Li, Yunhao, et autres
Publié: (2024)
Self-Supervised One-Step Diffusion Refinement for Snapshot Compressive Imaging
par: Huang, Shaoguang, et autres
Publié: (2024)
par: Huang, Shaoguang, et autres
Publié: (2024)
Event-Enhanced Snapshot Compressive Videography at 10K FPS
par: Zhang, Bo, et autres
Publié: (2024)
par: Zhang, Bo, et autres
Publié: (2024)
Phy-CoSF: Physics-Guided Continuous Spectral Fields Reconstruction and Super-Resolution for Snapshot Compressive Imaging
par: Chen, Wudi, et autres
Publié: (2026)
par: Chen, Wudi, et autres
Publié: (2026)
SCIGS: 3D Gaussians Splatting from a Snapshot Compressive Image
par: Wang, Zixu, et autres
Publié: (2024)
par: Wang, Zixu, et autres
Publié: (2024)
StyleShot: A Snapshot on Any Style
par: Gao, Junyao, et autres
Publié: (2024)
par: Gao, Junyao, et autres
Publié: (2024)
InstanceCap: Improving Text-to-Video Generation via Instance-aware Structured Caption
par: Fan, Tiehan, et autres
Publié: (2024)
par: Fan, Tiehan, et autres
Publié: (2024)
Documents similaires
-
HICEScore: A Hierarchical Metric for Image Captioning Evaluation
par: Zeng, Zequn, et autres
Publié: (2024) -
MeaCap: Memory-Augmented Zero-shot Image Captioning
par: Zeng, Zequn, et autres
Publié: (2024) -
Explaining Domain Shifts in Language: Concept erasing for Interpretable Image Classification
par: Zeng, Zequn, et autres
Publié: (2025) -
Motion-aware Dynamic Graph Neural Network for Video Compressive Sensing
par: Lu, Ruiying, et autres
Publié: (2022) -
Discovering Fine-Grained Visual-Concept Relations by Disentangled Optimal Transport Concept Bottleneck Models
par: Xie, Yan, et autres
Publié: (2025)