Uloženo v:
| Hlavní autoři: | Deng, Andong, Yang, Taojiannan, Chen, Chen, Chen, Qian, Neely, Leslie, Oyama, Sakiko |
|---|---|
| Médium: | Preprint |
| Vydáno: |
2022
|
| Témata: | |
| On-line přístup: | https://arxiv.org/abs/2211.09310 |
| Tagy: |
Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
|
Podobné jednotky
SciVideoBench: Benchmarking Scientific Video Reasoning in Large Multimodal Models
Autor: Deng, Andong, a další
Vydáno: (2025)
Autor: Deng, Andong, a další
Vydáno: (2025)
Motion-Grounded Video Reasoning: Understanding and Perceiving Motion at Pixel Level
Autor: Deng, Andong, a další
Vydáno: (2024)
Autor: Deng, Andong, a další
Vydáno: (2024)
From Perception to Reasoning: Deep Thinking Empowers Multimodal Large Language Models
Autor: Zhu, Wenxin, a další
Vydáno: (2025)
Autor: Zhu, Wenxin, a další
Vydáno: (2025)
Deep Learning Based Approach to Enhanced Recognition of Emotions and Behavioral Patterns of Autistic Children
Autor: R, Nelaka K. A., a další
Vydáno: (2025)
Autor: R, Nelaka K. A., a další
Vydáno: (2025)
A.I.R.: Enabling Adaptive, Iterative, and Reasoning-based Frame Selection For Video Question Answering
Autor: Zou, Yuanhao, a další
Vydáno: (2025)
Autor: Zou, Yuanhao, a další
Vydáno: (2025)
Explain via Any Concept: Concept Bottleneck Model with Open Vocabulary Concepts
Autor: Tan, Andong, a další
Vydáno: (2024)
Autor: Tan, Andong, a další
Vydáno: (2024)
Post-hoc Part-prototype Networks
Autor: Tan, Andong, a další
Vydáno: (2024)
Autor: Tan, Andong, a další
Vydáno: (2024)
ControlNet++: Improving Conditional Controls with Efficient Consistency Feedback
Autor: Li, Ming, a další
Vydáno: (2024)
Autor: Li, Ming, a další
Vydáno: (2024)
Multi-threshold Deep Metric Learning for Facial Expression Recognition
Autor: Yang, Wenwu, a další
Vydáno: (2024)
Autor: Yang, Wenwu, a další
Vydáno: (2024)
STORM: Internalized Modeling for Spatial-Temporal Reasoning in Video-Language Models
Autor: Liang, Yiming, a další
Vydáno: (2026)
Autor: Liang, Yiming, a další
Vydáno: (2026)
Seq2Time: Sequential Knowledge Transfer for Video LLM Temporal Grounding
Autor: Deng, Andong, a další
Vydáno: (2024)
Autor: Deng, Andong, a další
Vydáno: (2024)
VEBench:Benchmarking Large Multimodal Models for Real-World Video Editing
Autor: Deng, Andong, a další
Vydáno: (2026)
Autor: Deng, Andong, a další
Vydáno: (2026)
Voronoi-Assisted Diffusion for Computing Unsigned Distance Fields from Unoriented Points
Autor: Kong, Jiayi, a další
Vydáno: (2025)
Autor: Kong, Jiayi, a další
Vydáno: (2025)
Video-Based Autism Detection with Deep Learning
Autor: Serna-Aguilera, M., a další
Vydáno: (2024)
Autor: Serna-Aguilera, M., a další
Vydáno: (2024)
Deep Learning-based Animal Behavior Analysis: Insights from Mouse Chronic Pain Models
Autor: Chen, Yu-Hsi, a další
Vydáno: (2025)
Autor: Chen, Yu-Hsi, a další
Vydáno: (2025)
Deep Tree Tensor Networks for Image Recognition
Autor: Nie, Chang, a další
Vydáno: (2025)
Autor: Nie, Chang, a další
Vydáno: (2025)
Learning Semantic-Aware Representation in Visual-Language Models for Multi-Label Recognition with Partial Labels
Autor: Ruan, Haoxian, a další
Vydáno: (2024)
Autor: Ruan, Haoxian, a další
Vydáno: (2024)
Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors
Autor: Liu, Yuanyuan, a další
Vydáno: (2024)
Autor: Liu, Yuanyuan, a další
Vydáno: (2024)
Multi-Modality Co-Learning for Efficient Skeleton-based Action Recognition
Autor: Liu, Jinfu, a další
Vydáno: (2024)
Autor: Liu, Jinfu, a další
Vydáno: (2024)
BEAR: A Video Dataset For Fine-grained Behaviors Recognition Oriented with Action and Environment Factors
Autor: Hu, Chengyang, a další
Vydáno: (2025)
Autor: Hu, Chengyang, a další
Vydáno: (2025)
Culture In a Frame: C$^3$B as a Comic-Based Benchmark for Multimodal Culturally Awareness
Autor: Song, Yuchen, a další
Vydáno: (2025)
Autor: Song, Yuchen, a další
Vydáno: (2025)
Denoising-Contrastive Alignment for Continuous Sign Language Recognition
Autor: Guo, Leming, a další
Vydáno: (2023)
Autor: Guo, Leming, a další
Vydáno: (2023)
MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition
Autor: Chen, Yufan, a další
Vydáno: (2024)
Autor: Chen, Yufan, a další
Vydáno: (2024)
Meta-Auxiliary Learning for Micro-Expression Recognition
Autor: Wang, Jingyao, a další
Vydáno: (2024)
Autor: Wang, Jingyao, a další
Vydáno: (2024)
Continual Learning for Remote Physiological Measurement: Minimize Forgetting and Simplify Inference
Autor: Liang, Qian, a další
Vydáno: (2024)
Autor: Liang, Qian, a další
Vydáno: (2024)
Are Deep Learning Models Robust to Partial Object Occlusion in Visual Recognition Tasks?
Autor: Kassaw, Kaleb, a další
Vydáno: (2024)
Autor: Kassaw, Kaleb, a další
Vydáno: (2024)
Efficient Surgical Tool Recognition via HMM-Stabilized Deep Learning
Autor: Wang, Haifeng, a další
Vydáno: (2024)
Autor: Wang, Haifeng, a další
Vydáno: (2024)
Few-Shot Continual Learning for Activity Recognition in Classroom Surveillance Images
Autor: Qian, Yilei, a další
Vydáno: (2024)
Autor: Qian, Yilei, a další
Vydáno: (2024)
SignVTCL: Multi-Modal Continuous Sign Language Recognition Enhanced by Visual-Textual Contrastive Learning
Autor: Chen, Hao, a další
Vydáno: (2024)
Autor: Chen, Hao, a další
Vydáno: (2024)
Neuron: Learning Context-Aware Evolving Representations for Zero-Shot Skeleton Action Recognition
Autor: Chen, Yang, a další
Vydáno: (2024)
Autor: Chen, Yang, a další
Vydáno: (2024)
KAN-HyperpointNet for Point Cloud Sequence-Based 3D Human Action Recognition
Autor: Chen, Zhaoyu, a další
Vydáno: (2024)
Autor: Chen, Zhaoyu, a další
Vydáno: (2024)
Beyond Global Alignment: Fine-Grained Motion-Language Retrieval via Pyramidal Shapley-Taylor Learning
Autor: Chen, Hanmo, a další
Vydáno: (2026)
Autor: Chen, Hanmo, a další
Vydáno: (2026)
OST: Refining Text Knowledge with Optimal Spatio-Temporal Descriptor for General Video Recognition
Autor: Chen, Tongjia, a další
Vydáno: (2023)
Autor: Chen, Tongjia, a další
Vydáno: (2023)
Language-Assisted Human Part Motion Learning for Skeleton-Based Temporal Action Segmentation
Autor: Chen, Bowen, a další
Vydáno: (2024)
Autor: Chen, Bowen, a další
Vydáno: (2024)
GlyphDraw2: Automatic Generation of Complex Glyph Posters with Diffusion Models and Large Language Models
Autor: Ma, Jian, a další
Vydáno: (2024)
Autor: Ma, Jian, a další
Vydáno: (2024)
Relational Contrastive Learning and Masked Image Modeling for Scene Text Recognition
Autor: Lin, Tiancheng, a další
Vydáno: (2024)
Autor: Lin, Tiancheng, a další
Vydáno: (2024)
Modality-missing RGBT Tracking: Invertible Prompt Learning and High-quality Benchmarks
Autor: Lu, Andong, a další
Vydáno: (2023)
Autor: Lu, Andong, a další
Vydáno: (2023)
Data-free Multi-label Image Recognition via LLM-powered Prompt Tuning
Autor: Yang, Shuo, a další
Vydáno: (2024)
Autor: Yang, Shuo, a další
Vydáno: (2024)
Interaction-via-Actions: Cattle Interaction Detection with Joint Learning of Action-Interaction Latent Space
Autor: Nakagawa, Ren, a další
Vydáno: (2025)
Autor: Nakagawa, Ren, a další
Vydáno: (2025)
Locating Tennis Ball Impact on the Racket in Real Time Using an Event Camera
Autor: Kase, Yuto, a další
Vydáno: (2025)
Autor: Kase, Yuto, a další
Vydáno: (2025)
Podobné jednotky
-
SciVideoBench: Benchmarking Scientific Video Reasoning in Large Multimodal Models
Autor: Deng, Andong, a další
Vydáno: (2025) -
Motion-Grounded Video Reasoning: Understanding and Perceiving Motion at Pixel Level
Autor: Deng, Andong, a další
Vydáno: (2024) -
From Perception to Reasoning: Deep Thinking Empowers Multimodal Large Language Models
Autor: Zhu, Wenxin, a další
Vydáno: (2025) -
Deep Learning Based Approach to Enhanced Recognition of Emotions and Behavioral Patterns of Autistic Children
Autor: R, Nelaka K. A., a další
Vydáno: (2025) -
A.I.R.: Enabling Adaptive, Iterative, and Reasoning-based Frame Selection For Video Question Answering
Autor: Zou, Yuanhao, a další
Vydáno: (2025)