:: Library Catalog

Obálka

Uloženo v:

Podrobná bibliografie
Hlavní autoři:	Deng, Andong, Yang, Taojiannan, Chen, Chen, Chen, Qian, Neely, Leslie, Oyama, Sakiko
Médium:	Preprint
Vydáno:	2022
Témata:	Computer Vision and Pattern Recognition
On-line přístup:	https://arxiv.org/abs/2211.09310
Tagy:	Přidat tag Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!

Podobné jednotky

SciVideoBench: Benchmarking Scientific Video Reasoning in Large Multimodal Models
Autor: Deng, Andong, a další
Vydáno: (2025)

Motion-Grounded Video Reasoning: Understanding and Perceiving Motion at Pixel Level
Autor: Deng, Andong, a další
Vydáno: (2024)

From Perception to Reasoning: Deep Thinking Empowers Multimodal Large Language Models
Autor: Zhu, Wenxin, a další
Vydáno: (2025)

Deep Learning Based Approach to Enhanced Recognition of Emotions and Behavioral Patterns of Autistic Children
Autor: R, Nelaka K. A., a další
Vydáno: (2025)

A.I.R.: Enabling Adaptive, Iterative, and Reasoning-based Frame Selection For Video Question Answering
Autor: Zou, Yuanhao, a další
Vydáno: (2025)

Explain via Any Concept: Concept Bottleneck Model with Open Vocabulary Concepts
Autor: Tan, Andong, a další
Vydáno: (2024)

Post-hoc Part-prototype Networks
Autor: Tan, Andong, a další
Vydáno: (2024)

ControlNet++: Improving Conditional Controls with Efficient Consistency Feedback
Autor: Li, Ming, a další
Vydáno: (2024)

Multi-threshold Deep Metric Learning for Facial Expression Recognition
Autor: Yang, Wenwu, a další
Vydáno: (2024)

STORM: Internalized Modeling for Spatial-Temporal Reasoning in Video-Language Models
Autor: Liang, Yiming, a další
Vydáno: (2026)

Seq2Time: Sequential Knowledge Transfer for Video LLM Temporal Grounding
Autor: Deng, Andong, a další
Vydáno: (2024)

VEBench:Benchmarking Large Multimodal Models for Real-World Video Editing
Autor: Deng, Andong, a další
Vydáno: (2026)

Voronoi-Assisted Diffusion for Computing Unsigned Distance Fields from Unoriented Points
Autor: Kong, Jiayi, a další
Vydáno: (2025)

Video-Based Autism Detection with Deep Learning
Autor: Serna-Aguilera, M., a další
Vydáno: (2024)

Deep Learning-based Animal Behavior Analysis: Insights from Mouse Chronic Pain Models
Autor: Chen, Yu-Hsi, a další
Vydáno: (2025)

Deep Tree Tensor Networks for Image Recognition
Autor: Nie, Chang, a další
Vydáno: (2025)

Learning Semantic-Aware Representation in Visual-Language Models for Multi-Label Recognition with Partial Labels
Autor: Ruan, Haoxian, a další
Vydáno: (2024)

Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors
Autor: Liu, Yuanyuan, a další
Vydáno: (2024)

Multi-Modality Co-Learning for Efficient Skeleton-based Action Recognition
Autor: Liu, Jinfu, a další
Vydáno: (2024)

BEAR: A Video Dataset For Fine-grained Behaviors Recognition Oriented with Action and Environment Factors
Autor: Hu, Chengyang, a další
Vydáno: (2025)

Culture In a Frame: C$^3$B as a Comic-Based Benchmark for Multimodal Culturally Awareness
Autor: Song, Yuchen, a další
Vydáno: (2025)

Denoising-Contrastive Alignment for Continuous Sign Language Recognition
Autor: Guo, Leming, a další
Vydáno: (2023)

MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition
Autor: Chen, Yufan, a další
Vydáno: (2024)

Meta-Auxiliary Learning for Micro-Expression Recognition
Autor: Wang, Jingyao, a další
Vydáno: (2024)

Continual Learning for Remote Physiological Measurement: Minimize Forgetting and Simplify Inference
Autor: Liang, Qian, a další
Vydáno: (2024)

Are Deep Learning Models Robust to Partial Object Occlusion in Visual Recognition Tasks?
Autor: Kassaw, Kaleb, a další
Vydáno: (2024)

Efficient Surgical Tool Recognition via HMM-Stabilized Deep Learning
Autor: Wang, Haifeng, a další
Vydáno: (2024)

Few-Shot Continual Learning for Activity Recognition in Classroom Surveillance Images
Autor: Qian, Yilei, a další
Vydáno: (2024)

SignVTCL: Multi-Modal Continuous Sign Language Recognition Enhanced by Visual-Textual Contrastive Learning
Autor: Chen, Hao, a další
Vydáno: (2024)

Neuron: Learning Context-Aware Evolving Representations for Zero-Shot Skeleton Action Recognition
Autor: Chen, Yang, a další
Vydáno: (2024)

KAN-HyperpointNet for Point Cloud Sequence-Based 3D Human Action Recognition
Autor: Chen, Zhaoyu, a další
Vydáno: (2024)

Beyond Global Alignment: Fine-Grained Motion-Language Retrieval via Pyramidal Shapley-Taylor Learning
Autor: Chen, Hanmo, a další
Vydáno: (2026)

OST: Refining Text Knowledge with Optimal Spatio-Temporal Descriptor for General Video Recognition
Autor: Chen, Tongjia, a další
Vydáno: (2023)

Language-Assisted Human Part Motion Learning for Skeleton-Based Temporal Action Segmentation
Autor: Chen, Bowen, a další
Vydáno: (2024)

GlyphDraw2: Automatic Generation of Complex Glyph Posters with Diffusion Models and Large Language Models
Autor: Ma, Jian, a další
Vydáno: (2024)

Relational Contrastive Learning and Masked Image Modeling for Scene Text Recognition
Autor: Lin, Tiancheng, a další
Vydáno: (2024)

Modality-missing RGBT Tracking: Invertible Prompt Learning and High-quality Benchmarks
Autor: Lu, Andong, a další
Vydáno: (2023)

Data-free Multi-label Image Recognition via LLM-powered Prompt Tuning
Autor: Yang, Shuo, a další
Vydáno: (2024)

Interaction-via-Actions: Cattle Interaction Detection with Joint Learning of Action-Interaction Latent Space
Autor: Nakagawa, Ren, a další
Vydáno: (2025)

Locating Tennis Ball Impact on the Racket in Real Time Using an Event Camera
Autor: Kase, Yuto, a další
Vydáno: (2025)