:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Li, Pei, Yin, Jiaxi, Ouyang, Lei, Pan, Shihan, Wang, Ge, Ding, Han, Wang, Fei
Format:	Preprint
Published:	2026
Subjects:	Computer Vision and Pattern Recognition
Online Access:	https://arxiv.org/abs/2602.01850
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

Improving Weakly Supervised Temporal Action Localization by Exploiting Multi-resolution Information in Temporal Domain
by: Su, Rui, et al.
Published: (2025)

XRF V2: A Dataset for Action Summarization with Wi-Fi Signals, and IMUs in Phones, Watches, Earbuds, and Glasses
by: Lan, Bo, et al.
Published: (2025)

Weakly-Supervised Temporal Action Localization by Progressive Complementary Learning
by: Du, Jia-Run, et al.
Published: (2022)

Exploring the Temporal Consistency for Point-Level Weakly-Supervised Temporal Action Localization
by: Ma, Yunchuan, et al.
Published: (2026)

Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts
by: Wu, Peng, et al.
Published: (2024)

Probabilistic Vision-Language Representation for Weakly Supervised Temporal Action Localization
by: Lim, Geuntaek, et al.
Published: (2024)

EAR: Enhancing Uni-Modal Representations for Weakly Supervised Audio-Visual Video Parsing
by: Li, Huilai, et al.
Published: (2026)

Semi-Supervised Audio-Visual Video Action Recognition with Audio Source Localization Guided Mixup
by: Kang, Seokun, et al.
Published: (2025)

What's on Your Plate? Inferring Chinese Cuisine Intake from Wearable IMUs
by: Yin, Jiaxi, et al.
Published: (2025)

Bridge the Gap: From Weak to Full Supervision for Temporal Action Localization with PseudoFormer
by: Liu, Ziyi, et al.
Published: (2025)

Neural 5G Indoor Localization with IMU Supervision
by: Ermolov, Aleksandr, et al.
Published: (2024)

Multi-Scale Cross-Fusion and Edge-Supervision Network for Image Splicing Localization
by: Niu, Yakun, et al.
Published: (2024)

ScriptoriumWS: A Code Generation Assistant for Weak Supervision
by: Huang, Tzu-Heng, et al.
Published: (2025)

WeGA: Weakly-Supervised Global-Local Affinity Learning Framework for Lymph Node Metastasis Prediction in Rectal Cancer
by: Gao, Yifan, et al.
Published: (2025)

Semi-Supervised Pipe Video Temporal Defect Interval Localization
by: Huang, Zhu, et al.
Published: (2024)

WS$^2$: Weakly Supervised Segmentation using Before-After Supervision in Waste Sorting
by: Marelli, Andrea, et al.
Published: (2025)

EtC: Temporal Boundary Expand then Clarify for Weakly Supervised Video Grounding with Multimodal Large Language Model
by: Li, Guozhang, et al.
Published: (2023)

Weakly Supervised YOLO Network for Surgical Instrument Localization in Endoscopic Videos
by: Wei, Rongfeng, et al.
Published: (2023)

A Multimodal Deviation Perceiving Framework for Weakly-Supervised Temporal Forgery Localization
by: Xu, Wenbo, et al.
Published: (2025)

Advancing Weakly-Supervised Audio-Visual Video Parsing via Segment-wise Pseudo Labeling
by: Zhou, Jinxing, et al.
Published: (2024)

Temporal Divide-and-Conquer Anomaly Actions Localization in Semi-Supervised Videos with Hierarchical Transformer
by: Osman, Nada, et al.
Published: (2024)

Reinforced Label Denoising for Weakly-Supervised Audio-Visual Video Parsing
by: Gao, Yongbiao, et al.
Published: (2024)

Weakly Supervised Gaussian Contrastive Grounding with Large Multimodal Models for Video Question Answering
by: Wang, Haibo, et al.
Published: (2024)

Generalized Uncertainty-Based Evidential Fusion with Hybrid Multi-Head Attention for Weak-Supervised Temporal Action Localization
by: He, Yuanpeng, et al.
Published: (2024)

Rethinking Pseudo-Label Guided Learning for Weakly Supervised Temporal Action Localization from the Perspective of Noise Correction
by: Zhang, Quan, et al.
Published: (2025)

Fine-grained Background Representation for Weakly Supervised Semantic Segmentation
by: Yin, Xu, et al.
Published: (2024)

Masked Video and Body-worn IMU Autoencoder for Egocentric Action Recognition
by: Zhang, Mingfang, et al.
Published: (2024)

Context-Aware Weakly Supervised Image Manipulation Localization with SAM Refinement
by: Wang, Xinghao, et al.
Published: (2025)

Weakly Supervised Temporal Action Localization via Dual-Prior Collaborative Learning Guided by Multimodal Large Language Models
by: Zhang, Quan, et al.
Published: (2024)

Mining Forgery Traces from Reconstruction Error: A Weakly Supervised Framework for Multimodal Deepfake Temporal Localization
by: Guo, Midou, et al.
Published: (2026)

Research on Audio-Visual Quality Assessment Dataset and Method for User-Generated Omnidirectional Video
by: Zhao, Fei, et al.
Published: (2025)

Weakly-supervised Audio Temporal Forgery Localization via Progressive Audio-language Co-learning Network
by: Wu, Junyan, et al.
Published: (2025)

Boosting Semi-Supervised Temporal Action Localization by Learning from Non-Target Classes
by: Xia, Kun, et al.
Published: (2024)

Weakly Supervised Multimodal Temporal Forgery Localization via Multitask Learning
by: Xu, Wenbo, et al.
Published: (2025)

TOGA: Temporally Grounded Open-Ended Video QA with Weak Supervision
by: Gupta, Ayush, et al.
Published: (2025)

Temporal-consistent CAMs for Weakly Supervised Video Segmentation in Waste Sorting
by: Marelli, Andrea, et al.
Published: (2025)

Leveraging Transformers for Weakly Supervised Object Localization in Unconstrained Videos
by: Murtaza, Shakeeb, et al.
Published: (2024)

Deep Weakly-Supervised Domain Adaptation for Pain Localization in Videos
by: Praveen, R. Gnana, et al.
Published: (2019)

Adaptive Patch Contrast for Weakly Supervised Semantic Segmentation
by: Wu, Wangyu, et al.
Published: (2024)

Progressive Cross-Stream Cooperation in Spatial and Temporal Domain for Action Localization
by: Su, Rui, et al.
Published: (2019)