:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autore principale:	Duan, Jinli
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2401.10416
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

TemporalFlowViz: Parameter-Aware Visual Analytics for Interpreting Scramjet Combustion Evolution
di: Jia, Yifei, et al.
Pubblicazione: (2025)

Input-Adaptive Visual Preprocessing for Efficient Fast Vision-Language Model Inference
di: Cahyani, Putu Indah Githa, et al.
Pubblicazione: (2025)

VizDefender: Unmasking Visualization Tampering through Proactive Localization and Intent Inference
di: Song, Sicheng, et al.
Pubblicazione: (2025)

OPTED: Open Preprocessed Trachoma Eye Dataset Using Zero-Shot SAM 3 Segmentation
di: Gebremedhin, Kibrom, et al.
Pubblicazione: (2026)

Foundation Models For Seismic Data Processing: An Extensive Review
di: Fuchs, Fabian, et al.
Pubblicazione: (2025)

An Event-Oriented Diffusion-Refinement Method for Sparse Events Completion
di: Zhang, Bo, et al.
Pubblicazione: (2024)

Online 3D Gaussian Splatting Modeling with Novel View Selection
di: Lee, Byeonggwon, et al.
Pubblicazione: (2025)

Datasets, Clues and State-of-the-Arts for Multimedia Forensics: An Extensive Review
di: Yadav, Ankit, et al.
Pubblicazione: (2024)

An Online Adaptation Method for Robust Depth Estimation and Visual Odometry in the Open World
di: Ji, Xingwu, et al.
Pubblicazione: (2025)

A UNet Model for Accelerated Preprocessing of CRISM Hyperspectral Data for Mineral Identification on Mars
di: Kumari, Priyanka, et al.
Pubblicazione: (2025)

Illusion-Aware Visual Preprocessing and Anti-Illusion Prompting for Classic Illusion Understanding in Vision-Language Models
di: Zha, Junli, et al.
Pubblicazione: (2026)

TempViz: On the Evaluation of Temporal Knowledge in Text-to-Image Models
di: Holtermann, Carolin, et al.
Pubblicazione: (2026)

Behavioural Cloning in VizDoom
di: Spick, Ryan, et al.
Pubblicazione: (2024)

SpatialViz-Bench: A Cognitively-Grounded Benchmark for Diagnosing Spatial Visualization in MLLMs
di: Wang, Siting, et al.
Pubblicazione: (2025)

OnlineX: Unified Online 3D Reconstruction and Understanding with Active-to-Stable State Evolution
di: Xia, Chong, et al.
Pubblicazione: (2026)

Data Leakage in Visual Datasets
di: Ramos, Patrick, et al.
Pubblicazione: (2025)

OnlineAnySeg: Online Zero-Shot 3D Segmentation by Visual Foundation Model Guided 2D Mask Merging
di: Tang, Yijie, et al.
Pubblicazione: (2025)

Multi-Dimensional Quality Assessment for Text-to-3D Assets: Dataset and Model
di: Fu, Kang, et al.
Pubblicazione: (2025)

Efficiently Collecting Training Dataset for 2D Object Detection by Online Visual Feedback
di: Kiyokawa, Takuya, et al.
Pubblicazione: (2023)

VizFlyt: Perception-centric Pedagogical Framework For Autonomous Aerial Robots
di: Srivastava, Kushagra, et al.
Pubblicazione: (2025)

A Novel Dataset for Video-Based Neurodivergent Classification Leveraging Extra-Stimulatory Behavior
di: Serna-Aguilera, Manuel, et al.
Pubblicazione: (2024)

VizECGNet: Visual ECG Image Network for Cardiovascular Diseases Classification with Multi-Modal Training and Knowledge Distillation
di: Nam, Ju-Hyeon, et al.
Pubblicazione: (2024)

PlanViz: Evaluating Planning-Oriented Image Generation and Editing for Computer-Use Tasks
di: Li, Junxian, et al.
Pubblicazione: (2026)

MMInstruct: A High-Quality Multi-Modal Instruction Tuning Dataset with Extensive Diversity
di: Liu, Yangzhou, et al.
Pubblicazione: (2024)

Fully Authentic Visual Question Answering Dataset from Online Communities
di: Chen, Chongyan, et al.
Pubblicazione: (2023)

ClimateViz: A Benchmark for Statistical Reasoning and Fact Verification on Scientific Charts
di: Su, Ruiran, et al.
Pubblicazione: (2025)

Memory-based Adapters for Online 3D Scene Perception
di: Xu, Xiuwei, et al.
Pubblicazione: (2024)

Leveraging Large Language Models to Effectively Generate Visual Data for Canine Musculoskeletal Diagnoses
di: Thißen, Martin, et al.
Pubblicazione: (2025)

ElectroVizQA: How well do Multi-modal LLMs perform in Electronics Visual Question Answering?
di: Meshram, Pragati Shuddhodhan, et al.
Pubblicazione: (2024)

A Preprocessing and Postprocessing Voxel-based Method for LiDAR Semantic Segmentation Improvement in Long Distance
di: Matteazzi, Andrea, et al.
Pubblicazione: (2024)

Adaptive High-Frequency Preprocessing for Video Coding
di: Pang, Yingxue, et al.
Pubblicazione: (2025)

D$^{2}$-VPR: A Parameter-efficient Visual-foundation-model-based Visual Place Recognition Method via Knowledge Distillation and Deformable Aggregation
di: Zhang, Zheyuan, et al.
Pubblicazione: (2025)

ViPOcc: Leveraging Visual Priors from Vision Foundation Models for Single-View 3D Occupancy Prediction
di: Feng, Yi, et al.
Pubblicazione: (2024)

DeepRepViz: Identifying Confounders in Deep Learning Model Predictions
di: Rane, Roshan Prakash, et al.
Pubblicazione: (2023)

ScriptViz: A Visualization Tool to Aid Scriptwriting based on a Large Movie Database
di: Rao, Anyi, et al.
Pubblicazione: (2024)

Cross3DVG: Cross-Dataset 3D Visual Grounding on Different RGB-D Scans
di: Miyanishi, Taiki, et al.
Pubblicazione: (2023)

DGC-GNN: Leveraging Geometry and Color Cues for Visual Descriptor-Free 2D-3D Matching
di: Wang, Shuzhe, et al.
Pubblicazione: (2023)

Preprocessing Algorithm Leveraging Geometric Modeling for Scale Correction in Hyperspectral Images for Improved Unmixing Performance
di: Sumanasekara, Praveen, et al.
Pubblicazione: (2025)

Toward Medical Deepfake Detection: A Comprehensive Dataset and Novel Method
di: Li, Shuaibo, et al.
Pubblicazione: (2025)

The Impact of Preprocessing Methods on Racial Encoding and Model Robustness in CXR Diagnosis
di: Sutariya, Dishantkumar, et al.
Pubblicazione: (2026)