Salvato in:
| Autore principale: | Duan, Jinli |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2401.10416 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
TemporalFlowViz: Parameter-Aware Visual Analytics for Interpreting Scramjet Combustion Evolution
di: Jia, Yifei, et al.
Pubblicazione: (2025)
di: Jia, Yifei, et al.
Pubblicazione: (2025)
Input-Adaptive Visual Preprocessing for Efficient Fast Vision-Language Model Inference
di: Cahyani, Putu Indah Githa, et al.
Pubblicazione: (2025)
di: Cahyani, Putu Indah Githa, et al.
Pubblicazione: (2025)
VizDefender: Unmasking Visualization Tampering through Proactive Localization and Intent Inference
di: Song, Sicheng, et al.
Pubblicazione: (2025)
di: Song, Sicheng, et al.
Pubblicazione: (2025)
OPTED: Open Preprocessed Trachoma Eye Dataset Using Zero-Shot SAM 3 Segmentation
di: Gebremedhin, Kibrom, et al.
Pubblicazione: (2026)
di: Gebremedhin, Kibrom, et al.
Pubblicazione: (2026)
Foundation Models For Seismic Data Processing: An Extensive Review
di: Fuchs, Fabian, et al.
Pubblicazione: (2025)
di: Fuchs, Fabian, et al.
Pubblicazione: (2025)
An Event-Oriented Diffusion-Refinement Method for Sparse Events Completion
di: Zhang, Bo, et al.
Pubblicazione: (2024)
di: Zhang, Bo, et al.
Pubblicazione: (2024)
Online 3D Gaussian Splatting Modeling with Novel View Selection
di: Lee, Byeonggwon, et al.
Pubblicazione: (2025)
di: Lee, Byeonggwon, et al.
Pubblicazione: (2025)
Datasets, Clues and State-of-the-Arts for Multimedia Forensics: An Extensive Review
di: Yadav, Ankit, et al.
Pubblicazione: (2024)
di: Yadav, Ankit, et al.
Pubblicazione: (2024)
An Online Adaptation Method for Robust Depth Estimation and Visual Odometry in the Open World
di: Ji, Xingwu, et al.
Pubblicazione: (2025)
di: Ji, Xingwu, et al.
Pubblicazione: (2025)
A UNet Model for Accelerated Preprocessing of CRISM Hyperspectral Data for Mineral Identification on Mars
di: Kumari, Priyanka, et al.
Pubblicazione: (2025)
di: Kumari, Priyanka, et al.
Pubblicazione: (2025)
Illusion-Aware Visual Preprocessing and Anti-Illusion Prompting for Classic Illusion Understanding in Vision-Language Models
di: Zha, Junli, et al.
Pubblicazione: (2026)
di: Zha, Junli, et al.
Pubblicazione: (2026)
TempViz: On the Evaluation of Temporal Knowledge in Text-to-Image Models
di: Holtermann, Carolin, et al.
Pubblicazione: (2026)
di: Holtermann, Carolin, et al.
Pubblicazione: (2026)
Behavioural Cloning in VizDoom
di: Spick, Ryan, et al.
Pubblicazione: (2024)
di: Spick, Ryan, et al.
Pubblicazione: (2024)
SpatialViz-Bench: A Cognitively-Grounded Benchmark for Diagnosing Spatial Visualization in MLLMs
di: Wang, Siting, et al.
Pubblicazione: (2025)
di: Wang, Siting, et al.
Pubblicazione: (2025)
OnlineX: Unified Online 3D Reconstruction and Understanding with Active-to-Stable State Evolution
di: Xia, Chong, et al.
Pubblicazione: (2026)
di: Xia, Chong, et al.
Pubblicazione: (2026)
Data Leakage in Visual Datasets
di: Ramos, Patrick, et al.
Pubblicazione: (2025)
di: Ramos, Patrick, et al.
Pubblicazione: (2025)
OnlineAnySeg: Online Zero-Shot 3D Segmentation by Visual Foundation Model Guided 2D Mask Merging
di: Tang, Yijie, et al.
Pubblicazione: (2025)
di: Tang, Yijie, et al.
Pubblicazione: (2025)
Multi-Dimensional Quality Assessment for Text-to-3D Assets: Dataset and Model
di: Fu, Kang, et al.
Pubblicazione: (2025)
di: Fu, Kang, et al.
Pubblicazione: (2025)
Efficiently Collecting Training Dataset for 2D Object Detection by Online Visual Feedback
di: Kiyokawa, Takuya, et al.
Pubblicazione: (2023)
di: Kiyokawa, Takuya, et al.
Pubblicazione: (2023)
VizFlyt: Perception-centric Pedagogical Framework For Autonomous Aerial Robots
di: Srivastava, Kushagra, et al.
Pubblicazione: (2025)
di: Srivastava, Kushagra, et al.
Pubblicazione: (2025)
A Novel Dataset for Video-Based Neurodivergent Classification Leveraging Extra-Stimulatory Behavior
di: Serna-Aguilera, Manuel, et al.
Pubblicazione: (2024)
di: Serna-Aguilera, Manuel, et al.
Pubblicazione: (2024)
VizECGNet: Visual ECG Image Network for Cardiovascular Diseases Classification with Multi-Modal Training and Knowledge Distillation
di: Nam, Ju-Hyeon, et al.
Pubblicazione: (2024)
di: Nam, Ju-Hyeon, et al.
Pubblicazione: (2024)
PlanViz: Evaluating Planning-Oriented Image Generation and Editing for Computer-Use Tasks
di: Li, Junxian, et al.
Pubblicazione: (2026)
di: Li, Junxian, et al.
Pubblicazione: (2026)
MMInstruct: A High-Quality Multi-Modal Instruction Tuning Dataset with Extensive Diversity
di: Liu, Yangzhou, et al.
Pubblicazione: (2024)
di: Liu, Yangzhou, et al.
Pubblicazione: (2024)
Fully Authentic Visual Question Answering Dataset from Online Communities
di: Chen, Chongyan, et al.
Pubblicazione: (2023)
di: Chen, Chongyan, et al.
Pubblicazione: (2023)
ClimateViz: A Benchmark for Statistical Reasoning and Fact Verification on Scientific Charts
di: Su, Ruiran, et al.
Pubblicazione: (2025)
di: Su, Ruiran, et al.
Pubblicazione: (2025)
Memory-based Adapters for Online 3D Scene Perception
di: Xu, Xiuwei, et al.
Pubblicazione: (2024)
di: Xu, Xiuwei, et al.
Pubblicazione: (2024)
Leveraging Large Language Models to Effectively Generate Visual Data for Canine Musculoskeletal Diagnoses
di: Thißen, Martin, et al.
Pubblicazione: (2025)
di: Thißen, Martin, et al.
Pubblicazione: (2025)
ElectroVizQA: How well do Multi-modal LLMs perform in Electronics Visual Question Answering?
di: Meshram, Pragati Shuddhodhan, et al.
Pubblicazione: (2024)
di: Meshram, Pragati Shuddhodhan, et al.
Pubblicazione: (2024)
A Preprocessing and Postprocessing Voxel-based Method for LiDAR Semantic Segmentation Improvement in Long Distance
di: Matteazzi, Andrea, et al.
Pubblicazione: (2024)
di: Matteazzi, Andrea, et al.
Pubblicazione: (2024)
Adaptive High-Frequency Preprocessing for Video Coding
di: Pang, Yingxue, et al.
Pubblicazione: (2025)
di: Pang, Yingxue, et al.
Pubblicazione: (2025)
D$^{2}$-VPR: A Parameter-efficient Visual-foundation-model-based Visual Place Recognition Method via Knowledge Distillation and Deformable Aggregation
di: Zhang, Zheyuan, et al.
Pubblicazione: (2025)
di: Zhang, Zheyuan, et al.
Pubblicazione: (2025)
ViPOcc: Leveraging Visual Priors from Vision Foundation Models for Single-View 3D Occupancy Prediction
di: Feng, Yi, et al.
Pubblicazione: (2024)
di: Feng, Yi, et al.
Pubblicazione: (2024)
DeepRepViz: Identifying Confounders in Deep Learning Model Predictions
di: Rane, Roshan Prakash, et al.
Pubblicazione: (2023)
di: Rane, Roshan Prakash, et al.
Pubblicazione: (2023)
ScriptViz: A Visualization Tool to Aid Scriptwriting based on a Large Movie Database
di: Rao, Anyi, et al.
Pubblicazione: (2024)
di: Rao, Anyi, et al.
Pubblicazione: (2024)
Cross3DVG: Cross-Dataset 3D Visual Grounding on Different RGB-D Scans
di: Miyanishi, Taiki, et al.
Pubblicazione: (2023)
di: Miyanishi, Taiki, et al.
Pubblicazione: (2023)
DGC-GNN: Leveraging Geometry and Color Cues for Visual Descriptor-Free 2D-3D Matching
di: Wang, Shuzhe, et al.
Pubblicazione: (2023)
di: Wang, Shuzhe, et al.
Pubblicazione: (2023)
Preprocessing Algorithm Leveraging Geometric Modeling for Scale Correction in Hyperspectral Images for Improved Unmixing Performance
di: Sumanasekara, Praveen, et al.
Pubblicazione: (2025)
di: Sumanasekara, Praveen, et al.
Pubblicazione: (2025)
Toward Medical Deepfake Detection: A Comprehensive Dataset and Novel Method
di: Li, Shuaibo, et al.
Pubblicazione: (2025)
di: Li, Shuaibo, et al.
Pubblicazione: (2025)
The Impact of Preprocessing Methods on Racial Encoding and Model Robustness in CXR Diagnosis
di: Sutariya, Dishantkumar, et al.
Pubblicazione: (2026)
di: Sutariya, Dishantkumar, et al.
Pubblicazione: (2026)
Documenti analoghi
-
TemporalFlowViz: Parameter-Aware Visual Analytics for Interpreting Scramjet Combustion Evolution
di: Jia, Yifei, et al.
Pubblicazione: (2025) -
Input-Adaptive Visual Preprocessing for Efficient Fast Vision-Language Model Inference
di: Cahyani, Putu Indah Githa, et al.
Pubblicazione: (2025) -
VizDefender: Unmasking Visualization Tampering through Proactive Localization and Intent Inference
di: Song, Sicheng, et al.
Pubblicazione: (2025) -
OPTED: Open Preprocessed Trachoma Eye Dataset Using Zero-Shot SAM 3 Segmentation
di: Gebremedhin, Kibrom, et al.
Pubblicazione: (2026) -
Foundation Models For Seismic Data Processing: An Extensive Review
di: Fuchs, Fabian, et al.
Pubblicazione: (2025)