:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Fu, Kun, Dai, Ying
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Computer Vision and Pattern Recognition
Online-Zugang:	https://arxiv.org/abs/2401.14579
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Advancing Food Nutrition Estimation via Visual-Ingredient Feature Fusion
von: Qi, Huiyan, et al.
Veröffentlicht: (2025)

Prompt-based Ingredient-Oriented All-in-One Image Restoration
von: Gao, Hu, et al.
Veröffentlicht: (2023)

Learning to Restore Multi-Degraded Images via Ingredient Decoupling and Task-Aware Path Adaptation
von: Gao, Hu, et al.
Veröffentlicht: (2025)

Ingredients: Blending Custom Photos with Video Diffusion Transformers
von: Fei, Zhengcong, et al.
Veröffentlicht: (2025)

The Ingredients for Robotic Diffusion Transformers
von: Dasari, Sudeep, et al.
Veröffentlicht: (2024)

In Search of the Ingredients of Open-Endedness: Replicating Picbreeder with Large Vision-Language Models
von: Earle, Sam, et al.
Veröffentlicht: (2026)

HalalBench: A Multilingual OCR Benchmark for Food Packaging Ingredient Extraction
von: Arief, Hasan
Veröffentlicht: (2026)

Key Ingredients of Self-Driving Cars
von: Fan, Rui, et al.
Veröffentlicht: (2019)

Res-VMamba: Fine-Grained Food Category Visual Classification Using Selective State Space Models with Deep Residual Learning
von: Chen, Chi-Sheng, et al.
Veröffentlicht: (2024)

Analyzing Image Beyond Visual Aspect: Image Emotion Classification via Multiple-Affective Captioning
von: Zhou, Zibo, et al.
Veröffentlicht: (2025)

Recognizing Artistic Style of Archaeological Image Fragments Using Deep Style Extrapolation
von: Elkin, Gur, et al.
Veröffentlicht: (2025)

FMiFood: Multi-modal Contrastive Learning for Food Image Classification
von: Pan, Xinyue, et al.
Veröffentlicht: (2024)

Towards Cross-Domain Single Blood Cell Image Classification via Large-Scale LoRA-based Segment Anything Model
von: Li, Yongcheng, et al.
Veröffentlicht: (2024)

Multi-label Image Classification using Adaptive Graph Convolutional Networks: from a Single Domain to Multiple Domains
von: Singh, Indel Pal, et al.
Veröffentlicht: (2023)

Imitating the Functionality of Image-to-Image Models Using a Single Example
von: Spingarn-Eliezer, Nurit, et al.
Veröffentlicht: (2024)

Kitchen Food Waste Image Segmentation and Classification for Compost Nutrients Estimation
von: Rahman, Raiyan, et al.
Veröffentlicht: (2024)

Lightweight Vision Transformer with Window and Spatial Attention for Food Image Classification
von: Gao, Xinle, et al.
Veröffentlicht: (2025)

Online Class-Incremental Learning For Real-World Food Image Classification
von: Raghavan, Siddeshwar, et al.
Veröffentlicht: (2023)

ViLa-MIL: Dual-scale Vision-Language Multiple Instance Learning for Whole Slide Image Classification
von: Shi, Jiangbo, et al.
Veröffentlicht: (2025)

Learning Dense Feature Matching via Lifting Single 2D Image to 3D Space
von: Liang, Yingping, et al.
Veröffentlicht: (2025)

Perceive Anything: Recognize, Explain, Caption, and Segment Anything in Images and Videos
von: Lin, Weifeng, et al.
Veröffentlicht: (2025)

Synthetic Data Augmentation using Pre-trained Diffusion Models for Long-tailed Food Image Classification
von: Koh, GaYeon, et al.
Veröffentlicht: (2025)

R2Human: Real-Time 3D Human Appearance Rendering from a Single Image
von: Yang, Yuanwang, et al.
Veröffentlicht: (2023)

CAG-VLM: Fine-Tuning of a Large-Scale Model to Recognize Angiographic Images for Next-Generation Diagnostic Systems
von: Nakamura, Yuto, et al.
Veröffentlicht: (2025)

LLMs are Good Action Recognizers
von: Qu, Haoxuan, et al.
Veröffentlicht: (2024)

FOF-X: Towards Real-time Detailed Human Reconstruction from a Single Image
von: Feng, Qiao, et al.
Veröffentlicht: (2024)

Multibiometrics Using a Single Face Image
von: Ito, Koichi, et al.
Veröffentlicht: (2024)

Adapting a Segmentation Foundation Model for Medical Image Classification
von: Gu, Pengfei, et al.
Veröffentlicht: (2025)

Class-relevant Patch Embedding Selection for Few-Shot Image Classification
von: Jiang, Weihao, et al.
Veröffentlicht: (2024)

FCDFusion: a Fast, Low Color Deviation Method for Fusing Visible and Infrared Image Pairs
von: Li, Hesong, et al.
Veröffentlicht: (2024)

Meta-Optimization for Higher Model Generalizability in Single-Image Depth Prediction
von: Wu, Cho-Ying, et al.
Veröffentlicht: (2023)

Detecting Korean Food Using Image using Hierarchical Model
von: Lam, Hoang Khanh, et al.
Veröffentlicht: (2024)

A Cross-Font Image Retrieval Network for Recognizing Undeciphered Oracle Bone Inscriptions
von: Wu, Zhicong, et al.
Veröffentlicht: (2024)

Single-Stage Signal Attenuation Diffusion Model for Low-Light Image Enhancement and Denoising
von: Liu, Ying, et al.
Veröffentlicht: (2026)

Order Matters: On Parameter-Efficient Image-to-Video Probing for Recognizing Nearly Symmetric Actions
von: Ponbagavathi, Thinesh Thiyakesan, et al.
Veröffentlicht: (2025)

Multiple Instance Learning with random sampling for Whole Slide Image Classification
von: Keshvarikhojasteh, H., et al.
Veröffentlicht: (2024)

Fourier Transform Multiple Instance Learning for Whole Slide Image Classification
von: Bilic, Anthony, et al.
Veröffentlicht: (2025)

Attention-Challenging Multiple Instance Learning for Whole Slide Image Classification
von: Zhang, Yunlong, et al.
Veröffentlicht: (2023)

Recognizing Co-Speech Gestures in-the-Wild
von: Hegde, Sindhu B, et al.
Veröffentlicht: (2026)

AnimalClue: Recognizing Animals by their Traces
von: Shinoda, Risa, et al.
Veröffentlicht: (2025)