Gespeichert in:
| Hauptverfasser: | Fu, Kun, Dai, Ying |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2401.14579 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Advancing Food Nutrition Estimation via Visual-Ingredient Feature Fusion
von: Qi, Huiyan, et al.
Veröffentlicht: (2025)
von: Qi, Huiyan, et al.
Veröffentlicht: (2025)
Prompt-based Ingredient-Oriented All-in-One Image Restoration
von: Gao, Hu, et al.
Veröffentlicht: (2023)
von: Gao, Hu, et al.
Veröffentlicht: (2023)
Learning to Restore Multi-Degraded Images via Ingredient Decoupling and Task-Aware Path Adaptation
von: Gao, Hu, et al.
Veröffentlicht: (2025)
von: Gao, Hu, et al.
Veröffentlicht: (2025)
Ingredients: Blending Custom Photos with Video Diffusion Transformers
von: Fei, Zhengcong, et al.
Veröffentlicht: (2025)
von: Fei, Zhengcong, et al.
Veröffentlicht: (2025)
The Ingredients for Robotic Diffusion Transformers
von: Dasari, Sudeep, et al.
Veröffentlicht: (2024)
von: Dasari, Sudeep, et al.
Veröffentlicht: (2024)
In Search of the Ingredients of Open-Endedness: Replicating Picbreeder with Large Vision-Language Models
von: Earle, Sam, et al.
Veröffentlicht: (2026)
von: Earle, Sam, et al.
Veröffentlicht: (2026)
HalalBench: A Multilingual OCR Benchmark for Food Packaging Ingredient Extraction
von: Arief, Hasan
Veröffentlicht: (2026)
von: Arief, Hasan
Veröffentlicht: (2026)
Key Ingredients of Self-Driving Cars
von: Fan, Rui, et al.
Veröffentlicht: (2019)
von: Fan, Rui, et al.
Veröffentlicht: (2019)
Res-VMamba: Fine-Grained Food Category Visual Classification Using Selective State Space Models with Deep Residual Learning
von: Chen, Chi-Sheng, et al.
Veröffentlicht: (2024)
von: Chen, Chi-Sheng, et al.
Veröffentlicht: (2024)
Analyzing Image Beyond Visual Aspect: Image Emotion Classification via Multiple-Affective Captioning
von: Zhou, Zibo, et al.
Veröffentlicht: (2025)
von: Zhou, Zibo, et al.
Veröffentlicht: (2025)
Recognizing Artistic Style of Archaeological Image Fragments Using Deep Style Extrapolation
von: Elkin, Gur, et al.
Veröffentlicht: (2025)
von: Elkin, Gur, et al.
Veröffentlicht: (2025)
FMiFood: Multi-modal Contrastive Learning for Food Image Classification
von: Pan, Xinyue, et al.
Veröffentlicht: (2024)
von: Pan, Xinyue, et al.
Veröffentlicht: (2024)
Towards Cross-Domain Single Blood Cell Image Classification via Large-Scale LoRA-based Segment Anything Model
von: Li, Yongcheng, et al.
Veröffentlicht: (2024)
von: Li, Yongcheng, et al.
Veröffentlicht: (2024)
Multi-label Image Classification using Adaptive Graph Convolutional Networks: from a Single Domain to Multiple Domains
von: Singh, Indel Pal, et al.
Veröffentlicht: (2023)
von: Singh, Indel Pal, et al.
Veröffentlicht: (2023)
Imitating the Functionality of Image-to-Image Models Using a Single Example
von: Spingarn-Eliezer, Nurit, et al.
Veröffentlicht: (2024)
von: Spingarn-Eliezer, Nurit, et al.
Veröffentlicht: (2024)
Kitchen Food Waste Image Segmentation and Classification for Compost Nutrients Estimation
von: Rahman, Raiyan, et al.
Veröffentlicht: (2024)
von: Rahman, Raiyan, et al.
Veröffentlicht: (2024)
Lightweight Vision Transformer with Window and Spatial Attention for Food Image Classification
von: Gao, Xinle, et al.
Veröffentlicht: (2025)
von: Gao, Xinle, et al.
Veröffentlicht: (2025)
Online Class-Incremental Learning For Real-World Food Image Classification
von: Raghavan, Siddeshwar, et al.
Veröffentlicht: (2023)
von: Raghavan, Siddeshwar, et al.
Veröffentlicht: (2023)
ViLa-MIL: Dual-scale Vision-Language Multiple Instance Learning for Whole Slide Image Classification
von: Shi, Jiangbo, et al.
Veröffentlicht: (2025)
von: Shi, Jiangbo, et al.
Veröffentlicht: (2025)
Learning Dense Feature Matching via Lifting Single 2D Image to 3D Space
von: Liang, Yingping, et al.
Veröffentlicht: (2025)
von: Liang, Yingping, et al.
Veröffentlicht: (2025)
Perceive Anything: Recognize, Explain, Caption, and Segment Anything in Images and Videos
von: Lin, Weifeng, et al.
Veröffentlicht: (2025)
von: Lin, Weifeng, et al.
Veröffentlicht: (2025)
Synthetic Data Augmentation using Pre-trained Diffusion Models for Long-tailed Food Image Classification
von: Koh, GaYeon, et al.
Veröffentlicht: (2025)
von: Koh, GaYeon, et al.
Veröffentlicht: (2025)
R2Human: Real-Time 3D Human Appearance Rendering from a Single Image
von: Yang, Yuanwang, et al.
Veröffentlicht: (2023)
von: Yang, Yuanwang, et al.
Veröffentlicht: (2023)
CAG-VLM: Fine-Tuning of a Large-Scale Model to Recognize Angiographic Images for Next-Generation Diagnostic Systems
von: Nakamura, Yuto, et al.
Veröffentlicht: (2025)
von: Nakamura, Yuto, et al.
Veröffentlicht: (2025)
LLMs are Good Action Recognizers
von: Qu, Haoxuan, et al.
Veröffentlicht: (2024)
von: Qu, Haoxuan, et al.
Veröffentlicht: (2024)
FOF-X: Towards Real-time Detailed Human Reconstruction from a Single Image
von: Feng, Qiao, et al.
Veröffentlicht: (2024)
von: Feng, Qiao, et al.
Veröffentlicht: (2024)
Multibiometrics Using a Single Face Image
von: Ito, Koichi, et al.
Veröffentlicht: (2024)
von: Ito, Koichi, et al.
Veröffentlicht: (2024)
Adapting a Segmentation Foundation Model for Medical Image Classification
von: Gu, Pengfei, et al.
Veröffentlicht: (2025)
von: Gu, Pengfei, et al.
Veröffentlicht: (2025)
Class-relevant Patch Embedding Selection for Few-Shot Image Classification
von: Jiang, Weihao, et al.
Veröffentlicht: (2024)
von: Jiang, Weihao, et al.
Veröffentlicht: (2024)
FCDFusion: a Fast, Low Color Deviation Method for Fusing Visible and Infrared Image Pairs
von: Li, Hesong, et al.
Veröffentlicht: (2024)
von: Li, Hesong, et al.
Veröffentlicht: (2024)
Meta-Optimization for Higher Model Generalizability in Single-Image Depth Prediction
von: Wu, Cho-Ying, et al.
Veröffentlicht: (2023)
von: Wu, Cho-Ying, et al.
Veröffentlicht: (2023)
Detecting Korean Food Using Image using Hierarchical Model
von: Lam, Hoang Khanh, et al.
Veröffentlicht: (2024)
von: Lam, Hoang Khanh, et al.
Veröffentlicht: (2024)
A Cross-Font Image Retrieval Network for Recognizing Undeciphered Oracle Bone Inscriptions
von: Wu, Zhicong, et al.
Veröffentlicht: (2024)
von: Wu, Zhicong, et al.
Veröffentlicht: (2024)
Single-Stage Signal Attenuation Diffusion Model for Low-Light Image Enhancement and Denoising
von: Liu, Ying, et al.
Veröffentlicht: (2026)
von: Liu, Ying, et al.
Veröffentlicht: (2026)
Order Matters: On Parameter-Efficient Image-to-Video Probing for Recognizing Nearly Symmetric Actions
von: Ponbagavathi, Thinesh Thiyakesan, et al.
Veröffentlicht: (2025)
von: Ponbagavathi, Thinesh Thiyakesan, et al.
Veröffentlicht: (2025)
Multiple Instance Learning with random sampling for Whole Slide Image Classification
von: Keshvarikhojasteh, H., et al.
Veröffentlicht: (2024)
von: Keshvarikhojasteh, H., et al.
Veröffentlicht: (2024)
Fourier Transform Multiple Instance Learning for Whole Slide Image Classification
von: Bilic, Anthony, et al.
Veröffentlicht: (2025)
von: Bilic, Anthony, et al.
Veröffentlicht: (2025)
Attention-Challenging Multiple Instance Learning for Whole Slide Image Classification
von: Zhang, Yunlong, et al.
Veröffentlicht: (2023)
von: Zhang, Yunlong, et al.
Veröffentlicht: (2023)
Recognizing Co-Speech Gestures in-the-Wild
von: Hegde, Sindhu B, et al.
Veröffentlicht: (2026)
von: Hegde, Sindhu B, et al.
Veröffentlicht: (2026)
AnimalClue: Recognizing Animals by their Traces
von: Shinoda, Risa, et al.
Veröffentlicht: (2025)
von: Shinoda, Risa, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Advancing Food Nutrition Estimation via Visual-Ingredient Feature Fusion
von: Qi, Huiyan, et al.
Veröffentlicht: (2025) -
Prompt-based Ingredient-Oriented All-in-One Image Restoration
von: Gao, Hu, et al.
Veröffentlicht: (2023) -
Learning to Restore Multi-Degraded Images via Ingredient Decoupling and Task-Aware Path Adaptation
von: Gao, Hu, et al.
Veröffentlicht: (2025) -
Ingredients: Blending Custom Photos with Video Diffusion Transformers
von: Fei, Zhengcong, et al.
Veröffentlicht: (2025) -
The Ingredients for Robotic Diffusion Transformers
von: Dasari, Sudeep, et al.
Veröffentlicht: (2024)