:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Alexandridis, Konstantinos Panagiotis, Elezi, Ismail, Deng, Jiankang, Nguyen, Anh, Luo, Shan
Format:	Preprint
Publié:	2024
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2410.11774
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Adaptive Parametric Activation: Unifying and Generalising Activation Functions Across Tasks
par: Alexandridis, Konstantinos Panagiotis, et autres
Publié: (2024)

G3DR: Generative 3D Reconstruction in ImageNet
par: Reddy, Pradyumna, et autres
Publié: (2024)

$V_kD:$ Improving Knowledge Distillation using Orthogonal Projections
par: Miles, Roy, et autres
Publié: (2024)

Deep Active Learning: A Reality Check
par: Gashi, Edrina, et autres
Publié: (2024)

VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections
par: Miles, Roy, et autres
Publié: (2024)

Three Heads Are Better Than One: Complementary Experts for Long-Tailed Semi-supervised Learning
par: Ma, Chengcheng, et autres
Publié: (2023)

"Principal Components" Enable A New Language of Images
par: Wen, Xin, et autres
Publié: (2025)

SATGround: A Spatially-Aware Approach for Visual Grounding in Remote Sensing
par: Toker, Aysim, et autres
Publié: (2025)

RetouchLLM: Training-free Code-based Image Retouching with Vision Language Models
par: Ye-Bin, Moon, et autres
Publié: (2025)

Do You See What I Am Pointing At? Gesture-Based Egocentric Video Question Answering
par: Choi, Yura, et autres
Publié: (2026)

ViCToR: Improving Visual Comprehension via Token Reconstruction for Pretraining LMMs
par: Xie, Yin, et autres
Publié: (2024)

DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces
par: Khan, Mohammad Sadil, et autres
Publié: (2026)

Region-based Cluster Discrimination for Visual Representation Learning
par: Xie, Yin, et autres
Publié: (2025)

TransFace++: Rethinking the Face Recognition Paradigm with a Focus on Accuracy, Efficiency, and Security
par: Dan, Jun, et autres
Publié: (2023)

CEDex: Cross-Embodiment Dexterous Grasp Generation at Scale from Human-like Contact Representations
par: Wu, Zhiyuan, et autres
Publié: (2025)

WaveFace: Authentic Face Restoration with Efficient Frequency Recovery
par: Miao, Yunqi, et autres
Publié: (2024)

Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation
par: Du, Zhipeng, et autres
Publié: (2023)

MoCoTalk: Multi-Conditional Diffusion with Adaptive Router for Controllable Talking Head Generation
par: Ye, Xinyan, et autres
Publié: (2026)

RAVEN: Real-time Autoregressive Video Extrapolation with Consistency-model GRPO
par: Lu, Yanzuo, et autres
Publié: (2026)

TopoFR: A Closer Look at Topology Alignment on Face Recognition
par: Dan, Jun, et autres
Publié: (2024)

TropNNC: Structured Neural Network Compression Using Tropical Geometry
par: Fotopoulos, Konstantinos, et autres
Publié: (2024)

ShapeCraft: LLM Agents for Structured, Textured and Interactive 3D Modeling
par: Zhang, Shuyuan, et autres
Publié: (2025)

X-ray illicit object detection using hybrid CNN-transformer neural network architectures
par: Cani, Jorgen, et autres
Publié: (2025)

Illicit object detection in X-ray imaging using deep learning techniques: A comparative evaluation
par: Cani, Jorgen, et autres
Publié: (2025)

Multi-label Cluster Discrimination for Visual Representation Learning
par: An, Xiang, et autres
Publié: (2024)

WiLoR: End-to-end 3D Hand Localization and Reconstruction in-the-wild
par: Potamias, Rolandos Alexandros, et autres
Publié: (2024)

HaWoR: World-Space Hand Motion Reconstruction from Egocentric Videos
par: Zhang, Jinglei, et autres
Publié: (2025)

Frequency-based Matcher for Long-tailed Semantic Segmentation
par: Li, Shan, et autres
Publié: (2024)

FG-Portrait: 3D Flow Guided Editable Portrait Animation
par: Xu, Yating, et autres
Publié: (2026)

LMAD: Integrated End-to-End Vision-Language Model for Explainable Autonomous Driving
par: Song, Nan, et autres
Publié: (2025)

Unleashing Vision-Language Semantics for Deepfake Video Detection
par: Zhu, Jiawen, et autres
Publié: (2026)

High Dynamic Range 3D Gaussian Splatting via Luminance-Chromaticity Decomposition
par: Zhang, Kaixuan, et autres
Publié: (2025)

FlexEdit: Flexible and Controllable Diffusion-based Object-centric Image Editing
par: Nguyen, Trong-Tung, et autres
Publié: (2024)

Class and Region-Adaptive Constraints for Network Calibration
par: Murugesan, Balamurali, et autres
Publié: (2024)

Robust Calibration of Large Vision-Language Adapters
par: Murugesan, Balamurali, et autres
Publié: (2024)

GazeLT: Visual attention-guided long-tailed disease classification in chest radiographs
par: Bhattacharya, Moinak, et autres
Publié: (2025)

SAGS: Structure-Aware 3D Gaussian Splatting
par: Ververas, Evangelos, et autres
Publié: (2024)

ImHead: A Large-scale Implicit Morphable Model for Localized Head Modeling
par: Potamias, Rolandos Alexandros, et autres
Publié: (2025)

ID-to-3D: Expressive ID-guided 3D Heads via Score Distillation Sampling
par: Babiloni, Francesca, et autres
Publié: (2024)

Improving face generation quality and prompt following with synthetic captions
par: Tarasiou, Michail, et autres
Publié: (2024)