Enregistré dans:
| Auteurs principaux: | Alexandridis, Konstantinos Panagiotis, Elezi, Ismail, Deng, Jiankang, Nguyen, Anh, Luo, Shan |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2410.11774 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Adaptive Parametric Activation: Unifying and Generalising Activation Functions Across Tasks
par: Alexandridis, Konstantinos Panagiotis, et autres
Publié: (2024)
par: Alexandridis, Konstantinos Panagiotis, et autres
Publié: (2024)
G3DR: Generative 3D Reconstruction in ImageNet
par: Reddy, Pradyumna, et autres
Publié: (2024)
par: Reddy, Pradyumna, et autres
Publié: (2024)
$V_kD:$ Improving Knowledge Distillation using Orthogonal Projections
par: Miles, Roy, et autres
Publié: (2024)
par: Miles, Roy, et autres
Publié: (2024)
Deep Active Learning: A Reality Check
par: Gashi, Edrina, et autres
Publié: (2024)
par: Gashi, Edrina, et autres
Publié: (2024)
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections
par: Miles, Roy, et autres
Publié: (2024)
par: Miles, Roy, et autres
Publié: (2024)
Three Heads Are Better Than One: Complementary Experts for Long-Tailed Semi-supervised Learning
par: Ma, Chengcheng, et autres
Publié: (2023)
par: Ma, Chengcheng, et autres
Publié: (2023)
"Principal Components" Enable A New Language of Images
par: Wen, Xin, et autres
Publié: (2025)
par: Wen, Xin, et autres
Publié: (2025)
SATGround: A Spatially-Aware Approach for Visual Grounding in Remote Sensing
par: Toker, Aysim, et autres
Publié: (2025)
par: Toker, Aysim, et autres
Publié: (2025)
RetouchLLM: Training-free Code-based Image Retouching with Vision Language Models
par: Ye-Bin, Moon, et autres
Publié: (2025)
par: Ye-Bin, Moon, et autres
Publié: (2025)
Do You See What I Am Pointing At? Gesture-Based Egocentric Video Question Answering
par: Choi, Yura, et autres
Publié: (2026)
par: Choi, Yura, et autres
Publié: (2026)
ViCToR: Improving Visual Comprehension via Token Reconstruction for Pretraining LMMs
par: Xie, Yin, et autres
Publié: (2024)
par: Xie, Yin, et autres
Publié: (2024)
DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces
par: Khan, Mohammad Sadil, et autres
Publié: (2026)
par: Khan, Mohammad Sadil, et autres
Publié: (2026)
Region-based Cluster Discrimination for Visual Representation Learning
par: Xie, Yin, et autres
Publié: (2025)
par: Xie, Yin, et autres
Publié: (2025)
TransFace++: Rethinking the Face Recognition Paradigm with a Focus on Accuracy, Efficiency, and Security
par: Dan, Jun, et autres
Publié: (2023)
par: Dan, Jun, et autres
Publié: (2023)
CEDex: Cross-Embodiment Dexterous Grasp Generation at Scale from Human-like Contact Representations
par: Wu, Zhiyuan, et autres
Publié: (2025)
par: Wu, Zhiyuan, et autres
Publié: (2025)
WaveFace: Authentic Face Restoration with Efficient Frequency Recovery
par: Miao, Yunqi, et autres
Publié: (2024)
par: Miao, Yunqi, et autres
Publié: (2024)
Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation
par: Du, Zhipeng, et autres
Publié: (2023)
par: Du, Zhipeng, et autres
Publié: (2023)
MoCoTalk: Multi-Conditional Diffusion with Adaptive Router for Controllable Talking Head Generation
par: Ye, Xinyan, et autres
Publié: (2026)
par: Ye, Xinyan, et autres
Publié: (2026)
RAVEN: Real-time Autoregressive Video Extrapolation with Consistency-model GRPO
par: Lu, Yanzuo, et autres
Publié: (2026)
par: Lu, Yanzuo, et autres
Publié: (2026)
TopoFR: A Closer Look at Topology Alignment on Face Recognition
par: Dan, Jun, et autres
Publié: (2024)
par: Dan, Jun, et autres
Publié: (2024)
TropNNC: Structured Neural Network Compression Using Tropical Geometry
par: Fotopoulos, Konstantinos, et autres
Publié: (2024)
par: Fotopoulos, Konstantinos, et autres
Publié: (2024)
ShapeCraft: LLM Agents for Structured, Textured and Interactive 3D Modeling
par: Zhang, Shuyuan, et autres
Publié: (2025)
par: Zhang, Shuyuan, et autres
Publié: (2025)
X-ray illicit object detection using hybrid CNN-transformer neural network architectures
par: Cani, Jorgen, et autres
Publié: (2025)
par: Cani, Jorgen, et autres
Publié: (2025)
Illicit object detection in X-ray imaging using deep learning techniques: A comparative evaluation
par: Cani, Jorgen, et autres
Publié: (2025)
par: Cani, Jorgen, et autres
Publié: (2025)
Multi-label Cluster Discrimination for Visual Representation Learning
par: An, Xiang, et autres
Publié: (2024)
par: An, Xiang, et autres
Publié: (2024)
WiLoR: End-to-end 3D Hand Localization and Reconstruction in-the-wild
par: Potamias, Rolandos Alexandros, et autres
Publié: (2024)
par: Potamias, Rolandos Alexandros, et autres
Publié: (2024)
HaWoR: World-Space Hand Motion Reconstruction from Egocentric Videos
par: Zhang, Jinglei, et autres
Publié: (2025)
par: Zhang, Jinglei, et autres
Publié: (2025)
Frequency-based Matcher for Long-tailed Semantic Segmentation
par: Li, Shan, et autres
Publié: (2024)
par: Li, Shan, et autres
Publié: (2024)
FG-Portrait: 3D Flow Guided Editable Portrait Animation
par: Xu, Yating, et autres
Publié: (2026)
par: Xu, Yating, et autres
Publié: (2026)
LMAD: Integrated End-to-End Vision-Language Model for Explainable Autonomous Driving
par: Song, Nan, et autres
Publié: (2025)
par: Song, Nan, et autres
Publié: (2025)
Unleashing Vision-Language Semantics for Deepfake Video Detection
par: Zhu, Jiawen, et autres
Publié: (2026)
par: Zhu, Jiawen, et autres
Publié: (2026)
High Dynamic Range 3D Gaussian Splatting via Luminance-Chromaticity Decomposition
par: Zhang, Kaixuan, et autres
Publié: (2025)
par: Zhang, Kaixuan, et autres
Publié: (2025)
FlexEdit: Flexible and Controllable Diffusion-based Object-centric Image Editing
par: Nguyen, Trong-Tung, et autres
Publié: (2024)
par: Nguyen, Trong-Tung, et autres
Publié: (2024)
Class and Region-Adaptive Constraints for Network Calibration
par: Murugesan, Balamurali, et autres
Publié: (2024)
par: Murugesan, Balamurali, et autres
Publié: (2024)
Robust Calibration of Large Vision-Language Adapters
par: Murugesan, Balamurali, et autres
Publié: (2024)
par: Murugesan, Balamurali, et autres
Publié: (2024)
GazeLT: Visual attention-guided long-tailed disease classification in chest radiographs
par: Bhattacharya, Moinak, et autres
Publié: (2025)
par: Bhattacharya, Moinak, et autres
Publié: (2025)
SAGS: Structure-Aware 3D Gaussian Splatting
par: Ververas, Evangelos, et autres
Publié: (2024)
par: Ververas, Evangelos, et autres
Publié: (2024)
ImHead: A Large-scale Implicit Morphable Model for Localized Head Modeling
par: Potamias, Rolandos Alexandros, et autres
Publié: (2025)
par: Potamias, Rolandos Alexandros, et autres
Publié: (2025)
ID-to-3D: Expressive ID-guided 3D Heads via Score Distillation Sampling
par: Babiloni, Francesca, et autres
Publié: (2024)
par: Babiloni, Francesca, et autres
Publié: (2024)
Improving face generation quality and prompt following with synthetic captions
par: Tarasiou, Michail, et autres
Publié: (2024)
par: Tarasiou, Michail, et autres
Publié: (2024)
Documents similaires
-
Adaptive Parametric Activation: Unifying and Generalising Activation Functions Across Tasks
par: Alexandridis, Konstantinos Panagiotis, et autres
Publié: (2024) -
G3DR: Generative 3D Reconstruction in ImageNet
par: Reddy, Pradyumna, et autres
Publié: (2024) -
$V_kD:$ Improving Knowledge Distillation using Orthogonal Projections
par: Miles, Roy, et autres
Publié: (2024) -
Deep Active Learning: A Reality Check
par: Gashi, Edrina, et autres
Publié: (2024) -
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections
par: Miles, Roy, et autres
Publié: (2024)