:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Ikechukwu, Nicholas, Nichols, Keanu, Ghadiyaram, Deepti, Plummer, Bryan A.
Format:	Preprint
Publié:	2026
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2605.12451
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Seeing Isn't Orienting: A Cognitively Grounded Benchmark Reveals Systematic Orientation Failures in MLLMs Supplementary
par: Tasnim, Nazia, et autres
Publié: (2026)

Seeing Isn't Orienting: A Cognitively Grounded Benchmark Reveals Systematic Orientation Failures in MLLMs
par: Tasnim, Nazia, et autres
Publié: (2025)

Concept Steerers: Leveraging K-Sparse Autoencoders for Test-Time Controllable Generations
par: Kim, Dahye, et autres
Publié: (2025)

A Systematic Study of Cross-Modal Typographic Attacks on Audio-Visual Reasoning
par: Chen, Tianle, et autres
Publié: (2026)

Multi-axis Analysis of Image Manipulation Localization
par: Nichols, Keanu, et autres
Publié: (2026)

What's in a Latent? Leveraging Diffusion Latent Space for Domain Generalization
par: Thomas, Xavier, et autres
Publié: (2025)

$\textit{Revelio}$: Interpreting and leveraging semantic information in diffusion models
par: Kim, Dahye, et autres
Publié: (2024)

DDiT: Dynamic Patch Scheduling for Efficient Diffusion Transformers
par: Kim, Dahye, et autres
Publié: (2026)

Improving Physical Object State Representation in Text-to-Image Generative Systems
par: Chen, Tianle, et autres
Publié: (2025)

Semantic Richness or Geometric Reasoning? The Fragility of VLM's Visual Invariance
par: Qiu, Jason, et autres
Publié: (2026)

Generative Action Tell-Tales: Assessing Human Motion in Synthesized Videos
par: Thomas, Xavier, et autres
Publié: (2025)

FAGER: Factually Grounded Evaluation and Refinement of Text-to-Image Models
par: Lim, Youngsun, et autres
Publié: (2026)

Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models
par: Saichandran, Ketan Suhaas, et autres
Publié: (2025)

Some Modalities are More Equal Than Others: Decoding and Architecting Multimodal Integration in MLLMs
par: Chen, Tianle, et autres
Publié: (2025)

CLAMP: Contrastive LAnguage Model Prompt-tuning
par: Teterwak, Piotr, et autres
Publié: (2023)

LNL+K: Enhancing Learning with Noisy Labels Through Noise Source Knowledge Integration
par: Wang, Siqi, et autres
Publié: (2023)

Strike a Balance in Continual Panoptic Segmentation
par: Chen, Jinpeng, et autres
Publié: (2024)

Depth-aware Panoptic Segmentation
par: Nguyen, Tuan, et autres
Publié: (2024)

ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning
par: Kim, Beomyoung, et autres
Publié: (2024)

Swift Sampling: Selecting Temporal Surprises via Taylor Series
par: Kim, Dahye, et autres
Publié: (2026)

PanopticPartFormer++: A Unified and Decoupled View for Panoptic Part Segmentation
par: Li, Xiangtai, et autres
Publié: (2023)

Open-World Panoptic Segmentation
par: Sodano, Matteo, et autres
Publié: (2024)

Scene-Centric Unsupervised Panoptic Segmentation
par: Hahn, Oliver, et autres
Publié: (2025)

Lidar Panoptic Segmentation in an Open World
par: Chakravarthy, Anirudh S, et autres
Publié: (2024)

RECAST: Reparameterized, Compact weight Adaptation for Sequential Tasks
par: Tasnim, Nazia, et autres
Publié: (2024)

Enhancing Feature Diversity Boosts Channel-Adaptive Vision Transformers
par: Pham, Chau, et autres
Publié: (2024)

CoDEPS: Online Continual Learning for Depth Estimation and Panoptic Segmentation
par: Vödisch, Niclas, et autres
Publié: (2023)

Decompose, Mix, Adapt: A Unified Framework for Parameter-Efficient Neural Network Recombination and Compression
par: Tasnim, Nazia, et autres
Publié: (2026)

PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion
par: Zhu, Runsong, et autres
Publié: (2024)

Benchmarking the Robustness of Panoptic Segmentation for Automated Driving
par: Wang, Yiting, et autres
Publié: (2024)

A Simple and Generalist Approach for Panoptic Segmentation
par: Prisadnikov, Nedyalko, et autres
Publié: (2024)

Tell Me What's Next: Textual Foresight for Generic UI Representations
par: Burns, Andrea, et autres
Publié: (2024)

PanopticRecon: Leverage Open-vocabulary Instance Segmentation for Zero-shot Panoptic Reconstruction
par: Yu, Xuan, et autres
Publié: (2024)

Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling
par: Li, Nannan, et autres
Publié: (2025)

Open Vocabulary Panoptic Segmentation With Retrieval Augmentation
par: Sadeq, Nafis, et autres
Publié: (2026)

PanDepth: Joint Panoptic Segmentation and Depth Completion
par: Lagos, Juan, et autres
Publié: (2022)

Zero-Shot 4D Lidar Panoptic Segmentation
par: Zhang, Yushan, et autres
Publié: (2025)

EOV-Seg: Efficient Open-Vocabulary Panoptic Segmentation
par: Niu, Hongwei, et autres
Publié: (2024)

PosSAM: Panoptic Open-vocabulary Segment Anything
par: VS, Vibashan, et autres
Publié: (2024)

Label-Efficient LiDAR Panoptic Segmentation
par: Çanakçı, Ahmet Selim, et autres
Publié: (2025)