Enregistré dans:
| Auteurs principaux: | Ikechukwu, Nicholas, Nichols, Keanu, Ghadiyaram, Deepti, Plummer, Bryan A. |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2605.12451 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Seeing Isn't Orienting: A Cognitively Grounded Benchmark Reveals Systematic Orientation Failures in MLLMs Supplementary
par: Tasnim, Nazia, et autres
Publié: (2026)
par: Tasnim, Nazia, et autres
Publié: (2026)
Seeing Isn't Orienting: A Cognitively Grounded Benchmark Reveals Systematic Orientation Failures in MLLMs
par: Tasnim, Nazia, et autres
Publié: (2025)
par: Tasnim, Nazia, et autres
Publié: (2025)
Concept Steerers: Leveraging K-Sparse Autoencoders for Test-Time Controllable Generations
par: Kim, Dahye, et autres
Publié: (2025)
par: Kim, Dahye, et autres
Publié: (2025)
A Systematic Study of Cross-Modal Typographic Attacks on Audio-Visual Reasoning
par: Chen, Tianle, et autres
Publié: (2026)
par: Chen, Tianle, et autres
Publié: (2026)
Multi-axis Analysis of Image Manipulation Localization
par: Nichols, Keanu, et autres
Publié: (2026)
par: Nichols, Keanu, et autres
Publié: (2026)
What's in a Latent? Leveraging Diffusion Latent Space for Domain Generalization
par: Thomas, Xavier, et autres
Publié: (2025)
par: Thomas, Xavier, et autres
Publié: (2025)
$\textit{Revelio}$: Interpreting and leveraging semantic information in diffusion models
par: Kim, Dahye, et autres
Publié: (2024)
par: Kim, Dahye, et autres
Publié: (2024)
DDiT: Dynamic Patch Scheduling for Efficient Diffusion Transformers
par: Kim, Dahye, et autres
Publié: (2026)
par: Kim, Dahye, et autres
Publié: (2026)
Improving Physical Object State Representation in Text-to-Image Generative Systems
par: Chen, Tianle, et autres
Publié: (2025)
par: Chen, Tianle, et autres
Publié: (2025)
Semantic Richness or Geometric Reasoning? The Fragility of VLM's Visual Invariance
par: Qiu, Jason, et autres
Publié: (2026)
par: Qiu, Jason, et autres
Publié: (2026)
Generative Action Tell-Tales: Assessing Human Motion in Synthesized Videos
par: Thomas, Xavier, et autres
Publié: (2025)
par: Thomas, Xavier, et autres
Publié: (2025)
FAGER: Factually Grounded Evaluation and Refinement of Text-to-Image Models
par: Lim, Youngsun, et autres
Publié: (2026)
par: Lim, Youngsun, et autres
Publié: (2026)
Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models
par: Saichandran, Ketan Suhaas, et autres
Publié: (2025)
par: Saichandran, Ketan Suhaas, et autres
Publié: (2025)
Some Modalities are More Equal Than Others: Decoding and Architecting Multimodal Integration in MLLMs
par: Chen, Tianle, et autres
Publié: (2025)
par: Chen, Tianle, et autres
Publié: (2025)
CLAMP: Contrastive LAnguage Model Prompt-tuning
par: Teterwak, Piotr, et autres
Publié: (2023)
par: Teterwak, Piotr, et autres
Publié: (2023)
LNL+K: Enhancing Learning with Noisy Labels Through Noise Source Knowledge Integration
par: Wang, Siqi, et autres
Publié: (2023)
par: Wang, Siqi, et autres
Publié: (2023)
Strike a Balance in Continual Panoptic Segmentation
par: Chen, Jinpeng, et autres
Publié: (2024)
par: Chen, Jinpeng, et autres
Publié: (2024)
Depth-aware Panoptic Segmentation
par: Nguyen, Tuan, et autres
Publié: (2024)
par: Nguyen, Tuan, et autres
Publié: (2024)
ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning
par: Kim, Beomyoung, et autres
Publié: (2024)
par: Kim, Beomyoung, et autres
Publié: (2024)
Swift Sampling: Selecting Temporal Surprises via Taylor Series
par: Kim, Dahye, et autres
Publié: (2026)
par: Kim, Dahye, et autres
Publié: (2026)
PanopticPartFormer++: A Unified and Decoupled View for Panoptic Part Segmentation
par: Li, Xiangtai, et autres
Publié: (2023)
par: Li, Xiangtai, et autres
Publié: (2023)
Open-World Panoptic Segmentation
par: Sodano, Matteo, et autres
Publié: (2024)
par: Sodano, Matteo, et autres
Publié: (2024)
Scene-Centric Unsupervised Panoptic Segmentation
par: Hahn, Oliver, et autres
Publié: (2025)
par: Hahn, Oliver, et autres
Publié: (2025)
Lidar Panoptic Segmentation in an Open World
par: Chakravarthy, Anirudh S, et autres
Publié: (2024)
par: Chakravarthy, Anirudh S, et autres
Publié: (2024)
RECAST: Reparameterized, Compact weight Adaptation for Sequential Tasks
par: Tasnim, Nazia, et autres
Publié: (2024)
par: Tasnim, Nazia, et autres
Publié: (2024)
Enhancing Feature Diversity Boosts Channel-Adaptive Vision Transformers
par: Pham, Chau, et autres
Publié: (2024)
par: Pham, Chau, et autres
Publié: (2024)
CoDEPS: Online Continual Learning for Depth Estimation and Panoptic Segmentation
par: Vödisch, Niclas, et autres
Publié: (2023)
par: Vödisch, Niclas, et autres
Publié: (2023)
Decompose, Mix, Adapt: A Unified Framework for Parameter-Efficient Neural Network Recombination and Compression
par: Tasnim, Nazia, et autres
Publié: (2026)
par: Tasnim, Nazia, et autres
Publié: (2026)
PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion
par: Zhu, Runsong, et autres
Publié: (2024)
par: Zhu, Runsong, et autres
Publié: (2024)
Benchmarking the Robustness of Panoptic Segmentation for Automated Driving
par: Wang, Yiting, et autres
Publié: (2024)
par: Wang, Yiting, et autres
Publié: (2024)
A Simple and Generalist Approach for Panoptic Segmentation
par: Prisadnikov, Nedyalko, et autres
Publié: (2024)
par: Prisadnikov, Nedyalko, et autres
Publié: (2024)
Tell Me What's Next: Textual Foresight for Generic UI Representations
par: Burns, Andrea, et autres
Publié: (2024)
par: Burns, Andrea, et autres
Publié: (2024)
PanopticRecon: Leverage Open-vocabulary Instance Segmentation for Zero-shot Panoptic Reconstruction
par: Yu, Xuan, et autres
Publié: (2024)
par: Yu, Xuan, et autres
Publié: (2024)
Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling
par: Li, Nannan, et autres
Publié: (2025)
par: Li, Nannan, et autres
Publié: (2025)
Open Vocabulary Panoptic Segmentation With Retrieval Augmentation
par: Sadeq, Nafis, et autres
Publié: (2026)
par: Sadeq, Nafis, et autres
Publié: (2026)
PanDepth: Joint Panoptic Segmentation and Depth Completion
par: Lagos, Juan, et autres
Publié: (2022)
par: Lagos, Juan, et autres
Publié: (2022)
Zero-Shot 4D Lidar Panoptic Segmentation
par: Zhang, Yushan, et autres
Publié: (2025)
par: Zhang, Yushan, et autres
Publié: (2025)
EOV-Seg: Efficient Open-Vocabulary Panoptic Segmentation
par: Niu, Hongwei, et autres
Publié: (2024)
par: Niu, Hongwei, et autres
Publié: (2024)
PosSAM: Panoptic Open-vocabulary Segment Anything
par: VS, Vibashan, et autres
Publié: (2024)
par: VS, Vibashan, et autres
Publié: (2024)
Label-Efficient LiDAR Panoptic Segmentation
par: Çanakçı, Ahmet Selim, et autres
Publié: (2025)
par: Çanakçı, Ahmet Selim, et autres
Publié: (2025)
Documents similaires
-
Seeing Isn't Orienting: A Cognitively Grounded Benchmark Reveals Systematic Orientation Failures in MLLMs Supplementary
par: Tasnim, Nazia, et autres
Publié: (2026) -
Seeing Isn't Orienting: A Cognitively Grounded Benchmark Reveals Systematic Orientation Failures in MLLMs
par: Tasnim, Nazia, et autres
Publié: (2025) -
Concept Steerers: Leveraging K-Sparse Autoencoders for Test-Time Controllable Generations
par: Kim, Dahye, et autres
Publié: (2025) -
A Systematic Study of Cross-Modal Typographic Attacks on Audio-Visual Reasoning
par: Chen, Tianle, et autres
Publié: (2026) -
Multi-axis Analysis of Image Manipulation Localization
par: Nichols, Keanu, et autres
Publié: (2026)