:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Yang, Zhifei, Lu, Keyang, Zhang, Chao, Qi, Jiaxing, Jiang, Hanqi, Ma, Ruifei, Yin, Shenglin, Xu, Yifan, Xing, Mingzhe, Xiao, Zhen, Long, Jieyi, Zhai, Guangyao
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition Artificial Intelligence Machine Learning
Accès en ligne:	https://arxiv.org/abs/2502.05874
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

FlowScene: Style-Consistent Indoor Scene Generation with Multimodal Graph Rectified Flow
par: Yang, Zhifei, et autres
Publié: (2026)

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion
par: Lu, Keyang, et autres
Publié: (2025)

Spatial 3D-LLM: Exploring Spatial Awareness in 3D Vision-Language Models
par: Wang, Xiaoyan, et autres
Publié: (2025)

CommonScenes: Generating Commonsense 3D Indoor Scenes with Scene Graph Diffusion
par: Zhai, Guangyao, et autres
Publié: (2023)

EchoScene: Indoor Scene Generation via Information Echo over Scene Graph Diffusion
par: Zhai, Guangyao, et autres
Publié: (2024)

Argus: Leveraging Multiview Images for Improved 3-D Scene Understanding With Large Language Models
par: Xu, Yifan, et autres
Publié: (2025)

DARA: Few-shot Budget Allocation in Online Advertising via In-Context Decision Making with RL-Finetuned LLMs
par: Song, Mingxuan, et autres
Publié: (2026)

3DMIT: 3D Multi-modal Instruction Tuning for Scene Understanding
par: Li, Zeju, et autres
Publié: (2024)

GeoGaussian: Geometry-aware Gaussian Splatting for Scene Rendering
par: Li, Yanyan, et autres
Publié: (2024)

Geometry-guided Feature Learning and Fusion for Indoor Scene Reconstruction
par: Yin, Ruihong, et autres
Publié: (2024)

SG-Tailor: Inter-Object Commonsense Relationship Reasoning for Scene Graph Manipulation
par: Shang, Haoliang, et autres
Publié: (2025)

Mixed Diffusion for 3D Indoor Scene Synthesis
par: Hu, Siyi, et autres
Publié: (2024)

SG-Bot: Object Rearrangement via Coarse-to-Fine Robotic Imagination on Scene Graphs
par: Zhai, Guangyao, et autres
Publié: (2023)

Expert Knowledge-Guided Decision Calibration for Accurate Fine-Grained Tree Species Classification
par: Long, Chen, et autres
Publié: (2026)

Mobile Robot Oriented Large-Scale Indoor Dataset for Dynamic Scene Understanding
par: Tang, Yifan, et autres
Publié: (2024)

Attention over Scene Graphs: Indoor Scene Representations Toward CSAI Classification
par: Barros, Artur, et autres
Publié: (2025)

A Local Differential Privacy Method With Layer‐Wise Importance Based on Fisher Information in Federated Recommendation Systems
par: Jieyi Yan, et autres
Publié: (2025)

GeoSceneGraph: Geometric Scene Graph Diffusion Model for Text-guided 3D Indoor Scene Synthesis
par: Ruiz, Antonio, et autres
Publié: (2025)

Inter-object Discriminative Graph Modeling for Indoor Scene Recognition
par: Song, Chuanxin, et autres
Publié: (2023)

Unsupervised Radio Map Construction in Mixed LoS/NLoS Indoor Environments
par: Xing, Zheng, et autres
Publié: (2025)

Open-Vocabulary Semantic Segmentation with Uncertainty Alignment for Robotic Scene Understanding in Indoor Building Environments
par: Xu, Yifan, et autres
Publié: (2025)

Contrast-X: A Multi-Modal Contrast Image Synthesis Benchmark and Universal Modality Flow Matching
par: Chen, Yifan, et autres
Publié: (2026)

Intelligent Spatial Perception by Building Hierarchical 3D Scene Graphs for Indoor Scenarios with the Help of LLMs
par: Cheng, Yao, et autres
Publié: (2025)

Autonomous Implicit Indoor Scene Reconstruction with Frontier Exploration
par: Zeng, Jing, et autres
Publié: (2024)

Video Perception Models for 3D Scene Synthesis
par: Huang, Rui, et autres
Publié: (2025)

What Makes a Scene ? Scene Graph-based Evaluation and Feedback for Controllable Generation
par: Chen, Zuyao, et autres
Publié: (2024)

InstructScene: Instruction-Driven 3D Indoor Scene Synthesis with Semantic Graph Prior
par: Lin, Chenguo, et autres
Publié: (2024)

Multi-Modal Representation Learning for Molecular Property Prediction: Sequence, Graph, Geometry
par: Wang, Zeyu, et autres
Publié: (2024)

Beyond Cross-Modal Alignment: Measuring and Leveraging Modality Gap in Vision-Language Models
par: Yan, Hanqi, et autres
Publié: (2025)

AV-Unified: A Unified Framework for Audio-visual Scene Understanding
par: Li, Guangyao, et autres
Publié: (2026)

Understanding the Weakness of Large Language Model Agents within a Complex Android Environment
par: Xing, Mingzhe, et autres
Publié: (2024)

Multi-Modal Scene Graph with Kolmogorov-Arnold Experts for Audio-Visual Question Answering
par: Fu, Zijian, et autres
Publié: (2025)

Infinigen Indoors: Photorealistic Indoor Scenes using Procedural Generation
par: Raistrick, Alexander, et autres
Publié: (2024)

LumiNet: Latent Intrinsics Meets Diffusion Models for Indoor Scene Relighting
par: Xing, Xiaoyan, et autres
Publié: (2024)

WHU-STree: A Multi-modal Benchmark Dataset for Street Tree Inventory
par: Ding, Ruifei, et autres
Publié: (2025)

Global-Local Tree Search in VLMs for 3D Indoor Scene Generation
par: Deng, Wei, et autres
Publié: (2025)

RoomCraft: Controllable and Complete 3D Indoor Scene Generation
par: Zhou, Mengqi, et autres
Publié: (2025)

CMIP-CIL: A Cross-Modal Benchmark for Image-Point Class Incremental Learning
par: Qi, Chao, et autres
Publié: (2025)

Complex-Valued Neural Network based Federated Learning for Multi-user Indoor Positioning Performance Optimization
par: Yu, Hanzhi, et autres
Publié: (2024)

Open-Vocabulary Indoor Object Grounding with 3D Hierarchical Scene Graph
par: Linok, Sergey, et autres
Publié: (2025)