Enregistré dans:
| Auteurs principaux: | Yang, Zhifei, Lu, Keyang, Zhang, Chao, Qi, Jiaxing, Jiang, Hanqi, Ma, Ruifei, Yin, Shenglin, Xu, Yifan, Xing, Mingzhe, Xiao, Zhen, Long, Jieyi, Zhai, Guangyao |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2502.05874 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
FlowScene: Style-Consistent Indoor Scene Generation with Multimodal Graph Rectified Flow
par: Yang, Zhifei, et autres
Publié: (2026)
par: Yang, Zhifei, et autres
Publié: (2026)
Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion
par: Lu, Keyang, et autres
Publié: (2025)
par: Lu, Keyang, et autres
Publié: (2025)
Spatial 3D-LLM: Exploring Spatial Awareness in 3D Vision-Language Models
par: Wang, Xiaoyan, et autres
Publié: (2025)
par: Wang, Xiaoyan, et autres
Publié: (2025)
CommonScenes: Generating Commonsense 3D Indoor Scenes with Scene Graph Diffusion
par: Zhai, Guangyao, et autres
Publié: (2023)
par: Zhai, Guangyao, et autres
Publié: (2023)
EchoScene: Indoor Scene Generation via Information Echo over Scene Graph Diffusion
par: Zhai, Guangyao, et autres
Publié: (2024)
par: Zhai, Guangyao, et autres
Publié: (2024)
Argus: Leveraging Multiview Images for Improved 3-D Scene Understanding With Large Language Models
par: Xu, Yifan, et autres
Publié: (2025)
par: Xu, Yifan, et autres
Publié: (2025)
DARA: Few-shot Budget Allocation in Online Advertising via In-Context Decision Making with RL-Finetuned LLMs
par: Song, Mingxuan, et autres
Publié: (2026)
par: Song, Mingxuan, et autres
Publié: (2026)
3DMIT: 3D Multi-modal Instruction Tuning for Scene Understanding
par: Li, Zeju, et autres
Publié: (2024)
par: Li, Zeju, et autres
Publié: (2024)
GeoGaussian: Geometry-aware Gaussian Splatting for Scene Rendering
par: Li, Yanyan, et autres
Publié: (2024)
par: Li, Yanyan, et autres
Publié: (2024)
Geometry-guided Feature Learning and Fusion for Indoor Scene Reconstruction
par: Yin, Ruihong, et autres
Publié: (2024)
par: Yin, Ruihong, et autres
Publié: (2024)
SG-Tailor: Inter-Object Commonsense Relationship Reasoning for Scene Graph Manipulation
par: Shang, Haoliang, et autres
Publié: (2025)
par: Shang, Haoliang, et autres
Publié: (2025)
Mixed Diffusion for 3D Indoor Scene Synthesis
par: Hu, Siyi, et autres
Publié: (2024)
par: Hu, Siyi, et autres
Publié: (2024)
SG-Bot: Object Rearrangement via Coarse-to-Fine Robotic Imagination on Scene Graphs
par: Zhai, Guangyao, et autres
Publié: (2023)
par: Zhai, Guangyao, et autres
Publié: (2023)
Expert Knowledge-Guided Decision Calibration for Accurate Fine-Grained Tree Species Classification
par: Long, Chen, et autres
Publié: (2026)
par: Long, Chen, et autres
Publié: (2026)
Mobile Robot Oriented Large-Scale Indoor Dataset for Dynamic Scene Understanding
par: Tang, Yifan, et autres
Publié: (2024)
par: Tang, Yifan, et autres
Publié: (2024)
Attention over Scene Graphs: Indoor Scene Representations Toward CSAI Classification
par: Barros, Artur, et autres
Publié: (2025)
par: Barros, Artur, et autres
Publié: (2025)
A Local Differential Privacy Method With Layer‐Wise Importance Based on Fisher Information in Federated Recommendation Systems
par: Jieyi Yan, et autres
Publié: (2025)
par: Jieyi Yan, et autres
Publié: (2025)
GeoSceneGraph: Geometric Scene Graph Diffusion Model for Text-guided 3D Indoor Scene Synthesis
par: Ruiz, Antonio, et autres
Publié: (2025)
par: Ruiz, Antonio, et autres
Publié: (2025)
Inter-object Discriminative Graph Modeling for Indoor Scene Recognition
par: Song, Chuanxin, et autres
Publié: (2023)
par: Song, Chuanxin, et autres
Publié: (2023)
Unsupervised Radio Map Construction in Mixed LoS/NLoS Indoor Environments
par: Xing, Zheng, et autres
Publié: (2025)
par: Xing, Zheng, et autres
Publié: (2025)
Open-Vocabulary Semantic Segmentation with Uncertainty Alignment for Robotic Scene Understanding in Indoor Building Environments
par: Xu, Yifan, et autres
Publié: (2025)
par: Xu, Yifan, et autres
Publié: (2025)
Contrast-X: A Multi-Modal Contrast Image Synthesis Benchmark and Universal Modality Flow Matching
par: Chen, Yifan, et autres
Publié: (2026)
par: Chen, Yifan, et autres
Publié: (2026)
Intelligent Spatial Perception by Building Hierarchical 3D Scene Graphs for Indoor Scenarios with the Help of LLMs
par: Cheng, Yao, et autres
Publié: (2025)
par: Cheng, Yao, et autres
Publié: (2025)
Autonomous Implicit Indoor Scene Reconstruction with Frontier Exploration
par: Zeng, Jing, et autres
Publié: (2024)
par: Zeng, Jing, et autres
Publié: (2024)
Video Perception Models for 3D Scene Synthesis
par: Huang, Rui, et autres
Publié: (2025)
par: Huang, Rui, et autres
Publié: (2025)
What Makes a Scene ? Scene Graph-based Evaluation and Feedback for Controllable Generation
par: Chen, Zuyao, et autres
Publié: (2024)
par: Chen, Zuyao, et autres
Publié: (2024)
InstructScene: Instruction-Driven 3D Indoor Scene Synthesis with Semantic Graph Prior
par: Lin, Chenguo, et autres
Publié: (2024)
par: Lin, Chenguo, et autres
Publié: (2024)
Multi-Modal Representation Learning for Molecular Property Prediction: Sequence, Graph, Geometry
par: Wang, Zeyu, et autres
Publié: (2024)
par: Wang, Zeyu, et autres
Publié: (2024)
Beyond Cross-Modal Alignment: Measuring and Leveraging Modality Gap in Vision-Language Models
par: Yan, Hanqi, et autres
Publié: (2025)
par: Yan, Hanqi, et autres
Publié: (2025)
AV-Unified: A Unified Framework for Audio-visual Scene Understanding
par: Li, Guangyao, et autres
Publié: (2026)
par: Li, Guangyao, et autres
Publié: (2026)
Understanding the Weakness of Large Language Model Agents within a Complex Android Environment
par: Xing, Mingzhe, et autres
Publié: (2024)
par: Xing, Mingzhe, et autres
Publié: (2024)
Multi-Modal Scene Graph with Kolmogorov-Arnold Experts for Audio-Visual Question Answering
par: Fu, Zijian, et autres
Publié: (2025)
par: Fu, Zijian, et autres
Publié: (2025)
Infinigen Indoors: Photorealistic Indoor Scenes using Procedural Generation
par: Raistrick, Alexander, et autres
Publié: (2024)
par: Raistrick, Alexander, et autres
Publié: (2024)
LumiNet: Latent Intrinsics Meets Diffusion Models for Indoor Scene Relighting
par: Xing, Xiaoyan, et autres
Publié: (2024)
par: Xing, Xiaoyan, et autres
Publié: (2024)
WHU-STree: A Multi-modal Benchmark Dataset for Street Tree Inventory
par: Ding, Ruifei, et autres
Publié: (2025)
par: Ding, Ruifei, et autres
Publié: (2025)
Global-Local Tree Search in VLMs for 3D Indoor Scene Generation
par: Deng, Wei, et autres
Publié: (2025)
par: Deng, Wei, et autres
Publié: (2025)
RoomCraft: Controllable and Complete 3D Indoor Scene Generation
par: Zhou, Mengqi, et autres
Publié: (2025)
par: Zhou, Mengqi, et autres
Publié: (2025)
CMIP-CIL: A Cross-Modal Benchmark for Image-Point Class Incremental Learning
par: Qi, Chao, et autres
Publié: (2025)
par: Qi, Chao, et autres
Publié: (2025)
Complex-Valued Neural Network based Federated Learning for Multi-user Indoor Positioning Performance Optimization
par: Yu, Hanzhi, et autres
Publié: (2024)
par: Yu, Hanzhi, et autres
Publié: (2024)
Open-Vocabulary Indoor Object Grounding with 3D Hierarchical Scene Graph
par: Linok, Sergey, et autres
Publié: (2025)
par: Linok, Sergey, et autres
Publié: (2025)
Documents similaires
-
FlowScene: Style-Consistent Indoor Scene Generation with Multimodal Graph Rectified Flow
par: Yang, Zhifei, et autres
Publié: (2026) -
Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion
par: Lu, Keyang, et autres
Publié: (2025) -
Spatial 3D-LLM: Exploring Spatial Awareness in 3D Vision-Language Models
par: Wang, Xiaoyan, et autres
Publié: (2025) -
CommonScenes: Generating Commonsense 3D Indoor Scenes with Scene Graph Diffusion
par: Zhai, Guangyao, et autres
Publié: (2023) -
EchoScene: Indoor Scene Generation via Information Echo over Scene Graph Diffusion
par: Zhai, Guangyao, et autres
Publié: (2024)