Enregistré dans:
| Auteurs principaux: | Wang, Siqi, Liang, Chao, Gao, Yunfan, Yu, Erxin, Li, Sen, Li, Yushi, Li, Jing, Wang, Haofen |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2512.16755 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Decoding Urban Industrial Complexity: Enhancing Knowledge-Driven Insights via IndustryScopeGPT
par: Wang, Siqi, et autres
Publié: (2024)
par: Wang, Siqi, et autres
Publié: (2024)
StePO-Rec: Towards Personalized Outfit Styling Assistant via Knowledge-Guided Multi-Step Reasoning
par: Bi, Yuxi, et autres
Publié: (2025)
par: Bi, Yuxi, et autres
Publié: (2025)
HingeMem: Boundary Guided Long-Term Memory with Query Adaptive Retrieval for Scalable Dialogues
par: Zhong, Yijie, et autres
Publié: (2026)
par: Zhong, Yijie, et autres
Publié: (2026)
"Less is More": Reducing Cognitive Load and Task Drift in Real-Time Multimodal Assistive Agents for the Visually Impaired
par: Zhao, Yi, et autres
Publié: (2025)
par: Zhao, Yi, et autres
Publié: (2025)
Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks
par: Gao, Yunfan, et autres
Publié: (2024)
par: Gao, Yunfan, et autres
Publié: (2024)
CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
par: Liu, Xinhao, et autres
Publié: (2024)
par: Liu, Xinhao, et autres
Publié: (2024)
Hierarchical Textual Knowledge for Enhanced Image Clustering
par: Zhong, Yijie, et autres
Publié: (2026)
par: Zhong, Yijie, et autres
Publié: (2026)
CoSafe: Evaluating Large Language Model Safety in Multi-Turn Dialogue Coreference
par: Yu, Erxin, et autres
Publié: (2024)
par: Yu, Erxin, et autres
Publié: (2024)
U-NIAH: Unified RAG and LLM Evaluation for Long Context Needle-In-A-Haystack
par: Gao, Yunfan, et autres
Publié: (2025)
par: Gao, Yunfan, et autres
Publié: (2025)
PopALM: Popularity-Aligned Language Models for Social Media Trendy Response Prediction
par: Yu, Erxin, et autres
Publié: (2024)
par: Yu, Erxin, et autres
Publié: (2024)
Embodied Science: Closing the Discovery Loop with Agentic Embodied AI
par: Zhuang, Xiang, et autres
Publié: (2026)
par: Zhuang, Xiang, et autres
Publié: (2026)
A Visually Impaired Assistance Benchmark for VLM-as-a-Judge Evaluation
par: Zhao, Yi, et autres
Publié: (2026)
par: Zhao, Yi, et autres
Publié: (2026)
Synergizing RAG and Reasoning: A Systematic Review
par: Gao, Yunfan, et autres
Publié: (2025)
par: Gao, Yunfan, et autres
Publié: (2025)
Embodied Navigation Foundation Model
par: Zhang, Jiazhao, et autres
Publié: (2025)
par: Zhang, Jiazhao, et autres
Publié: (2025)
Search is All You Need for Few-shot Anomaly Detection
par: Wang, Qishan, et autres
Publié: (2025)
par: Wang, Qishan, et autres
Publié: (2025)
How Do Humans Write Code? Large Models Do It the Same Way Too
par: Li, Long, et autres
Publié: (2024)
par: Li, Long, et autres
Publié: (2024)
How Far Are Large Multimodal Models from Human-Level Spatial Action? A Benchmark for Goal-Oriented Embodied Navigation in Urban Airspace
par: Zhao, Baining, et autres
Publié: (2026)
par: Zhao, Baining, et autres
Publié: (2026)
LaF-GRPO: In-Situ Navigation Instruction Generation for the Visually Impaired via GRPO with LLM-as-Follower Reward
par: Zhao, Yi, et autres
Publié: (2025)
par: Zhao, Yi, et autres
Publié: (2025)
PathSeeker: Exploring LLM Security Vulnerabilities with a Reinforcement Learning-Based Jailbreak Approach
par: Lin, Zhihao, et autres
Publié: (2024)
par: Lin, Zhihao, et autres
Publié: (2024)
Agentic Self-Evolutionary Replanning for Embodied Navigation
par: Li, Guoliang, et autres
Publié: (2026)
par: Li, Guoliang, et autres
Publié: (2026)
OctoNav: Towards Generalist Embodied Navigation
par: Gao, Chen, et autres
Publié: (2025)
par: Gao, Chen, et autres
Publié: (2025)
FloNa: Floor Plan Guided Embodied Visual Navigation
par: Li, Jiaxin, et autres
Publié: (2024)
par: Li, Jiaxin, et autres
Publié: (2024)
HCSG: Human-Centric Semantic-Geometric Reasoning for Vision-Language Navigation
par: Xu, Haoxuan, et autres
Publié: (2026)
par: Xu, Haoxuan, et autres
Publié: (2026)
Triple-BERT: Do We Really Need MARL for Order Dispatch on Ride-Sharing Platforms?
par: Zhao, Zijian, et autres
Publié: (2025)
par: Zhao, Zijian, et autres
Publié: (2025)
EmbodiedCity: A Benchmark Platform for Embodied Agent in Real-world City Environment
par: Gao, Chen, et autres
Publié: (2024)
par: Gao, Chen, et autres
Publié: (2024)
Vision-Language Navigation with Embodied Intelligence: A Survey
par: Gao, Peng, et autres
Publié: (2024)
par: Gao, Peng, et autres
Publié: (2024)
CityGPT: Empowering Urban Spatial Cognition of Large Language Models
par: Feng, Jie, et autres
Publié: (2024)
par: Feng, Jie, et autres
Publié: (2024)
MetaUrban: An Embodied AI Simulation Platform for Urban Micromobility
par: Wu, Wayne, et autres
Publié: (2024)
par: Wu, Wayne, et autres
Publié: (2024)
HIMM: Human-Inspired Long-Term Memory Modeling for Embodied Exploration and Question Answering
par: Li, Ji, et autres
Publié: (2026)
par: Li, Ji, et autres
Publié: (2026)
How Does the Uncertainty of Regulatory Policy in Exchange Rates Affect Firm Innovation Performance? Evidence From China
par: Mengjun Huo, et autres
Publié: (2025)
par: Mengjun Huo, et autres
Publié: (2025)
Performance is not All You Need: Sustainability Considerations for Algorithms
par: Li, Xiang, et autres
Publié: (2025)
par: Li, Xiang, et autres
Publié: (2025)
IndustryNav: Exploring Spatial Reasoning of Embodied Agents in Dynamic Industrial Navigation
par: Li, Yifan, et autres
Publié: (2025)
par: Li, Yifan, et autres
Publié: (2025)
How do Transformers Learn Implicit Reasoning?
par: Ye, Jiaran, et autres
Publié: (2025)
par: Ye, Jiaran, et autres
Publié: (2025)
NavBench: Probing Multimodal Large Language Models for Embodied Navigation
par: Qiao, Yanyuan, et autres
Publié: (2025)
par: Qiao, Yanyuan, et autres
Publié: (2025)
Revisit Event Generation Model: Self-Supervised Learning of Event-to-Video Reconstruction with Implicit Neural Representations
par: Wang, Zipeng, et autres
Publié: (2024)
par: Wang, Zipeng, et autres
Publié: (2024)
UrbanVideo-Bench: Benchmarking Vision-Language Models on Embodied Intelligence with Video Data in Urban Spaces
par: Zhao, Baining, et autres
Publié: (2025)
par: Zhao, Baining, et autres
Publié: (2025)
Retrieval-Augmented Generation for Large Language Models: A Survey
par: Gao, Yunfan, et autres
Publié: (2023)
par: Gao, Yunfan, et autres
Publié: (2023)
Advances in Embodied Navigation Using Large Language Models: A Survey
par: Lin, Jinzhou, et autres
Publié: (2023)
par: Lin, Jinzhou, et autres
Publié: (2023)
UrbanNav: Learning Language-Guided Urban Navigation from Web-Scale Human Trajectories
par: Mei, Yanghong, et autres
Publié: (2025)
par: Mei, Yanghong, et autres
Publié: (2025)
NavTrust: Benchmarking Trustworthiness for Embodied Navigation
par: Jiang, Huaide, et autres
Publié: (2026)
par: Jiang, Huaide, et autres
Publié: (2026)
Documents similaires
-
Decoding Urban Industrial Complexity: Enhancing Knowledge-Driven Insights via IndustryScopeGPT
par: Wang, Siqi, et autres
Publié: (2024) -
StePO-Rec: Towards Personalized Outfit Styling Assistant via Knowledge-Guided Multi-Step Reasoning
par: Bi, Yuxi, et autres
Publié: (2025) -
HingeMem: Boundary Guided Long-Term Memory with Query Adaptive Retrieval for Scalable Dialogues
par: Zhong, Yijie, et autres
Publié: (2026) -
"Less is More": Reducing Cognitive Load and Task Drift in Real-Time Multimodal Assistive Agents for the Visually Impaired
par: Zhao, Yi, et autres
Publié: (2025) -
Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks
par: Gao, Yunfan, et autres
Publié: (2024)