Salvato in:
| Autori principali: | Mao, Qi, Yang, Tinghan, Li, Jiahao, Li, Bin, Jin, Libiao, Lu, Yan |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2509.22570 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
UniMIC: Towards Universal Multi-modality Perceptual Image Compression
di: Gao, Yixin, et al.
Pubblicazione: (2024)
di: Gao, Yixin, et al.
Pubblicazione: (2024)
Camera Artist: A Multi-Agent Framework for Cinematic Language Storytelling Video Generation
di: Hu, Haobo, et al.
Pubblicazione: (2026)
di: Hu, Haobo, et al.
Pubblicazione: (2026)
Generative Neural Video Compression via Video Diffusion Prior
di: Mao, Qi, et al.
Pubblicazione: (2025)
di: Mao, Qi, et al.
Pubblicazione: (2025)
IC-Effect: Precise and Efficient Video Effects Editing via In-Context Learning
di: Li, Yuanhang, et al.
Pubblicazione: (2025)
di: Li, Yuanhang, et al.
Pubblicazione: (2025)
UniHOI: Unified Human-Object Interaction Understanding via Unified Token Space
di: Yang, Panqi, et al.
Pubblicazione: (2025)
di: Yang, Panqi, et al.
Pubblicazione: (2025)
StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusing
di: Li, Yuanhang, et al.
Pubblicazione: (2024)
di: Li, Yuanhang, et al.
Pubblicazione: (2024)
UniWeTok: An Unified Binary Tokenizer with Codebook Size $\mathit{2^{128}}$ for Unified Multimodal Large Language Model
di: Zhuang, Shaobin, et al.
Pubblicazione: (2026)
di: Zhuang, Shaobin, et al.
Pubblicazione: (2026)
Causal Responsibility Attribution for Human-AI Collaboration
di: Qi, Yahang, et al.
Pubblicazione: (2024)
di: Qi, Yahang, et al.
Pubblicazione: (2024)
Interaction, Process, Infrastructure: A Unified Framework for Human-Agent Collaboration
di: Wang, Yun, et al.
Pubblicazione: (2025)
di: Wang, Yun, et al.
Pubblicazione: (2025)
CliqueParcel: An Approach For Batching LLM Prompts That Jointly Optimizes Efficiency And Faithfulness
di: Liu, Jiayi, et al.
Pubblicazione: (2024)
di: Liu, Jiayi, et al.
Pubblicazione: (2024)
GIA-MIC: Multimodal Emotion Recognition with Gated Interactive Attention and Modality-Invariant Learning Constraints
di: He, Jiajun, et al.
Pubblicazione: (2025)
di: He, Jiajun, et al.
Pubblicazione: (2025)
UniFluids: Unified Neural Operator Learning with Conditional Flow-matching
di: Li, Haosen, et al.
Pubblicazione: (2026)
di: Li, Haosen, et al.
Pubblicazione: (2026)
UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding
di: Jiao, Yang, et al.
Pubblicazione: (2025)
di: Jiao, Yang, et al.
Pubblicazione: (2025)
Correctness Learning: Deductive Verification Guided Learning for Human-AI Collaboration
di: Jin, Zhao, et al.
Pubblicazione: (2025)
di: Jin, Zhao, et al.
Pubblicazione: (2025)
CutVerse: A Compositional GUI Agents Benchmark for Media Post-Production Editing
di: Hu, Haobo, et al.
Pubblicazione: (2026)
di: Hu, Haobo, et al.
Pubblicazione: (2026)
CoMIC: Collaborative Memory and Insights Circulation for Long-Horizon LLM Agents in Cloud-Edge Systems
di: Wang, Yannan, et al.
Pubblicazione: (2026)
di: Wang, Yannan, et al.
Pubblicazione: (2026)
UniTok: A Unified Tokenizer for Visual Generation and Understanding
di: Ma, Chuofan, et al.
Pubblicazione: (2025)
di: Ma, Chuofan, et al.
Pubblicazione: (2025)
Divide, then Ground: Adapting Frame Selection to Query Types for Long-Form Video Understanding
di: Li, Jialuo, et al.
Pubblicazione: (2025)
di: Li, Jialuo, et al.
Pubblicazione: (2025)
From Charts to Code: A Hierarchical Benchmark for Multimodal Models
di: Tang, Jiahao, et al.
Pubblicazione: (2025)
di: Tang, Jiahao, et al.
Pubblicazione: (2025)
Multimodal Medical Code Tokenizer
di: Su, Xiaorui, et al.
Pubblicazione: (2025)
di: Su, Xiaorui, et al.
Pubblicazione: (2025)
UniCode: Learning a Unified Codebook for Multimodal Large Language Models
di: Zheng, Sipeng, et al.
Pubblicazione: (2024)
di: Zheng, Sipeng, et al.
Pubblicazione: (2024)
Deconstructing Human-AI Collaboration: Agency, Interaction, and Adaptation
di: Holter, Steffen, et al.
Pubblicazione: (2024)
di: Holter, Steffen, et al.
Pubblicazione: (2024)
Kaiwu: A Multimodal Manipulation Dataset and Framework for Robot Learning and Human-Robot Interaction
di: Jiang, Shuo, et al.
Pubblicazione: (2025)
di: Jiang, Shuo, et al.
Pubblicazione: (2025)
The AI Collaborator: Bridging Human-AI Interaction in Educational and Professional Settings
di: Samadi, Mohammad Amin, et al.
Pubblicazione: (2024)
di: Samadi, Mohammad Amin, et al.
Pubblicazione: (2024)
Human-Centered Human-AI Collaboration (HCHAC)
di: Gao, Qi, et al.
Pubblicazione: (2025)
di: Gao, Qi, et al.
Pubblicazione: (2025)
UniPose: A Unified Multimodal Framework for Human Pose Comprehension, Generation and Editing
di: Li, Yiheng, et al.
Pubblicazione: (2024)
di: Li, Yiheng, et al.
Pubblicazione: (2024)
KathDB: Explainable Multimodal Database Management System with Human-AI Collaboration
di: Xiao, Guorui, et al.
Pubblicazione: (2025)
di: Xiao, Guorui, et al.
Pubblicazione: (2025)
Multimodal Contrastive Learning via Uni-Modal Coding and Cross-Modal Prediction for Multimodal Sentiment Analysis
di: Lin, Ronghao, et al.
Pubblicazione: (2022)
di: Lin, Ronghao, et al.
Pubblicazione: (2022)
MiMIC: Mitigating Visual Modality Collapse in Universal Multimodal Retrieval While Avoiding Semantic Misalignment
di: Li, Juan, et al.
Pubblicazione: (2026)
di: Li, Juan, et al.
Pubblicazione: (2026)
Reliable AI Needs to Externalize Implicit Knowledge: A Human-AI Collaboration Perspective
di: Liu, Hengyu, et al.
Pubblicazione: (2026)
di: Liu, Hengyu, et al.
Pubblicazione: (2026)
Agentic AI as Undercover Teammates: Argumentative Knowledge Construction in Hybrid Human-AI Collaborative Learning
di: Yan, Lixiang, et al.
Pubblicazione: (2025)
di: Yan, Lixiang, et al.
Pubblicazione: (2025)
AXIS: Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents
di: Lu, Junting, et al.
Pubblicazione: (2024)
di: Lu, Junting, et al.
Pubblicazione: (2024)
Unbiased Collaborative Filtering with Fair Sampling
di: Liu, Jiahao, et al.
Pubblicazione: (2025)
di: Liu, Jiahao, et al.
Pubblicazione: (2025)
Mixed-Initiative Context: Structuring and Managing Context for Human-AI Collaboration
di: Li, Haichang, et al.
Pubblicazione: (2026)
di: Li, Haichang, et al.
Pubblicazione: (2026)
AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration
di: Liu, Jiaqi, et al.
Pubblicazione: (2026)
di: Liu, Jiaqi, et al.
Pubblicazione: (2026)
UniG2U-Bench: Do Unified Models Advance Multimodal Understanding?
di: Wen, Zimo, et al.
Pubblicazione: (2026)
di: Wen, Zimo, et al.
Pubblicazione: (2026)
RECODE-H: A Benchmark for Research Code Development with Interactive Human Feedback
di: Miao, Chunyu, et al.
Pubblicazione: (2025)
di: Miao, Chunyu, et al.
Pubblicazione: (2025)
AI Code in the Wild: Measuring Security Risks and Ecosystem Shifts of AI-Generated Code in Modern Software
di: Wang, Bin, et al.
Pubblicazione: (2025)
di: Wang, Bin, et al.
Pubblicazione: (2025)
CATP: Cross-Attention Token Pruning for Accuracy Preserved Multimodal Model Inference
di: Liao, Ruqi, et al.
Pubblicazione: (2024)
di: Liao, Ruqi, et al.
Pubblicazione: (2024)
Safe Multimodal Communication in Human-Robot Collaboration
di: Ferrari, Davide, et al.
Pubblicazione: (2023)
di: Ferrari, Davide, et al.
Pubblicazione: (2023)
Documenti analoghi
-
UniMIC: Towards Universal Multi-modality Perceptual Image Compression
di: Gao, Yixin, et al.
Pubblicazione: (2024) -
Camera Artist: A Multi-Agent Framework for Cinematic Language Storytelling Video Generation
di: Hu, Haobo, et al.
Pubblicazione: (2026) -
Generative Neural Video Compression via Video Diffusion Prior
di: Mao, Qi, et al.
Pubblicazione: (2025) -
IC-Effect: Precise and Efficient Video Effects Editing via In-Context Learning
di: Li, Yuanhang, et al.
Pubblicazione: (2025) -
UniHOI: Unified Human-Object Interaction Understanding via Unified Token Space
di: Yang, Panqi, et al.
Pubblicazione: (2025)