:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Mao, Qi, Yang, Tinghan, Li, Jiahao, Li, Bin, Jin, Libiao, Lu, Yan
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2509.22570
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

UniMIC: Towards Universal Multi-modality Perceptual Image Compression
di: Gao, Yixin, et al.
Pubblicazione: (2024)

Camera Artist: A Multi-Agent Framework for Cinematic Language Storytelling Video Generation
di: Hu, Haobo, et al.
Pubblicazione: (2026)

Generative Neural Video Compression via Video Diffusion Prior
di: Mao, Qi, et al.
Pubblicazione: (2025)

IC-Effect: Precise and Efficient Video Effects Editing via In-Context Learning
di: Li, Yuanhang, et al.
Pubblicazione: (2025)

UniHOI: Unified Human-Object Interaction Understanding via Unified Token Space
di: Yang, Panqi, et al.
Pubblicazione: (2025)

StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusing
di: Li, Yuanhang, et al.
Pubblicazione: (2024)

UniWeTok: An Unified Binary Tokenizer with Codebook Size $\mathit{2^{128}}$ for Unified Multimodal Large Language Model
di: Zhuang, Shaobin, et al.
Pubblicazione: (2026)

Causal Responsibility Attribution for Human-AI Collaboration
di: Qi, Yahang, et al.
Pubblicazione: (2024)

Interaction, Process, Infrastructure: A Unified Framework for Human-Agent Collaboration
di: Wang, Yun, et al.
Pubblicazione: (2025)

CliqueParcel: An Approach For Batching LLM Prompts That Jointly Optimizes Efficiency And Faithfulness
di: Liu, Jiayi, et al.
Pubblicazione: (2024)

GIA-MIC: Multimodal Emotion Recognition with Gated Interactive Attention and Modality-Invariant Learning Constraints
di: He, Jiajun, et al.
Pubblicazione: (2025)

UniFluids: Unified Neural Operator Learning with Conditional Flow-matching
di: Li, Haosen, et al.
Pubblicazione: (2026)

UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding
di: Jiao, Yang, et al.
Pubblicazione: (2025)

Correctness Learning: Deductive Verification Guided Learning for Human-AI Collaboration
di: Jin, Zhao, et al.
Pubblicazione: (2025)

CutVerse: A Compositional GUI Agents Benchmark for Media Post-Production Editing
di: Hu, Haobo, et al.
Pubblicazione: (2026)

CoMIC: Collaborative Memory and Insights Circulation for Long-Horizon LLM Agents in Cloud-Edge Systems
di: Wang, Yannan, et al.
Pubblicazione: (2026)

UniTok: A Unified Tokenizer for Visual Generation and Understanding
di: Ma, Chuofan, et al.
Pubblicazione: (2025)

Divide, then Ground: Adapting Frame Selection to Query Types for Long-Form Video Understanding
di: Li, Jialuo, et al.
Pubblicazione: (2025)

From Charts to Code: A Hierarchical Benchmark for Multimodal Models
di: Tang, Jiahao, et al.
Pubblicazione: (2025)

Multimodal Medical Code Tokenizer
di: Su, Xiaorui, et al.
Pubblicazione: (2025)

UniCode: Learning a Unified Codebook for Multimodal Large Language Models
di: Zheng, Sipeng, et al.
Pubblicazione: (2024)

Deconstructing Human-AI Collaboration: Agency, Interaction, and Adaptation
di: Holter, Steffen, et al.
Pubblicazione: (2024)

Kaiwu: A Multimodal Manipulation Dataset and Framework for Robot Learning and Human-Robot Interaction
di: Jiang, Shuo, et al.
Pubblicazione: (2025)

The AI Collaborator: Bridging Human-AI Interaction in Educational and Professional Settings
di: Samadi, Mohammad Amin, et al.
Pubblicazione: (2024)

Human-Centered Human-AI Collaboration (HCHAC)
di: Gao, Qi, et al.
Pubblicazione: (2025)

UniPose: A Unified Multimodal Framework for Human Pose Comprehension, Generation and Editing
di: Li, Yiheng, et al.
Pubblicazione: (2024)

KathDB: Explainable Multimodal Database Management System with Human-AI Collaboration
di: Xiao, Guorui, et al.
Pubblicazione: (2025)

Multimodal Contrastive Learning via Uni-Modal Coding and Cross-Modal Prediction for Multimodal Sentiment Analysis
di: Lin, Ronghao, et al.
Pubblicazione: (2022)

MiMIC: Mitigating Visual Modality Collapse in Universal Multimodal Retrieval While Avoiding Semantic Misalignment
di: Li, Juan, et al.
Pubblicazione: (2026)

Reliable AI Needs to Externalize Implicit Knowledge: A Human-AI Collaboration Perspective
di: Liu, Hengyu, et al.
Pubblicazione: (2026)

Agentic AI as Undercover Teammates: Argumentative Knowledge Construction in Hybrid Human-AI Collaborative Learning
di: Yan, Lixiang, et al.
Pubblicazione: (2025)

AXIS: Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents
di: Lu, Junting, et al.
Pubblicazione: (2024)

Unbiased Collaborative Filtering with Fair Sampling
di: Liu, Jiahao, et al.
Pubblicazione: (2025)

Mixed-Initiative Context: Structuring and Managing Context for Human-AI Collaboration
di: Li, Haichang, et al.
Pubblicazione: (2026)

AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration
di: Liu, Jiaqi, et al.
Pubblicazione: (2026)

UniG2U-Bench: Do Unified Models Advance Multimodal Understanding?
di: Wen, Zimo, et al.
Pubblicazione: (2026)

RECODE-H: A Benchmark for Research Code Development with Interactive Human Feedback
di: Miao, Chunyu, et al.
Pubblicazione: (2025)

AI Code in the Wild: Measuring Security Risks and Ecosystem Shifts of AI-Generated Code in Modern Software
di: Wang, Bin, et al.
Pubblicazione: (2025)

CATP: Cross-Attention Token Pruning for Accuracy Preserved Multimodal Model Inference
di: Liao, Ruqi, et al.
Pubblicazione: (2024)

Safe Multimodal Communication in Human-Robot Collaboration
di: Ferrari, Davide, et al.
Pubblicazione: (2023)