Gespeichert in:
| Hauptverfasser: | Jeong, Jinhong, Lee, Sunghyun, Lee, Jaeyoung, Han, Seonah, Yu, Youngjae |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2511.10045 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Mind the Motions: Benchmarking Theory-of-Mind in Everyday Body Language
von: Lee, Seungbeen, et al.
Veröffentlicht: (2025)
von: Lee, Seungbeen, et al.
Veröffentlicht: (2025)
Right at My Level: A Unified Multilingual Framework for Proficiency-Aware Text Simplification
von: Jeong, Jinhong, et al.
Veröffentlicht: (2026)
von: Jeong, Jinhong, et al.
Veröffentlicht: (2026)
Speaking Beyond Language: A Large-Scale Multimodal Dataset for Learning Nonverbal Cues from Video-Grounded Dialogues
von: Kim, Youngmin, et al.
Veröffentlicht: (2025)
von: Kim, Youngmin, et al.
Veröffentlicht: (2025)
v1: Learning to Point Visual Tokens for Multimodal Grounded Reasoning
von: Chung, Jiwan, et al.
Veröffentlicht: (2025)
von: Chung, Jiwan, et al.
Veröffentlicht: (2025)
How to Train Your Fact Verifier: Knowledge Transfer with Multimodal Open Models
von: Lee, Jaeyoung, et al.
Veröffentlicht: (2024)
von: Lee, Jaeyoung, et al.
Veröffentlicht: (2024)
SMILE: Multimodal Dataset for Understanding Laughter in Video with Language Models
von: Hyun, Lee, et al.
Veröffentlicht: (2023)
von: Hyun, Lee, et al.
Veröffentlicht: (2023)
With Ears to See and Eyes to Hear: Sound Symbolism Experiments with Multimodal Large Language Models
von: Loakman, Tyler, et al.
Veröffentlicht: (2024)
von: Loakman, Tyler, et al.
Veröffentlicht: (2024)
Kiki or Bouba? Sound Symbolism in Vision-and-Language Models
von: Alper, Morris, et al.
Veröffentlicht: (2023)
von: Alper, Morris, et al.
Veröffentlicht: (2023)
RFEval: Benchmarking Reasoning Faithfulness under Counterfactual Reasoning Intervention in Large Reasoning Models
von: Han, Yunseok, et al.
Veröffentlicht: (2026)
von: Han, Yunseok, et al.
Veröffentlicht: (2026)
Investigating Counterfactual Unfairness in LLMs towards Identities through Humor
von: Kim, Shubin, et al.
Veröffentlicht: (2026)
von: Kim, Shubin, et al.
Veröffentlicht: (2026)
Measuring Sound Symbolism in Audio-visual Models
von: Tseng, Wei-Cheng, et al.
Veröffentlicht: (2024)
von: Tseng, Wei-Cheng, et al.
Veröffentlicht: (2024)
DUSK: Do Not Unlearn Shared Knowledge
von: Jeung, Wonje, et al.
Veröffentlicht: (2025)
von: Jeung, Wonje, et al.
Veröffentlicht: (2025)
TeachObs: A Human-Validated Benchmark for Multimodal Teaching Observation and Model Evaluation
von: Jeong, Yeil, et al.
Veröffentlicht: (2026)
von: Jeong, Yeil, et al.
Veröffentlicht: (2026)
Do Multimodal Large Language Models Understand Welding?
von: Khvatskii, Grigorii, et al.
Veröffentlicht: (2025)
von: Khvatskii, Grigorii, et al.
Veröffentlicht: (2025)
Symbolic Chain-of-Thought Distillation: Small Models Can Also "Think" Step-by-Step
von: Li, Liunian Harold, et al.
Veröffentlicht: (2023)
von: Li, Liunian Harold, et al.
Veröffentlicht: (2023)
Do LLMs Have Distinct and Consistent Personality? TRAIT: Personality Testset designed for LLMs with Psychometrics
von: Lee, Seungbeen, et al.
Veröffentlicht: (2024)
von: Lee, Seungbeen, et al.
Veröffentlicht: (2024)
Are Vision-Language Models Safe in the Wild? A Meme-Based Benchmark Study
von: Lee, DongGeon, et al.
Veröffentlicht: (2025)
von: Lee, DongGeon, et al.
Veröffentlicht: (2025)
Thinking with Sound: Audio Chain-of-Thought Enables Multimodal Reasoning in Large Audio-Language Models
von: Xiong, Zhen, et al.
Veröffentlicht: (2025)
von: Xiong, Zhen, et al.
Veröffentlicht: (2025)
Aligning Large Language Models by On-Policy Self-Judgment
von: Lee, Sangkyu, et al.
Veröffentlicht: (2024)
von: Lee, Sangkyu, et al.
Veröffentlicht: (2024)
Do MLLMs Capture How Interfaces Guide User Behavior? A Benchmark for Multimodal UI/UX Design Understanding
von: Jeon, Jaehyun, et al.
Veröffentlicht: (2025)
von: Jeon, Jaehyun, et al.
Veröffentlicht: (2025)
Personalized Scientific Figure Caption Generation: An Empirical Study on Author-Specific Writing Style Transfer
von: Kim, Jaeyoung, et al.
Veröffentlicht: (2025)
von: Kim, Jaeyoung, et al.
Veröffentlicht: (2025)
Persona Dynamics: Unveiling the Impact of Personality Traits on Agents in Text-Based Games
von: Lim, Seungwon, et al.
Veröffentlicht: (2025)
von: Lim, Seungwon, et al.
Veröffentlicht: (2025)
Understanding Sounds, Missing the Questions: The Challenge of Object Hallucination in Large Audio-Language Models
von: Kuan, Chun-Yi, et al.
Veröffentlicht: (2024)
von: Kuan, Chun-Yi, et al.
Veröffentlicht: (2024)
Decoder-only Conformer with Modality-aware Sparse Mixtures of Experts for ASR
von: Lee, Jaeyoung, et al.
Veröffentlicht: (2026)
von: Lee, Jaeyoung, et al.
Veröffentlicht: (2026)
Can Large Language Models be Good Emotional Supporter? Mitigating Preference Bias on Emotional Support Conversation
von: Kang, Dongjin, et al.
Veröffentlicht: (2024)
von: Kang, Dongjin, et al.
Veröffentlicht: (2024)
Pragmatic Competence Evaluation of Large Language Models for the Korean Language
von: Park, Dojun, et al.
Veröffentlicht: (2024)
von: Park, Dojun, et al.
Veröffentlicht: (2024)
Enhanced Facet Generation with LLM Editing
von: Lee, Joosung, et al.
Veröffentlicht: (2024)
von: Lee, Joosung, et al.
Veröffentlicht: (2024)
Investigating Symbolic Capabilities of Large Language Models
von: Dave, Neisarg, et al.
Veröffentlicht: (2024)
von: Dave, Neisarg, et al.
Veröffentlicht: (2024)
Adversarially Probing Cross-Family Sound Symbolism in 27 Languages
von: Sharma, Anika, et al.
Veröffentlicht: (2025)
von: Sharma, Anika, et al.
Veröffentlicht: (2025)
Reinforcement Learning from Reflective Feedback (RLRF): Aligning and Improving LLMs via Fine-Grained Self-Reflection
von: Lee, Kyungjae, et al.
Veröffentlicht: (2024)
von: Lee, Kyungjae, et al.
Veröffentlicht: (2024)
Dynin-Omni: Omnimodal Unified Large Diffusion Language Model
von: Kim, Jaeik, et al.
Veröffentlicht: (2026)
von: Kim, Jaeik, et al.
Veröffentlicht: (2026)
Representation Bending for Large Language Model Safety
von: Yousefpour, Ashkan, et al.
Veröffentlicht: (2025)
von: Yousefpour, Ashkan, et al.
Veröffentlicht: (2025)
Selective Vision is the Challenge for Visual Reasoning: A Benchmark for Visual Argument Understanding
von: Chung, Jiwan, et al.
Veröffentlicht: (2024)
von: Chung, Jiwan, et al.
Veröffentlicht: (2024)
Are Sounds Sound for Phylogenetic Reconstruction?
von: Häuser, Luise, et al.
Veröffentlicht: (2024)
von: Häuser, Luise, et al.
Veröffentlicht: (2024)
Don't Let It Fade: Preserving Edits in Diffusion Language Models via Token Timestep Allocation
von: Kim, Woojin, et al.
Veröffentlicht: (2025)
von: Kim, Woojin, et al.
Veröffentlicht: (2025)
What MLLMs Learn about When they Learn about Multimodal Reasoning
von: Chung, Jiwan, et al.
Veröffentlicht: (2025)
von: Chung, Jiwan, et al.
Veröffentlicht: (2025)
SymBa: Symbolic Backward Chaining for Structured Natural Language Reasoning
von: Lee, Jinu, et al.
Veröffentlicht: (2024)
von: Lee, Jinu, et al.
Veröffentlicht: (2024)
Creating an Aligned Corpus of Sound and Text: The Multimodal Corpus of Shakespeare and Milton
von: Agirrezabal, Manex
Veröffentlicht: (2024)
von: Agirrezabal, Manex
Veröffentlicht: (2024)
Exploring Multimodal Perception in Large Language Models Through Perceptual Strength Ratings
von: Lee, Jonghyun, et al.
Veröffentlicht: (2025)
von: Lee, Jonghyun, et al.
Veröffentlicht: (2025)
Towards Probabilistically-Sound Beam Search with Masked Language Models
von: Brooks, Creston, et al.
Veröffentlicht: (2024)
von: Brooks, Creston, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Mind the Motions: Benchmarking Theory-of-Mind in Everyday Body Language
von: Lee, Seungbeen, et al.
Veröffentlicht: (2025) -
Right at My Level: A Unified Multilingual Framework for Proficiency-Aware Text Simplification
von: Jeong, Jinhong, et al.
Veröffentlicht: (2026) -
Speaking Beyond Language: A Large-Scale Multimodal Dataset for Learning Nonverbal Cues from Video-Grounded Dialogues
von: Kim, Youngmin, et al.
Veröffentlicht: (2025) -
v1: Learning to Point Visual Tokens for Multimodal Grounded Reasoning
von: Chung, Jiwan, et al.
Veröffentlicht: (2025) -
How to Train Your Fact Verifier: Knowledge Transfer with Multimodal Open Models
von: Lee, Jaeyoung, et al.
Veröffentlicht: (2024)