Enregistré dans:
| Auteurs principaux: | Zhang, Yanzhe, Yu, Tao, Yang, Diyi |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2411.02391 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Searching for Privacy Risks in LLM Agents via Simulation
par: Zhang, Yanzhe, et autres
Publié: (2025)
par: Zhang, Yanzhe, et autres
Publié: (2025)
Sketch2Code: Evaluating Vision-Language Models for Interactive Web Design Prototyping
par: Li, Ryan, et autres
Publié: (2024)
par: Li, Ryan, et autres
Publié: (2024)
A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration
par: Liu, Zijun, et autres
Publié: (2023)
par: Liu, Zijun, et autres
Publié: (2023)
Generative Interfaces for Language Models
par: Chen, Jiaqi, et autres
Publié: (2025)
par: Chen, Jiaqi, et autres
Publié: (2025)
Auditing Gender Presentation Differences in Text-to-Image Models
par: Zhang, Yanzhe, et autres
Publié: (2023)
par: Zhang, Yanzhe, et autres
Publié: (2023)
Contextualized Privacy Defense for LLM Agents
par: Wen, Yule, et autres
Publié: (2026)
par: Wen, Yule, et autres
Publié: (2026)
Design2Code: Benchmarking Multimodal Code Generation for Automated Front-End Engineering
par: Si, Chenglei, et autres
Publié: (2024)
par: Si, Chenglei, et autres
Publié: (2024)
DARG: Dynamic Evaluation of Large Language Models via Adaptive Reasoning Graph
par: Zhang, Zhehao, et autres
Publié: (2024)
par: Zhang, Zhehao, et autres
Publié: (2024)
Distilling an End-to-End Voice Assistant Without Instruction Training Data
par: Held, William, et autres
Publié: (2024)
par: Held, William, et autres
Publié: (2024)
AutoMetrics: Approximate Human Judgements with Automatically Generated Evaluators
par: Ryan, Michael J., et autres
Publié: (2025)
par: Ryan, Michael J., et autres
Publié: (2025)
LLaVAR: Enhanced Visual Instruction Tuning for Text-Rich Image Understanding
par: Zhang, Yanzhe, et autres
Publié: (2023)
par: Zhang, Yanzhe, et autres
Publié: (2023)
Dynamic Skill Adaptation for Large Language Models
par: Chen, Jiaao, et autres
Publié: (2024)
par: Chen, Jiaao, et autres
Publié: (2024)
SWE-smith: Scaling Data for Software Engineering Agents
par: Yang, John, et autres
Publié: (2025)
par: Yang, John, et autres
Publié: (2025)
Can Large Language Models Transform Computational Social Science?
par: Ziems, Caleb, et autres
Publié: (2023)
par: Ziems, Caleb, et autres
Publié: (2023)
EgoNormia: Benchmarking Physical Social Norm Understanding
par: Rezaei, MohammadHossein, et autres
Publié: (2025)
par: Rezaei, MohammadHossein, et autres
Publié: (2025)
Demystifying Verbatim Memorization in Large Language Models
par: Huang, Jing, et autres
Publié: (2024)
par: Huang, Jing, et autres
Publié: (2024)
Are Large Language Models Consistent over Value-laden Questions?
par: Moore, Jared, et autres
Publié: (2024)
par: Moore, Jared, et autres
Publié: (2024)
The Call for Socially Aware Language Technologies
par: Yang, Diyi, et autres
Publié: (2024)
par: Yang, Diyi, et autres
Publié: (2024)
Internal Causal Mechanisms Robustly Predict Language Model Out-of-Distribution Behaviors
par: Huang, Jing, et autres
Publié: (2025)
par: Huang, Jing, et autres
Publié: (2025)
PopALM: Popularity-Aligned Language Models for Social Media Trendy Response Prediction
par: Yu, Erxin, et autres
Publié: (2024)
par: Yu, Erxin, et autres
Publié: (2024)
Adaptive Vision-Language Model Routing for Computer Use Agents
par: Liu, Xunzhuo, et autres
Publié: (2026)
par: Liu, Xunzhuo, et autres
Publié: (2026)
Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration
par: Shao, Yijia, et autres
Publié: (2024)
par: Shao, Yijia, et autres
Publié: (2024)
Modelling prospective memory and resilient situated communications via Wizard of Oz
par: Li, Yanzhe, et autres
Publié: (2023)
par: Li, Yanzhe, et autres
Publié: (2023)
Best Practices and Lessons Learned on Synthetic Data
par: Liu, Ruibo, et autres
Publié: (2024)
par: Liu, Ruibo, et autres
Publié: (2024)
Practicing with Language Models Cultivates Human Empathic Communication
par: Kumar, Aakriti, et autres
Publié: (2026)
par: Kumar, Aakriti, et autres
Publié: (2026)
AutoLibra: Agent Metric Induction from Open-Ended Human Feedback
par: Zhu, Hao, et autres
Publié: (2025)
par: Zhu, Hao, et autres
Publié: (2025)
Inference Compute-Optimal Video Vision Language Models
par: Wang, Peiqi, et autres
Publié: (2025)
par: Wang, Peiqi, et autres
Publié: (2025)
Grounding Gaps in Language Model Generations
par: Shaikh, Omar, et autres
Publié: (2023)
par: Shaikh, Omar, et autres
Publié: (2023)
Social Skill Training with Large Language Models
par: Yang, Diyi, et autres
Publié: (2024)
par: Yang, Diyi, et autres
Publié: (2024)
Growing a Multi-head Twig via Distillation and Reinforcement Learning to Accelerate Large Vision-Language Models
par: Shao, Zhenwei, et autres
Publié: (2025)
par: Shao, Zhenwei, et autres
Publié: (2025)
When Large Language Models are Reliable for Judging Empathic Communication
par: Kumar, Aakriti, et autres
Publié: (2025)
par: Kumar, Aakriti, et autres
Publié: (2025)
Measuring and Addressing Indexical Bias in Information Retrieval
par: Ziems, Caleb, et autres
Publié: (2024)
par: Ziems, Caleb, et autres
Publié: (2024)
AdaptVision: Efficient Vision-Language Models via Adaptive Visual Acquisition
par: Lin, Zichuan, et autres
Publié: (2025)
par: Lin, Zichuan, et autres
Publié: (2025)
MultiAgent Collaboration Attack: Investigating Adversarial Attacks in Large Language Model Collaborations via Debate
par: Amayuelas, Alfonso, et autres
Publié: (2024)
par: Amayuelas, Alfonso, et autres
Publié: (2024)
Anchor Points: Benchmarking Models with Much Fewer Examples
par: Vivek, Rajan, et autres
Publié: (2023)
par: Vivek, Rajan, et autres
Publié: (2023)
Relative Scaling Laws for LLMs
par: Held, William, et autres
Publié: (2025)
par: Held, William, et autres
Publié: (2025)
Unintended Impacts of LLM Alignment on Global Representation
par: Ryan, Michael J., et autres
Publié: (2024)
par: Ryan, Michael J., et autres
Publié: (2024)
Aligning Language Models with Demonstrated Feedback
par: Shaikh, Omar, et autres
Publié: (2024)
par: Shaikh, Omar, et autres
Publié: (2024)
ReVision: Scaling Computer-Use Agents via Temporal Visual Redundancy Reduction
par: Abaskohi, Amirhossein, et autres
Publié: (2026)
par: Abaskohi, Amirhossein, et autres
Publié: (2026)
Creating General User Models from Computer Use
par: Shaikh, Omar, et autres
Publié: (2025)
par: Shaikh, Omar, et autres
Publié: (2025)
Documents similaires
-
Searching for Privacy Risks in LLM Agents via Simulation
par: Zhang, Yanzhe, et autres
Publié: (2025) -
Sketch2Code: Evaluating Vision-Language Models for Interactive Web Design Prototyping
par: Li, Ryan, et autres
Publié: (2024) -
A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration
par: Liu, Zijun, et autres
Publié: (2023) -
Generative Interfaces for Language Models
par: Chen, Jiaqi, et autres
Publié: (2025) -
Auditing Gender Presentation Differences in Text-to-Image Models
par: Zhang, Yanzhe, et autres
Publié: (2023)