:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Zhang, Yanzhe, Yu, Tao, Yang, Diyi
Format:	Preprint
Publié:	2024
Sujets:	Computation and Language
Accès en ligne:	https://arxiv.org/abs/2411.02391
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Searching for Privacy Risks in LLM Agents via Simulation
par: Zhang, Yanzhe, et autres
Publié: (2025)

Sketch2Code: Evaluating Vision-Language Models for Interactive Web Design Prototyping
par: Li, Ryan, et autres
Publié: (2024)

A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration
par: Liu, Zijun, et autres
Publié: (2023)

Generative Interfaces for Language Models
par: Chen, Jiaqi, et autres
Publié: (2025)

Auditing Gender Presentation Differences in Text-to-Image Models
par: Zhang, Yanzhe, et autres
Publié: (2023)

Contextualized Privacy Defense for LLM Agents
par: Wen, Yule, et autres
Publié: (2026)

Design2Code: Benchmarking Multimodal Code Generation for Automated Front-End Engineering
par: Si, Chenglei, et autres
Publié: (2024)

DARG: Dynamic Evaluation of Large Language Models via Adaptive Reasoning Graph
par: Zhang, Zhehao, et autres
Publié: (2024)

Distilling an End-to-End Voice Assistant Without Instruction Training Data
par: Held, William, et autres
Publié: (2024)

AutoMetrics: Approximate Human Judgements with Automatically Generated Evaluators
par: Ryan, Michael J., et autres
Publié: (2025)

LLaVAR: Enhanced Visual Instruction Tuning for Text-Rich Image Understanding
par: Zhang, Yanzhe, et autres
Publié: (2023)

Dynamic Skill Adaptation for Large Language Models
par: Chen, Jiaao, et autres
Publié: (2024)

SWE-smith: Scaling Data for Software Engineering Agents
par: Yang, John, et autres
Publié: (2025)

Can Large Language Models Transform Computational Social Science?
par: Ziems, Caleb, et autres
Publié: (2023)

EgoNormia: Benchmarking Physical Social Norm Understanding
par: Rezaei, MohammadHossein, et autres
Publié: (2025)

Demystifying Verbatim Memorization in Large Language Models
par: Huang, Jing, et autres
Publié: (2024)

Are Large Language Models Consistent over Value-laden Questions?
par: Moore, Jared, et autres
Publié: (2024)

The Call for Socially Aware Language Technologies
par: Yang, Diyi, et autres
Publié: (2024)

Internal Causal Mechanisms Robustly Predict Language Model Out-of-Distribution Behaviors
par: Huang, Jing, et autres
Publié: (2025)

PopALM: Popularity-Aligned Language Models for Social Media Trendy Response Prediction
par: Yu, Erxin, et autres
Publié: (2024)

Adaptive Vision-Language Model Routing for Computer Use Agents
par: Liu, Xunzhuo, et autres
Publié: (2026)

Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration
par: Shao, Yijia, et autres
Publié: (2024)

Modelling prospective memory and resilient situated communications via Wizard of Oz
par: Li, Yanzhe, et autres
Publié: (2023)

Best Practices and Lessons Learned on Synthetic Data
par: Liu, Ruibo, et autres
Publié: (2024)

Practicing with Language Models Cultivates Human Empathic Communication
par: Kumar, Aakriti, et autres
Publié: (2026)

AutoLibra: Agent Metric Induction from Open-Ended Human Feedback
par: Zhu, Hao, et autres
Publié: (2025)

Inference Compute-Optimal Video Vision Language Models
par: Wang, Peiqi, et autres
Publié: (2025)

Grounding Gaps in Language Model Generations
par: Shaikh, Omar, et autres
Publié: (2023)

Social Skill Training with Large Language Models
par: Yang, Diyi, et autres
Publié: (2024)

Growing a Multi-head Twig via Distillation and Reinforcement Learning to Accelerate Large Vision-Language Models
par: Shao, Zhenwei, et autres
Publié: (2025)

When Large Language Models are Reliable for Judging Empathic Communication
par: Kumar, Aakriti, et autres
Publié: (2025)

Measuring and Addressing Indexical Bias in Information Retrieval
par: Ziems, Caleb, et autres
Publié: (2024)

AdaptVision: Efficient Vision-Language Models via Adaptive Visual Acquisition
par: Lin, Zichuan, et autres
Publié: (2025)

MultiAgent Collaboration Attack: Investigating Adversarial Attacks in Large Language Model Collaborations via Debate
par: Amayuelas, Alfonso, et autres
Publié: (2024)

Anchor Points: Benchmarking Models with Much Fewer Examples
par: Vivek, Rajan, et autres
Publié: (2023)

Relative Scaling Laws for LLMs
par: Held, William, et autres
Publié: (2025)

Unintended Impacts of LLM Alignment on Global Representation
par: Ryan, Michael J., et autres
Publié: (2024)

Aligning Language Models with Demonstrated Feedback
par: Shaikh, Omar, et autres
Publié: (2024)

ReVision: Scaling Computer-Use Agents via Temporal Visual Redundancy Reduction
par: Abaskohi, Amirhossein, et autres
Publié: (2026)

Creating General User Models from Computer Use
par: Shaikh, Omar, et autres
Publié: (2025)