Gespeichert in:
| Hauptverfasser: | Shi, Jerick, Zhang, Terry Jingcheng, Jin, Zhijing, Conitzer, Vincent |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2604.04782 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
From Hallucination to Scheming: A Unified Taxonomy and Benchmark Analysis for LLM Deception
von: Shi, Jerick, et al.
Veröffentlicht: (2026)
von: Shi, Jerick, et al.
Veröffentlicht: (2026)
Cheap Talk
von: St. Pierre, Joshua
Veröffentlicht: (2025)
von: St. Pierre, Joshua
Veröffentlicht: (2025)
CoopEval: Benchmarking Cooperation-Sustaining Mechanisms and LLM Agents in Social Dilemmas
von: Tewolde, Emanuel, et al.
Veröffentlicht: (2026)
von: Tewolde, Emanuel, et al.
Veröffentlicht: (2026)
Predictive Power of LLMs in Financial Markets
von: Shi, Jerick, et al.
Veröffentlicht: (2024)
von: Shi, Jerick, et al.
Veröffentlicht: (2024)
Now, Later, and Lasting: Ten Priorities for AI Research, Policy, and Practice
von: Horvitz, Eric, et al.
Veröffentlicht: (2024)
von: Horvitz, Eric, et al.
Veröffentlicht: (2024)
Causality for Natural Language Processing
von: Jin, Zhijing
Veröffentlicht: (2025)
von: Jin, Zhijing
Veröffentlicht: (2025)
On the Pros and Cons of Active Learning for Moral Preference Elicitation
von: Keswani, Vijay, et al.
Veröffentlicht: (2024)
von: Keswani, Vijay, et al.
Veröffentlicht: (2024)
Market-Dependent Communication in Multi-Agent Alpha Generation
von: Shi, Jerick, et al.
Veröffentlicht: (2025)
von: Shi, Jerick, et al.
Veröffentlicht: (2025)
GT-HarmBench: Benchmarking AI Safety Risks Through the Lens of Game Theory
von: Cobben, Pepijn, et al.
Veröffentlicht: (2026)
von: Cobben, Pepijn, et al.
Veröffentlicht: (2026)
Assessing Large Language Models' ability to predict how humans balance self-interest and the interest of others
von: Capraro, Valerio, et al.
Veröffentlicht: (2023)
von: Capraro, Valerio, et al.
Veröffentlicht: (2023)
Evaluating the Promise and Pitfalls of LLMs in Hiring Decisions
von: Anzenberg, Eitan, et al.
Veröffentlicht: (2025)
von: Anzenberg, Eitan, et al.
Veröffentlicht: (2025)
The Promises and Perils of using LLMs for Effective Public Services
von: Moon, Erina Seh-Young, et al.
Veröffentlicht: (2026)
von: Moon, Erina Seh-Young, et al.
Veröffentlicht: (2026)
Algorithmic Cheap Talk
von: Babichenko, Yakov, et al.
Veröffentlicht: (2023)
von: Babichenko, Yakov, et al.
Veröffentlicht: (2023)
Can AI Model the Complexities of Human Moral Decision-Making? A Qualitative Study of Kidney Allocation Decisions
von: Keswani, Vijay, et al.
Veröffentlicht: (2025)
von: Keswani, Vijay, et al.
Veröffentlicht: (2025)
Cheap Expertise: Mapping and Challenging Industry Perspectives in the Expert Data Gig Economy
von: Wolfe, Robert, et al.
Veröffentlicht: (2026)
von: Wolfe, Robert, et al.
Veröffentlicht: (2026)
The promise and perils of AI in medicine
von: Sparrow, Robert, et al.
Veröffentlicht: (2025)
von: Sparrow, Robert, et al.
Veröffentlicht: (2025)
Cheap Talk in Bilateral Trade
von: Tucker-Foltz, Jamie, et al.
Veröffentlicht: (2026)
von: Tucker-Foltz, Jamie, et al.
Veröffentlicht: (2026)
Equitable Access to Justice: Logical LLMs Show Promise
von: Kant, Manuj, et al.
Veröffentlicht: (2024)
von: Kant, Manuj, et al.
Veröffentlicht: (2024)
Agent-to-Agent Theory of Mind: Testing Interlocutor Awareness among Large Language Models
von: Choi, Younwoo, et al.
Veröffentlicht: (2025)
von: Choi, Younwoo, et al.
Veröffentlicht: (2025)
On The Stability of Moral Preferences: A Problem with Computational Elicitation Methods
von: Boerstler, Kyle, et al.
Veröffentlicht: (2024)
von: Boerstler, Kyle, et al.
Veröffentlicht: (2024)
Moral Change or Noise? On Problems of Aligning AI With Temporally Unstable Human Feedback
von: Keswani, Vijay, et al.
Veröffentlicht: (2025)
von: Keswani, Vijay, et al.
Veröffentlicht: (2025)
The Complexity of Computing Robust Mediated Equilibria in Ordinal Games
von: Conitzer, Vincent
Veröffentlicht: (2024)
von: Conitzer, Vincent
Veröffentlicht: (2024)
Exploring Consciousness in LLMs: A Systematic Survey of Theories, Implementations, and Frontier Risks
von: Chen, Sirui, et al.
Veröffentlicht: (2025)
von: Chen, Sirui, et al.
Veröffentlicht: (2025)
Gender inequality and self-publication patterns among scientific editors
von: Liu, Fengyuan, et al.
Veröffentlicht: (2022)
von: Liu, Fengyuan, et al.
Veröffentlicht: (2022)
Frontier AI systems have surpassed the self-replicating red line
von: Pan, Xudong, et al.
Veröffentlicht: (2024)
von: Pan, Xudong, et al.
Veröffentlicht: (2024)
Are LLMs Court-Ready? Evaluating Frontier Models on Indian Legal Reasoning
von: Juvekar, Kush, et al.
Veröffentlicht: (2025)
von: Juvekar, Kush, et al.
Veröffentlicht: (2025)
Can LLMs Talk 'Sex'? Exploring How AI Models Handle Intimate Conversations
von: Lai, Huiqian
Veröffentlicht: (2025)
von: Lai, Huiqian
Veröffentlicht: (2025)
An evidence-based and critical analysis of the Fediverse decentralization promises
von: Xavier, Henrique S.
Veröffentlicht: (2024)
von: Xavier, Henrique S.
Veröffentlicht: (2024)
WHBench: Evaluating Frontier LLMs with Expert-in-the-Loop Validation on Women's Health Topics
von: Maurya, Sneha, et al.
Veröffentlicht: (2026)
von: Maurya, Sneha, et al.
Veröffentlicht: (2026)
Talking the Talk Does Not Entail Walking the Walk: On the Limits of Large Language Models in Lexical Entailment Recognition
von: Greco, Candida M., et al.
Veröffentlicht: (2024)
von: Greco, Candida M., et al.
Veröffentlicht: (2024)
When Ethics and Payoffs Diverge: LLM Agents in Morally Charged Social Dilemmas
von: Backmann, Steffen, et al.
Veröffentlicht: (2025)
von: Backmann, Steffen, et al.
Veröffentlicht: (2025)
Estimating household contact matrices structure from easily collectable metadata
von: Dall'Amico, Lorenzo, et al.
Veröffentlicht: (2022)
von: Dall'Amico, Lorenzo, et al.
Veröffentlicht: (2022)
Breaking the ICE: Exploring promises and challenges of benchmarks for Inference Carbon & Energy estimation for LLMs
von: Sikand, Samarth, et al.
Veröffentlicht: (2025)
von: Sikand, Samarth, et al.
Veröffentlicht: (2025)
Exploring the Jungle of Bias: Political Bias Attribution in Language Models via Dependency Analysis
von: Jenny, David F., et al.
Veröffentlicht: (2023)
von: Jenny, David F., et al.
Veröffentlicht: (2023)
A Randomized Controlled Trial on Anonymizing Reviewers to Each Other in Peer Review Discussions
von: Rastogi, Charvi, et al.
Veröffentlicht: (2024)
von: Rastogi, Charvi, et al.
Veröffentlicht: (2024)
Frontier AI's Impact on the Cybersecurity Landscape
von: Potter, Yujin, et al.
Veröffentlicht: (2025)
von: Potter, Yujin, et al.
Veröffentlicht: (2025)
Preserving Historical Truth: Detecting Historical Revisionism in Large Language Models
von: Ortu, Francesco, et al.
Veröffentlicht: (2026)
von: Ortu, Francesco, et al.
Veröffentlicht: (2026)
Evaluating the Critical Risks of Amazon's Nova Premier under the Frontier Model Safety Framework
von: Krishna, Satyapriya, et al.
Veröffentlicht: (2025)
von: Krishna, Satyapriya, et al.
Veröffentlicht: (2025)
The California Report on Frontier AI Policy
von: Bommasani, Rishi, et al.
Veröffentlicht: (2025)
von: Bommasani, Rishi, et al.
Veröffentlicht: (2025)
Tie-breaking in self interest cumulative subtraction games
von: Bhagat, Anjali, et al.
Veröffentlicht: (2025)
von: Bhagat, Anjali, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
From Hallucination to Scheming: A Unified Taxonomy and Benchmark Analysis for LLM Deception
von: Shi, Jerick, et al.
Veröffentlicht: (2026) -
Cheap Talk
von: St. Pierre, Joshua
Veröffentlicht: (2025) -
CoopEval: Benchmarking Cooperation-Sustaining Mechanisms and LLM Agents in Social Dilemmas
von: Tewolde, Emanuel, et al.
Veröffentlicht: (2026) -
Predictive Power of LLMs in Financial Markets
von: Shi, Jerick, et al.
Veröffentlicht: (2024) -
Now, Later, and Lasting: Ten Priorities for AI Research, Policy, and Practice
von: Horvitz, Eric, et al.
Veröffentlicht: (2024)