Salvato in:
| Autori principali: | Yang, Zachary, Imouza, Anne, Touzel, Maximilian Puelma, Amadoro, Cecile, Desrosiers-Brisebois, Gabrielle, Pelrine, Kellin, Levy, Sacha, Godbout, Jean-Francois, Rabbany, Reihaneh |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2407.02807 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Uncertainty Resolution in Misinformation Detection
di: Orlovskiy, Yury, et al.
Pubblicazione: (2024)
di: Orlovskiy, Yury, et al.
Pubblicazione: (2024)
$\texttt{BluePrint}$: A Social Media User Dataset for LLM Persona Evaluation and Training
di: Bück-Kaeffer, Aurélien, et al.
Pubblicazione: (2025)
di: Bück-Kaeffer, Aurélien, et al.
Pubblicazione: (2025)
Combining Confidence Elicitation and Sample-based Methods for Uncertainty Quantification in Misinformation Mitigation
di: Rivera, Mauricio, et al.
Pubblicazione: (2024)
di: Rivera, Mauricio, et al.
Pubblicazione: (2024)
Comparing GPT-4 and Open-Source Language Models in Misinformation Mitigation
di: Vergho, Tyler, et al.
Pubblicazione: (2024)
di: Vergho, Tyler, et al.
Pubblicazione: (2024)
The $\textit{Silicon Society}$ Cookbook: Design Space of LLM-based Social Simulations
di: Bück-Kaeffer, Aurélien, et al.
Pubblicazione: (2026)
di: Bück-Kaeffer, Aurélien, et al.
Pubblicazione: (2026)
EASE Configuration Facilitates A Reproducible Science of LLM Social Simulations
di: Sarangi, Sneheel, et al.
Pubblicazione: (2026)
di: Sarangi, Sneheel, et al.
Pubblicazione: (2026)
Veracity: An Open-Source AI Fact-Checking System
di: Curtis, Taylor Lynn, et al.
Pubblicazione: (2025)
di: Curtis, Taylor Lynn, et al.
Pubblicazione: (2025)
The fitness landscape of social norms in social dilemmas
di: Touzel, Maximilian Puelma
Pubblicazione: (2026)
di: Touzel, Maximilian Puelma
Pubblicazione: (2026)
A Simulation System Towards Solving Societal-Scale Manipulation
di: Touzel, Maximilian Puelma, et al.
Pubblicazione: (2024)
di: Touzel, Maximilian Puelma, et al.
Pubblicazione: (2024)
Online Influence Campaigns: Strategies and Vulnerabilities
di: Musulan, Andreea, et al.
Pubblicazione: (2024)
di: Musulan, Andreea, et al.
Pubblicazione: (2024)
Towards Detecting Contextual Real-Time Toxicity for In-Game Chat
di: Yang, Zachary, et al.
Pubblicazione: (2023)
di: Yang, Zachary, et al.
Pubblicazione: (2023)
CrediBench: Building Web-Scale Network Datasets for Information Integrity
di: Kondrup, Emma, et al.
Pubblicazione: (2025)
di: Kondrup, Emma, et al.
Pubblicazione: (2025)
Web Retrieval Agents for Evidence-Based Misinformation Detection
di: Tian, Jacob-Junqi, et al.
Pubblicazione: (2024)
di: Tian, Jacob-Junqi, et al.
Pubblicazione: (2024)
A Guide to Misinformation Detection Data and Evaluation
di: Thibault, Camille, et al.
Pubblicazione: (2024)
di: Thibault, Camille, et al.
Pubblicazione: (2024)
Deepfakes in the 2025 Canadian Election: Prevalence, Partisanship, and Platform Dynamics
di: Livernoche, Victor, et al.
Pubblicazione: (2025)
di: Livernoche, Victor, et al.
Pubblicazione: (2025)
Epistemic Integrity in Large Language Models
di: Ghafouri, Bijean, et al.
Pubblicazione: (2024)
di: Ghafouri, Bijean, et al.
Pubblicazione: (2024)
Emerging Vulnerabilities in Frontier Models: Multi-Turn Jailbreak Attacks
di: Gibbs, Tom, et al.
Pubblicazione: (2024)
di: Gibbs, Tom, et al.
Pubblicazione: (2024)
From Intuition to Understanding: Using AI Peers to Overcome Physics Misconceptions
di: Weijers, Ruben, et al.
Pubblicazione: (2025)
di: Weijers, Ruben, et al.
Pubblicazione: (2025)
The Structural Safety Generalization Problem
di: Broomfield, Julius, et al.
Pubblicazione: (2025)
di: Broomfield, Julius, et al.
Pubblicazione: (2025)
Unified Game Moderation: Soft-Prompting and LLM-Assisted Label Transfer for Resource-Efficient Toxicity Detection
di: Yang, Zachary, et al.
Pubblicazione: (2025)
di: Yang, Zachary, et al.
Pubblicazione: (2025)
OpenFake: An Open Dataset and Platform Toward Real-World Deepfake Detection
di: Livernoche, Victor, et al.
Pubblicazione: (2025)
di: Livernoche, Victor, et al.
Pubblicazione: (2025)
Exposing the Systematic Vulnerability of Open-Weight Models to Prefill Attacks
di: Struppek, Lukas, et al.
Pubblicazione: (2026)
di: Struppek, Lukas, et al.
Pubblicazione: (2026)
Weak Supervision for Real World Graphs
di: Nair, Pratheeksha, et al.
Pubblicazione: (2025)
di: Nair, Pratheeksha, et al.
Pubblicazione: (2025)
What do people want to fact-check?
di: Ghafouri, Bijean, et al.
Pubblicazione: (2026)
di: Ghafouri, Bijean, et al.
Pubblicazione: (2026)
Large language models can effectively convince people to believe conspiracies
di: Costello, Thomas H., et al.
Pubblicazione: (2026)
di: Costello, Thomas H., et al.
Pubblicazione: (2026)
It's the Thought that Counts: Evaluating the Attempts of Frontier LLMs to Persuade on Harmful Topics
di: Kowal, Matthew, et al.
Pubblicazione: (2025)
di: Kowal, Matthew, et al.
Pubblicazione: (2025)
Temporal Graph Analysis with TGX
di: Shirzadkhani, Razieh, et al.
Pubblicazione: (2024)
di: Shirzadkhani, Razieh, et al.
Pubblicazione: (2024)
Kurtosis-Guided Denoising Score Matching for Tabular Anomaly Detection
di: Livernoche, Victor, et al.
Pubblicazione: (2026)
di: Livernoche, Victor, et al.
Pubblicazione: (2026)
Higher Order Transformers: Enhancing Stock Movement Prediction On Multimodal Time-Series Data
di: Omranpour, Soroush, et al.
Pubblicazione: (2024)
di: Omranpour, Soroush, et al.
Pubblicazione: (2024)
Higher-Order Transformers With Kronecker-Structured Attention
di: Omranpour, Soroush, et al.
Pubblicazione: (2024)
di: Omranpour, Soroush, et al.
Pubblicazione: (2024)
Accidental Vulnerability: Factors in Fine-Tuning that Shift Model Safeguards
di: Pandey, Punya Syon, et al.
Pubblicazione: (2025)
di: Pandey, Punya Syon, et al.
Pubblicazione: (2025)
UTG: Towards a Unified View of Snapshot and Event Based Models for Temporal Graphs
di: Huang, Shenyang, et al.
Pubblicazione: (2024)
di: Huang, Shenyang, et al.
Pubblicazione: (2024)
Are Large Language Models Good Temporal Graph Learners?
di: Huang, Shenyang, et al.
Pubblicazione: (2025)
di: Huang, Shenyang, et al.
Pubblicazione: (2025)
Can Go AIs be adversarially robust?
di: Tseng, Tom, et al.
Pubblicazione: (2024)
di: Tseng, Tom, et al.
Pubblicazione: (2024)
Scaling Trends for Data Poisoning in LLMs
di: Bowen, Dillon, et al.
Pubblicazione: (2024)
di: Bowen, Dillon, et al.
Pubblicazione: (2024)
Exploiting Novel GPT-4 APIs
di: Pelrine, Kellin, et al.
Pubblicazione: (2023)
di: Pelrine, Kellin, et al.
Pubblicazione: (2023)
Dr. Bias: Social Disparities in AI-Powered Medical Guidance
di: Kondrup, Emma, et al.
Pubblicazione: (2025)
di: Kondrup, Emma, et al.
Pubblicazione: (2025)
Partisan Rhetoric and Polarization
di: Browning, Robert X.
Pubblicazione: (2024)
di: Browning, Robert X.
Pubblicazione: (2024)
GPS-SSL: Guided Positive Sampling to Inject Prior Into Self-Supervised Learning
di: Feizi, Aarash, et al.
Pubblicazione: (2024)
di: Feizi, Aarash, et al.
Pubblicazione: (2024)
Desarrollo personal y profesional de los egresados
di: Delpiano Puelma Adriana
Pubblicazione: (1996)
di: Delpiano Puelma Adriana
Pubblicazione: (1996)
Documenti analoghi
-
Uncertainty Resolution in Misinformation Detection
di: Orlovskiy, Yury, et al.
Pubblicazione: (2024) -
$\texttt{BluePrint}$: A Social Media User Dataset for LLM Persona Evaluation and Training
di: Bück-Kaeffer, Aurélien, et al.
Pubblicazione: (2025) -
Combining Confidence Elicitation and Sample-based Methods for Uncertainty Quantification in Misinformation Mitigation
di: Rivera, Mauricio, et al.
Pubblicazione: (2024) -
Comparing GPT-4 and Open-Source Language Models in Misinformation Mitigation
di: Vergho, Tyler, et al.
Pubblicazione: (2024) -
The $\textit{Silicon Society}$ Cookbook: Design Space of LLM-based Social Simulations
di: Bück-Kaeffer, Aurélien, et al.
Pubblicazione: (2026)