Salvato in:
| Autori principali: | Thorne, William, Shepherd, Rupert, Maynard, Diana |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2603.26426 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Beyond Imperfect Alternatives with Rulemapping: A Neuro-Symbolic Case Study on Online Hate Speech
di: von Cossel, Oskar
Pubblicazione: (2026)
di: von Cossel, Oskar
Pubblicazione: (2026)
ChatGPT as Research Scientist: Probing GPT's Capabilities as a Research Librarian, Research Ethicist, Data Generator and Data Predictor
di: Lehr, Steven A., et al.
Pubblicazione: (2024)
di: Lehr, Steven A., et al.
Pubblicazione: (2024)
Toward Secure and Compliant AI: Organizational Standards and Protocols for NLP Model Lifecycle Management
di: Arora, Sunil, et al.
Pubblicazione: (2025)
di: Arora, Sunil, et al.
Pubblicazione: (2025)
The Company You Keep: How LLMs Respond to Dark Triad Traits
di: Lu, Zeyi, et al.
Pubblicazione: (2026)
di: Lu, Zeyi, et al.
Pubblicazione: (2026)
The Ethics Engine: A Modular Pipeline for Accessible Psychometric Assessment of Large Language Models
di: Van Clief, Jake, et al.
Pubblicazione: (2025)
di: Van Clief, Jake, et al.
Pubblicazione: (2025)
Big AI is accelerating the metacrisis: What can we do?
di: Bird, Steven
Pubblicazione: (2025)
di: Bird, Steven
Pubblicazione: (2025)
Revealing Hidden Bias in AI: Lessons from Large Language Models
di: Beatty, Django, et al.
Pubblicazione: (2024)
di: Beatty, Django, et al.
Pubblicazione: (2024)
Identifying and Mitigating Gender Cues in Academic Recommendation Letters: An Interpretability Case Study
di: Alexander, Charlotte S., et al.
Pubblicazione: (2026)
di: Alexander, Charlotte S., et al.
Pubblicazione: (2026)
WSC+: Enhancing The Winograd Schema Challenge Using Tree-of-Experts
di: Zahraei, Pardis Sadat, et al.
Pubblicazione: (2024)
di: Zahraei, Pardis Sadat, et al.
Pubblicazione: (2024)
Leveraging Multi-Source Textural UGC for Neighbourhood Housing Quality Assessment: A GPT-Enhanced Framework
di: Hong, Qiyuan, et al.
Pubblicazione: (2025)
di: Hong, Qiyuan, et al.
Pubblicazione: (2025)
AI to Learn 2.0: A Deliverable-Oriented Governance Framework and Maturity Rubric for Opaque AI in Learning-Intensive Domains
di: Shintani, Seine A.
Pubblicazione: (2026)
di: Shintani, Seine A.
Pubblicazione: (2026)
Auditing Preferences for Brands and Cultures in LLMs
di: Rienecker, Jasmine, et al.
Pubblicazione: (2026)
di: Rienecker, Jasmine, et al.
Pubblicazione: (2026)
Whose Name Comes Up? Auditing LLM-Based Scholar Recommendations
di: Barolo, Daniele, et al.
Pubblicazione: (2025)
di: Barolo, Daniele, et al.
Pubblicazione: (2025)
PoliCon: Evaluating LLMs on Achieving Diverse Political Consensus Objectives
di: Zhang, Zhaowei, et al.
Pubblicazione: (2025)
di: Zhang, Zhaowei, et al.
Pubblicazione: (2025)
The Invisible Coalition Partner: How LLMs Vote When Democracy Gets Concrete
di: Barmettler, Joel
Pubblicazione: (2026)
di: Barmettler, Joel
Pubblicazione: (2026)
Exploring and Mitigating Gender Bias in Encoder-Based Transformer Models
di: Hossain, Ariyan, et al.
Pubblicazione: (2025)
di: Hossain, Ariyan, et al.
Pubblicazione: (2025)
Who Leads in the Shadows? ERGM and Centrality Analysis of Congressional Democrats on Bluesky
di: Hew, Gordon, et al.
Pubblicazione: (2025)
di: Hew, Gordon, et al.
Pubblicazione: (2025)
Cross-Subreddit Behavior as Open-Source Indicators of Coordinated Influence: A Case Study of r/Sino & r/China
di: Pilaud, Manon, et al.
Pubblicazione: (2025)
di: Pilaud, Manon, et al.
Pubblicazione: (2025)
Growing a Tail: Increasing Output Diversity in Large Language Models
di: Shur-Ofry, Michal, et al.
Pubblicazione: (2024)
di: Shur-Ofry, Michal, et al.
Pubblicazione: (2024)
Domain-Specific Constitutional AI: Enhancing Safety in LLM-Powered Mental Health Chatbots
di: Lyu, Chenhan, et al.
Pubblicazione: (2025)
di: Lyu, Chenhan, et al.
Pubblicazione: (2025)
Implicit Geographic Inference in LLM Medical Triage: Language-Driven Disparities in Emergency Recommendations
di: Wong, Qi Han
Pubblicazione: (2026)
di: Wong, Qi Han
Pubblicazione: (2026)
Replicating TEMPEST at Scale: Multi-Turn Adversarial Attacks Against Trillion-Parameter Frontier Models
di: Young, Richard
Pubblicazione: (2025)
di: Young, Richard
Pubblicazione: (2025)
Bye Bye Perspective API: Lessons for Measurement Infrastructure in NLP, CSS and LLM Evaluation
di: Hartmann, David, et al.
Pubblicazione: (2026)
di: Hartmann, David, et al.
Pubblicazione: (2026)
Whose wife is it anyway? Assessing bias against same-gender relationships in machine translation
di: Stewart, Ian, et al.
Pubblicazione: (2024)
di: Stewart, Ian, et al.
Pubblicazione: (2024)
Qwerty AI: Explainable Automated Age Rating and Content Safety Assessment for Russian-Language Screenplays
di: Zmanovskii, Nikita
Pubblicazione: (2025)
di: Zmanovskii, Nikita
Pubblicazione: (2025)
Generative midtended cognition and Artificial Intelligence. Thinging with thinging things
di: Barandiaran, Xabier E., et al.
Pubblicazione: (2024)
di: Barandiaran, Xabier E., et al.
Pubblicazione: (2024)
Reconstruction and Secrecy under Approximate Distance Queries
di: Moran, Shay, et al.
Pubblicazione: (2025)
di: Moran, Shay, et al.
Pubblicazione: (2025)
What are People Talking about in #BlackLivesMatter and #StopAsianHate? Exploring and Categorizing Twitter Topics Emerging in Online Social Movements through the Latent Dirichlet Allocation Model
di: Tong, Xin, et al.
Pubblicazione: (2022)
di: Tong, Xin, et al.
Pubblicazione: (2022)
Industrialized Deception: The Collateral Effects of LLM-Generated Misinformation on Digital Ecosystems
di: Loth, Alexander, et al.
Pubblicazione: (2026)
di: Loth, Alexander, et al.
Pubblicazione: (2026)
Who Shares What? An Empirical Analysis of Security Conference Content Across Academia and Industry
di: Walter, Lukas, et al.
Pubblicazione: (2024)
di: Walter, Lukas, et al.
Pubblicazione: (2024)
Evaluating LLM-Based Grant Proposal Review via Structured Perturbations
di: Thorne, William, et al.
Pubblicazione: (2026)
di: Thorne, William, et al.
Pubblicazione: (2026)
Beyond classical and contemporary models: a transformative AI framework for student dropout prediction in distance learning using RAG, Prompt engineering, and Cross-modal fusion
di: Mihoubi, Miloud, et al.
Pubblicazione: (2025)
di: Mihoubi, Miloud, et al.
Pubblicazione: (2025)
Ideology as a Problem: Lightweight Logit Steering for Annotator-Specific Alignment in Social Media Analysis
di: Xia, Wei, et al.
Pubblicazione: (2025)
di: Xia, Wei, et al.
Pubblicazione: (2025)
AI Safety Training Can be Clinically Harmful
di: BN, Suhas, et al.
Pubblicazione: (2026)
di: BN, Suhas, et al.
Pubblicazione: (2026)
Can LLMs Understand What We Cannot Say? Measuring Multilevel Alignment Through Abortion Stigma Across Cognitive, Interpersonal, and Structural Levels
di: Sharma, Anika, et al.
Pubblicazione: (2025)
di: Sharma, Anika, et al.
Pubblicazione: (2025)
A Field Guide to Decision Making
di: Arthur, Richard B.
Pubblicazione: (2026)
di: Arthur, Richard B.
Pubblicazione: (2026)
EQUITRIAGE: A Fairness Audit of Gender Bias in LLM-Based Emergency Department Triage
di: Young, Richard J., et al.
Pubblicazione: (2026)
di: Young, Richard J., et al.
Pubblicazione: (2026)
Balancing Innovation and Integrity: AI Integration in Liberal Arts College Administration
di: Read, Ian Olivo
Pubblicazione: (2025)
di: Read, Ian Olivo
Pubblicazione: (2025)
When Names Change Verdicts: Intervention Consistency Reveals Systematic Bias in LLM Decision-Making
di: Basu, Abhinaba, et al.
Pubblicazione: (2026)
di: Basu, Abhinaba, et al.
Pubblicazione: (2026)
Transforming Computer Security and Public Trust Through the Exploration of Fine-Tuning Large Language Models
di: Crumrine, Garrett, et al.
Pubblicazione: (2024)
di: Crumrine, Garrett, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Beyond Imperfect Alternatives with Rulemapping: A Neuro-Symbolic Case Study on Online Hate Speech
di: von Cossel, Oskar
Pubblicazione: (2026) -
ChatGPT as Research Scientist: Probing GPT's Capabilities as a Research Librarian, Research Ethicist, Data Generator and Data Predictor
di: Lehr, Steven A., et al.
Pubblicazione: (2024) -
Toward Secure and Compliant AI: Organizational Standards and Protocols for NLP Model Lifecycle Management
di: Arora, Sunil, et al.
Pubblicazione: (2025) -
The Company You Keep: How LLMs Respond to Dark Triad Traits
di: Lu, Zeyi, et al.
Pubblicazione: (2026) -
The Ethics Engine: A Modular Pipeline for Accessible Psychometric Assessment of Large Language Models
di: Van Clief, Jake, et al.
Pubblicazione: (2025)