:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Dwivedi-Yu, Jane, Dwivedi, Raaz, Schick, Timo
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computation and Language Computers and Society Machine Learning
Accesso online:	https://arxiv.org/abs/2404.06619
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Kernel Thinning
di: Dwivedi, Raaz, et al.
Pubblicazione: (2021)

Laissez-Faire Harms: Algorithmic Biases in Generative Language Models
di: Shieh, Evan, et al.
Pubblicazione: (2024)

Debiased Distribution Compression
di: Li, Lingxiao, et al.
Pubblicazione: (2024)

Understanding Intrinsic Socioeconomic Biases in Large Language Models
di: Arzaghi, Mina, et al.
Pubblicazione: (2024)

A Toolbox for Surfacing Health Equity Harms and Biases in Large Language Models
di: Pfohl, Stephen R., et al.
Pubblicazione: (2024)

Large Language Models are Geographically Biased
di: Manvi, Rohin, et al.
Pubblicazione: (2024)

Datasets for Fairness in Language Models: An In-Depth Survey
di: Zhang, Jiale, et al.
Pubblicazione: (2025)

Empowering Many, Biasing a Few: Generalist Credit Scoring through Large Language Models
di: Feng, Duanyu, et al.
Pubblicazione: (2023)

Bias and Fairness in Large Language Models: A Survey
di: Gallegos, Isabel O., et al.
Pubblicazione: (2023)

AXOLOTL: Fairness through Assisted Self-Debiasing of Large Language Model Outputs
di: Ebrahimi, Sana, et al.
Pubblicazione: (2024)

CORE: Comprehensive Ontological Relation Evaluation for Large Language Models
di: Dwivedi, Satyam, et al.
Pubblicazione: (2026)

Subtle Biases Need Subtler Measures: Dual Metrics for Evaluating Representative and Affinity Bias in Large Language Models
di: Kumar, Abhishek, et al.
Pubblicazione: (2024)

LangFair: A Python Package for Assessing Bias and Fairness in Large Language Model Use Cases
di: Bouchard, Dylan, et al.
Pubblicazione: (2025)

Intrinsic Meets Extrinsic Fairness: Assessing the Downstream Impact of Bias Mitigation in Large Language Models
di: Arzaghi', 'Mina, et al.
Pubblicazione: (2025)

Large Language Models are Good Relational Learners
di: Wu, Fang, et al.
Pubblicazione: (2025)

Exploring Accuracy-Fairness Trade-off in Large Language Models
di: Zhang, Qingquan, et al.
Pubblicazione: (2024)

ELMES: An Automated Framework for Evaluating Large Language Models in Educational Scenarios
di: Wei, Shou'ang, et al.
Pubblicazione: (2025)

Addressing Both Statistical and Causal Gender Fairness in NLP Models
di: Chen, Hannah, et al.
Pubblicazione: (2024)

NoisyHate: Mining Online Human-Written Perturbations for Realistic Robustness Benchmarking of Content Moderation Models
di: Ye, Yiran, et al.
Pubblicazione: (2023)

Are Models Biased on Text without Gender-related Language?
di: Belém, Catarina G, et al.
Pubblicazione: (2024)

PRSM: A Measure to Evaluate CLIP's Robustness Against Paraphrases
di: Schlegel, Udo, et al.
Pubblicazione: (2025)

Reward Models Inherit Value Biases from Pretraining
di: Christian, Brian, et al.
Pubblicazione: (2026)

Towards Large Language Models that Benefit for All: Benchmarking Group Fairness in Reward Models
di: Song, Kefan, et al.
Pubblicazione: (2025)

Accept or Deny? Evaluating LLM Fairness and Performance in Loan Approval across Table-to-Text Serialization Approaches
di: Azime, Israel Abebe, et al.
Pubblicazione: (2025)

A Primer on Causal and Statistical Dataset Biases for Fair and Robust Image Analysis
di: Jones, Charles, et al.
Pubblicazione: (2025)

Toward Automated Detection of Biased Social Signals from the Content of Clinical Conversations
di: Chen, Feng, et al.
Pubblicazione: (2024)

Generalization in Healthcare AI: Evaluation of a Clinical Large Language Model
di: Rahman, Salman, et al.
Pubblicazione: (2024)

Group Fairness Meets the Black Box: Enabling Fair Algorithms on Closed LLMs via Post-Processing
di: Xian, Ruicheng, et al.
Pubblicazione: (2025)

Generalized Kernel Thinning
di: Dwivedi, Raaz, et al.
Pubblicazione: (2021)

Evaluating Machine Translation Models for English-Hindi Language Pairs: A Comparative Analysis
di: Shetty, Ahan Prasannakumar
Pubblicazione: (2025)

Balancing the Scales: Reinforcement Learning for Fair Classification
di: Eshuijs, Leon, et al.
Pubblicazione: (2024)

The "Colonial Impulse" of Natural Language Processing: An Audit of Bengali Sentiment Analysis Tools and Their Identity-based Biases
di: Das, Dipto, et al.
Pubblicazione: (2024)

Resolution Diagnostics for Paired LLM Evaluation
di: Kotawala, Anany
Pubblicazione: (2026)

From Imitation to Introspection: Probing Self-Consciousness in Language Models
di: Chen, Sirui, et al.
Pubblicazione: (2024)

Strategic Demonstration Selection for Improved Fairness in LLM In-Context Learning
di: Hu, Jingyu, et al.
Pubblicazione: (2024)

Fair Representation in Parliamentary Summaries: Measuring and Mitigating Inclusion Bias
di: Cunningham, Eoghan, et al.
Pubblicazione: (2025)

GLoRe: When, Where, and How to Improve LLM Reasoning via Global and Local Refinements
di: Havrilla, Alex, et al.
Pubblicazione: (2024)

BadFair: Backdoored Fairness Attacks with Group-conditioned Triggers
di: Xue, Jiaqi, et al.
Pubblicazione: (2024)

GECOBench: A Gender-Controlled Text Dataset and Benchmark for Quantifying Biases in Explanations
di: Wilming, Rick, et al.
Pubblicazione: (2024)

A Behavioural and Representational Evaluation of Goal-Directedness in Language Model Agents
di: Arghal, Raghu, et al.
Pubblicazione: (2026)