Salvato in:
| Autori principali: | Dwivedi-Yu, Jane, Dwivedi, Raaz, Schick, Timo |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2404.06619 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Kernel Thinning
di: Dwivedi, Raaz, et al.
Pubblicazione: (2021)
di: Dwivedi, Raaz, et al.
Pubblicazione: (2021)
Laissez-Faire Harms: Algorithmic Biases in Generative Language Models
di: Shieh, Evan, et al.
Pubblicazione: (2024)
di: Shieh, Evan, et al.
Pubblicazione: (2024)
Debiased Distribution Compression
di: Li, Lingxiao, et al.
Pubblicazione: (2024)
di: Li, Lingxiao, et al.
Pubblicazione: (2024)
Understanding Intrinsic Socioeconomic Biases in Large Language Models
di: Arzaghi, Mina, et al.
Pubblicazione: (2024)
di: Arzaghi, Mina, et al.
Pubblicazione: (2024)
A Toolbox for Surfacing Health Equity Harms and Biases in Large Language Models
di: Pfohl, Stephen R., et al.
Pubblicazione: (2024)
di: Pfohl, Stephen R., et al.
Pubblicazione: (2024)
Large Language Models are Geographically Biased
di: Manvi, Rohin, et al.
Pubblicazione: (2024)
di: Manvi, Rohin, et al.
Pubblicazione: (2024)
Datasets for Fairness in Language Models: An In-Depth Survey
di: Zhang, Jiale, et al.
Pubblicazione: (2025)
di: Zhang, Jiale, et al.
Pubblicazione: (2025)
Empowering Many, Biasing a Few: Generalist Credit Scoring through Large Language Models
di: Feng, Duanyu, et al.
Pubblicazione: (2023)
di: Feng, Duanyu, et al.
Pubblicazione: (2023)
Bias and Fairness in Large Language Models: A Survey
di: Gallegos, Isabel O., et al.
Pubblicazione: (2023)
di: Gallegos, Isabel O., et al.
Pubblicazione: (2023)
AXOLOTL: Fairness through Assisted Self-Debiasing of Large Language Model Outputs
di: Ebrahimi, Sana, et al.
Pubblicazione: (2024)
di: Ebrahimi, Sana, et al.
Pubblicazione: (2024)
CORE: Comprehensive Ontological Relation Evaluation for Large Language Models
di: Dwivedi, Satyam, et al.
Pubblicazione: (2026)
di: Dwivedi, Satyam, et al.
Pubblicazione: (2026)
Subtle Biases Need Subtler Measures: Dual Metrics for Evaluating Representative and Affinity Bias in Large Language Models
di: Kumar, Abhishek, et al.
Pubblicazione: (2024)
di: Kumar, Abhishek, et al.
Pubblicazione: (2024)
LangFair: A Python Package for Assessing Bias and Fairness in Large Language Model Use Cases
di: Bouchard, Dylan, et al.
Pubblicazione: (2025)
di: Bouchard, Dylan, et al.
Pubblicazione: (2025)
Intrinsic Meets Extrinsic Fairness: Assessing the Downstream Impact of Bias Mitigation in Large Language Models
di: Arzaghi', 'Mina, et al.
Pubblicazione: (2025)
di: Arzaghi', 'Mina, et al.
Pubblicazione: (2025)
Large Language Models are Good Relational Learners
di: Wu, Fang, et al.
Pubblicazione: (2025)
di: Wu, Fang, et al.
Pubblicazione: (2025)
Exploring Accuracy-Fairness Trade-off in Large Language Models
di: Zhang, Qingquan, et al.
Pubblicazione: (2024)
di: Zhang, Qingquan, et al.
Pubblicazione: (2024)
ELMES: An Automated Framework for Evaluating Large Language Models in Educational Scenarios
di: Wei, Shou'ang, et al.
Pubblicazione: (2025)
di: Wei, Shou'ang, et al.
Pubblicazione: (2025)
Addressing Both Statistical and Causal Gender Fairness in NLP Models
di: Chen, Hannah, et al.
Pubblicazione: (2024)
di: Chen, Hannah, et al.
Pubblicazione: (2024)
NoisyHate: Mining Online Human-Written Perturbations for Realistic Robustness Benchmarking of Content Moderation Models
di: Ye, Yiran, et al.
Pubblicazione: (2023)
di: Ye, Yiran, et al.
Pubblicazione: (2023)
Are Models Biased on Text without Gender-related Language?
di: Belém, Catarina G, et al.
Pubblicazione: (2024)
di: Belém, Catarina G, et al.
Pubblicazione: (2024)
PRSM: A Measure to Evaluate CLIP's Robustness Against Paraphrases
di: Schlegel, Udo, et al.
Pubblicazione: (2025)
di: Schlegel, Udo, et al.
Pubblicazione: (2025)
Reward Models Inherit Value Biases from Pretraining
di: Christian, Brian, et al.
Pubblicazione: (2026)
di: Christian, Brian, et al.
Pubblicazione: (2026)
Towards Large Language Models that Benefit for All: Benchmarking Group Fairness in Reward Models
di: Song, Kefan, et al.
Pubblicazione: (2025)
di: Song, Kefan, et al.
Pubblicazione: (2025)
Accept or Deny? Evaluating LLM Fairness and Performance in Loan Approval across Table-to-Text Serialization Approaches
di: Azime, Israel Abebe, et al.
Pubblicazione: (2025)
di: Azime, Israel Abebe, et al.
Pubblicazione: (2025)
A Primer on Causal and Statistical Dataset Biases for Fair and Robust Image Analysis
di: Jones, Charles, et al.
Pubblicazione: (2025)
di: Jones, Charles, et al.
Pubblicazione: (2025)
Toward Automated Detection of Biased Social Signals from the Content of Clinical Conversations
di: Chen, Feng, et al.
Pubblicazione: (2024)
di: Chen, Feng, et al.
Pubblicazione: (2024)
Generalization in Healthcare AI: Evaluation of a Clinical Large Language Model
di: Rahman, Salman, et al.
Pubblicazione: (2024)
di: Rahman, Salman, et al.
Pubblicazione: (2024)
Group Fairness Meets the Black Box: Enabling Fair Algorithms on Closed LLMs via Post-Processing
di: Xian, Ruicheng, et al.
Pubblicazione: (2025)
di: Xian, Ruicheng, et al.
Pubblicazione: (2025)
Generalized Kernel Thinning
di: Dwivedi, Raaz, et al.
Pubblicazione: (2021)
di: Dwivedi, Raaz, et al.
Pubblicazione: (2021)
Evaluating Machine Translation Models for English-Hindi Language Pairs: A Comparative Analysis
di: Shetty, Ahan Prasannakumar
Pubblicazione: (2025)
di: Shetty, Ahan Prasannakumar
Pubblicazione: (2025)
Balancing the Scales: Reinforcement Learning for Fair Classification
di: Eshuijs, Leon, et al.
Pubblicazione: (2024)
di: Eshuijs, Leon, et al.
Pubblicazione: (2024)
The "Colonial Impulse" of Natural Language Processing: An Audit of Bengali Sentiment Analysis Tools and Their Identity-based Biases
di: Das, Dipto, et al.
Pubblicazione: (2024)
di: Das, Dipto, et al.
Pubblicazione: (2024)
Resolution Diagnostics for Paired LLM Evaluation
di: Kotawala, Anany
Pubblicazione: (2026)
di: Kotawala, Anany
Pubblicazione: (2026)
From Imitation to Introspection: Probing Self-Consciousness in Language Models
di: Chen, Sirui, et al.
Pubblicazione: (2024)
di: Chen, Sirui, et al.
Pubblicazione: (2024)
Strategic Demonstration Selection for Improved Fairness in LLM In-Context Learning
di: Hu, Jingyu, et al.
Pubblicazione: (2024)
di: Hu, Jingyu, et al.
Pubblicazione: (2024)
Fair Representation in Parliamentary Summaries: Measuring and Mitigating Inclusion Bias
di: Cunningham, Eoghan, et al.
Pubblicazione: (2025)
di: Cunningham, Eoghan, et al.
Pubblicazione: (2025)
GLoRe: When, Where, and How to Improve LLM Reasoning via Global and Local Refinements
di: Havrilla, Alex, et al.
Pubblicazione: (2024)
di: Havrilla, Alex, et al.
Pubblicazione: (2024)
BadFair: Backdoored Fairness Attacks with Group-conditioned Triggers
di: Xue, Jiaqi, et al.
Pubblicazione: (2024)
di: Xue, Jiaqi, et al.
Pubblicazione: (2024)
GECOBench: A Gender-Controlled Text Dataset and Benchmark for Quantifying Biases in Explanations
di: Wilming, Rick, et al.
Pubblicazione: (2024)
di: Wilming, Rick, et al.
Pubblicazione: (2024)
A Behavioural and Representational Evaluation of Goal-Directedness in Language Model Agents
di: Arghal, Raghu, et al.
Pubblicazione: (2026)
di: Arghal, Raghu, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Kernel Thinning
di: Dwivedi, Raaz, et al.
Pubblicazione: (2021) -
Laissez-Faire Harms: Algorithmic Biases in Generative Language Models
di: Shieh, Evan, et al.
Pubblicazione: (2024) -
Debiased Distribution Compression
di: Li, Lingxiao, et al.
Pubblicazione: (2024) -
Understanding Intrinsic Socioeconomic Biases in Large Language Models
di: Arzaghi, Mina, et al.
Pubblicazione: (2024) -
A Toolbox for Surfacing Health Equity Harms and Biases in Large Language Models
di: Pfohl, Stephen R., et al.
Pubblicazione: (2024)