Gespeichert in:
| Hauptverfasser: | Wang, Qian, Lou, Zhanzhi, Tang, Zhenheng, Chen, Nuo, Zhao, Xuandong, Zhang, Wenxuan, Song, Dawn, He, Bingsheng |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2504.09946 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Towards Evaluting Fake Reasoning Bias in Language Models
von: Wang, Qian, et al.
Veröffentlicht: (2025)
von: Wang, Qian, et al.
Veröffentlicht: (2025)
Making Bias Non-Predictive: Training Robust LLM Reasoning via Reinforcement Learning
von: Wang, Qian, et al.
Veröffentlicht: (2026)
von: Wang, Qian, et al.
Veröffentlicht: (2026)
JudgeLRM: Large Reasoning Models as a Judge
von: Chen, Nuo, et al.
Veröffentlicht: (2025)
von: Chen, Nuo, et al.
Veröffentlicht: (2025)
From ChatGPT to DeepSeek: Can LLMs Simulate Humanity?
von: Wang, Qian, et al.
Veröffentlicht: (2025)
von: Wang, Qian, et al.
Veröffentlicht: (2025)
Position: The Current AI Conference Model is Unsustainable! Diagnosing the Crisis of Centralized AI Conference
von: Chen, Nuo, et al.
Veröffentlicht: (2025)
von: Chen, Nuo, et al.
Veröffentlicht: (2025)
LLM-based Human Simulations Have Not Yet Been Reliable
von: Wang, Qian, et al.
Veröffentlicht: (2025)
von: Wang, Qian, et al.
Veröffentlicht: (2025)
Beyond Brainstorming: What Drives High-Quality Scientific Ideas? Lessons from Multi-Agent Collaboration
von: Chen, Nuo, et al.
Veröffentlicht: (2025)
von: Chen, Nuo, et al.
Veröffentlicht: (2025)
Scalable Best-of-N Selection for Large Language Models via Self-Certainty
von: Kang, Zhewei, et al.
Veröffentlicht: (2025)
von: Kang, Zhewei, et al.
Veröffentlicht: (2025)
JudgeMeNot: Personalizing Large Language Models to Emulate Judicial Reasoning in Hebrew
von: Razumenko, Itay, et al.
Veröffentlicht: (2026)
von: Razumenko, Itay, et al.
Veröffentlicht: (2026)
In-Context Watermarks for Large Language Models
von: Liu, Yepeng, et al.
Veröffentlicht: (2025)
von: Liu, Yepeng, et al.
Veröffentlicht: (2025)
Language of Thought Shapes Output Diversity in Large Language Models
von: Xu, Shaoyang, et al.
Veröffentlicht: (2026)
von: Xu, Shaoyang, et al.
Veröffentlicht: (2026)
Inference-Time Reasoning Selectively Reduces Implicit Social Bias in Large Language Models
von: Apsel, Molly, et al.
Veröffentlicht: (2026)
von: Apsel, Molly, et al.
Veröffentlicht: (2026)
Translate With Care: Addressing Gender Bias, Neutrality, and Reasoning in Large Language Model Translations
von: Zahraei, Pardis Sadat, et al.
Veröffentlicht: (2025)
von: Zahraei, Pardis Sadat, et al.
Veröffentlicht: (2025)
The Hidden Risks of Large Reasoning Models: A Safety Assessment of R1
von: Zhou, Kaiwen, et al.
Veröffentlicht: (2025)
von: Zhou, Kaiwen, et al.
Veröffentlicht: (2025)
Different Bias Under Different Criteria: Assessing Bias in LLMs with a Fact-Based Approach
von: Ko, Changgeon, et al.
Veröffentlicht: (2024)
von: Ko, Changgeon, et al.
Veröffentlicht: (2024)
BiasFreeBench: a Benchmark for Mitigating Bias in Large Language Model Responses
von: Xu, Xin, et al.
Veröffentlicht: (2025)
von: Xu, Xin, et al.
Veröffentlicht: (2025)
Intrinsic Meets Extrinsic Fairness: Assessing the Downstream Impact of Bias Mitigation in Large Language Models
von: Arzaghi', 'Mina, et al.
Veröffentlicht: (2025)
von: Arzaghi', 'Mina, et al.
Veröffentlicht: (2025)
Learning to Reason without External Rewards
von: Zhao, Xuandong, et al.
Veröffentlicht: (2025)
von: Zhao, Xuandong, et al.
Veröffentlicht: (2025)
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs
von: Cai, Will, et al.
Veröffentlicht: (2025)
von: Cai, Will, et al.
Veröffentlicht: (2025)
Characterizing Selective Refusal Bias in Large Language Models
von: Khorramrouz, Adel, et al.
Veröffentlicht: (2025)
von: Khorramrouz, Adel, et al.
Veröffentlicht: (2025)
Gender Bias in Emotion Recognition by Large Language Models
von: Herbert, Maureen, et al.
Veröffentlicht: (2025)
von: Herbert, Maureen, et al.
Veröffentlicht: (2025)
Beyond English: Unveiling Multilingual Bias in LLM Copyright Compliance
von: Chen, Yupeng, et al.
Veröffentlicht: (2025)
von: Chen, Yupeng, et al.
Veröffentlicht: (2025)
InfoSynth: Information-Guided Benchmark Synthesis for LLMs
von: Garg, Ishir, et al.
Veröffentlicht: (2026)
von: Garg, Ishir, et al.
Veröffentlicht: (2026)
AgentSynth: Scalable Task Generation for Generalist Computer-Use Agents
von: Xie, Jingxu, et al.
Veröffentlicht: (2025)
von: Xie, Jingxu, et al.
Veröffentlicht: (2025)
Self-Sovereign Agent
von: Qu, Wenjie, et al.
Veröffentlicht: (2026)
von: Qu, Wenjie, et al.
Veröffentlicht: (2026)
Measuring Implicit Bias in Explicitly Unbiased Large Language Models
von: Bai, Xuechunzi, et al.
Veröffentlicht: (2024)
von: Bai, Xuechunzi, et al.
Veröffentlicht: (2024)
Policy Frameworks for Transparent Chain-of-Thought Reasoning in Large Language Models
von: Chen, Yihang, et al.
Veröffentlicht: (2025)
von: Chen, Yihang, et al.
Veröffentlicht: (2025)
Assessing the Impact of Conspiracy Theories Using Large Language Models
von: Jiang, Bohan, et al.
Veröffentlicht: (2024)
von: Jiang, Bohan, et al.
Veröffentlicht: (2024)
AesBiasBench: Evaluating Bias and Alignment in Multimodal Language Models for Personalized Image Aesthetic Assessment
von: Li, Kun, et al.
Veröffentlicht: (2025)
von: Li, Kun, et al.
Veröffentlicht: (2025)
LangFair: A Python Package for Assessing Bias and Fairness in Large Language Model Use Cases
von: Bouchard, Dylan, et al.
Veröffentlicht: (2025)
von: Bouchard, Dylan, et al.
Veröffentlicht: (2025)
Potential and Perils of Large Language Models as Judges of Unstructured Textual Data
von: Bedemariam, Rewina, et al.
Veröffentlicht: (2025)
von: Bedemariam, Rewina, et al.
Veröffentlicht: (2025)
Sentient Agent as a Judge: Evaluating Higher-Order Social Cognition in Large Language Models
von: Zhang, Bang, et al.
Veröffentlicht: (2025)
von: Zhang, Bang, et al.
Veröffentlicht: (2025)
A Unified Framework and Dataset for Assessing Societal Bias in Vision-Language Models
von: Sathe, Ashutosh, et al.
Veröffentlicht: (2024)
von: Sathe, Ashutosh, et al.
Veröffentlicht: (2024)
Towards Equitable AI: Detecting Bias in Using Large Language Models for Marketing
von: Yilmaz, Berk, et al.
Veröffentlicht: (2025)
von: Yilmaz, Berk, et al.
Veröffentlicht: (2025)
Characterizing Bias: Benchmarking Large Language Models in Simplified versus Traditional Chinese
von: Lyu, Hanjia, et al.
Veröffentlicht: (2025)
von: Lyu, Hanjia, et al.
Veröffentlicht: (2025)
A Framework to Assess the Persuasion Risks Large Language Model Chatbots Pose to Democratic Societies
von: Chen, Zhongren, et al.
Veröffentlicht: (2025)
von: Chen, Zhongren, et al.
Veröffentlicht: (2025)
Improving and Assessing the Fidelity of Large Language Models Alignment to Online Communities
von: Chu, Minh Duc, et al.
Veröffentlicht: (2024)
von: Chu, Minh Duc, et al.
Veröffentlicht: (2024)
What Large Language Models Do Not Talk About: An Empirical Study of Moderation and Censorship Practices
von: Noels, Sander, et al.
Veröffentlicht: (2025)
von: Noels, Sander, et al.
Veröffentlicht: (2025)
Ask LLMs Directly, "What shapes your bias?": Measuring Social Bias in Large Language Models
von: Shin, Jisu, et al.
Veröffentlicht: (2024)
von: Shin, Jisu, et al.
Veröffentlicht: (2024)
Dataset Protection via Watermarked Canaries in Retrieval-Augmented LLMs
von: Liu, Yepeng, et al.
Veröffentlicht: (2025)
von: Liu, Yepeng, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Towards Evaluting Fake Reasoning Bias in Language Models
von: Wang, Qian, et al.
Veröffentlicht: (2025) -
Making Bias Non-Predictive: Training Robust LLM Reasoning via Reinforcement Learning
von: Wang, Qian, et al.
Veröffentlicht: (2026) -
JudgeLRM: Large Reasoning Models as a Judge
von: Chen, Nuo, et al.
Veröffentlicht: (2025) -
From ChatGPT to DeepSeek: Can LLMs Simulate Humanity?
von: Wang, Qian, et al.
Veröffentlicht: (2025) -
Position: The Current AI Conference Model is Unsustainable! Diagnosing the Crisis of Centralized AI Conference
von: Chen, Nuo, et al.
Veröffentlicht: (2025)