Salvato in:
| Autori principali: | Ai, Yiming, He, Zhiwei, Zhang, Ziyin, Zhu, Wenhong, Hao, Hongkun, Yu, Kai, Chen, Lingjun, Wang, Rui |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2402.14679 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Improving Open-Ended Text Generation via Adaptive Decoding
di: Zhu, Wenhong, et al.
Pubblicazione: (2024)
di: Zhu, Wenhong, et al.
Pubblicazione: (2024)
CLEAN-EVAL: Clean Evaluation on Contaminated Large Language Models
di: Zhu, Wenhong, et al.
Pubblicazione: (2023)
di: Zhu, Wenhong, et al.
Pubblicazione: (2023)
Do Large Language Models Truly Understand Geometric Structures?
di: Wang, Xiaofeng, et al.
Pubblicazione: (2025)
di: Wang, Xiaofeng, et al.
Pubblicazione: (2025)
Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models
di: He, Zhiwei, et al.
Pubblicazione: (2024)
di: He, Zhiwei, et al.
Pubblicazione: (2024)
JiraiBench: A Bilingual Benchmark for Evaluating Large Language Models' Detection of Human Self-Destructive Behavior Content in Jirai Community
di: Xiao, Yunze, et al.
Pubblicazione: (2025)
di: Xiao, Yunze, et al.
Pubblicazione: (2025)
Investigating Cultural Alignment of Large Language Models
di: AlKhamissi, Badr, et al.
Pubblicazione: (2024)
di: AlKhamissi, Badr, et al.
Pubblicazione: (2024)
Semantic Consistency for Assuring Reliability of Large Language Models
di: Raj, Harsh, et al.
Pubblicazione: (2023)
di: Raj, Harsh, et al.
Pubblicazione: (2023)
Voice Under Revision: Large Language Models and the Normalization of Personal Narrative
di: van Nuenen, Tom
Pubblicazione: (2026)
di: van Nuenen, Tom
Pubblicazione: (2026)
LLM Agents in Interaction: Measuring Personality Consistency and Linguistic Alignment in Interacting Populations of Large Language Models
di: Frisch, Ivar, et al.
Pubblicazione: (2024)
di: Frisch, Ivar, et al.
Pubblicazione: (2024)
Multiple-Choice Questions are Efficient and Robust LLM Evaluators
di: Zhang, Ziyin, et al.
Pubblicazione: (2024)
di: Zhang, Ziyin, et al.
Pubblicazione: (2024)
How Susceptible are Large Language Models to Ideological Manipulation?
di: Chen, Kai, et al.
Pubblicazione: (2024)
di: Chen, Kai, et al.
Pubblicazione: (2024)
JudgeMeNot: Personalizing Large Language Models to Emulate Judicial Reasoning in Hebrew
di: Razumenko, Itay, et al.
Pubblicazione: (2026)
di: Razumenko, Itay, et al.
Pubblicazione: (2026)
Weak-to-Strong Preference Optimization: Stealing Reward from Weak Aligned Model
di: Zhu, Wenhong, et al.
Pubblicazione: (2024)
di: Zhu, Wenhong, et al.
Pubblicazione: (2024)
Can Large Language Models Understand You Better? An MBTI Personality Detection Dataset Aligned with Population Traits
di: Li, Bohan, et al.
Pubblicazione: (2024)
di: Li, Bohan, et al.
Pubblicazione: (2024)
Climate Change from Large Language Models
di: Zhu, Hongyin, et al.
Pubblicazione: (2023)
di: Zhu, Hongyin, et al.
Pubblicazione: (2023)
Self-Alignment of Large Language Models via Monopolylogue-based Social Scene Simulation
di: Pang, Xianghe, et al.
Pubblicazione: (2024)
di: Pang, Xianghe, et al.
Pubblicazione: (2024)
Investigating Political and Demographic Associations in Large Language Models Through Moral Foundations Theory
di: Smith-Vaniz, Nicole, et al.
Pubblicazione: (2025)
di: Smith-Vaniz, Nicole, et al.
Pubblicazione: (2025)
"Pull or Not to Pull?'': Investigating Moral Biases in Leading Large Language Models Across Ethical Dilemmas
di: Ding, Junchen, et al.
Pubblicazione: (2025)
di: Ding, Junchen, et al.
Pubblicazione: (2025)
An Investigation into Misuse of Java Security APIs by Large Language Models
di: Mousavi, Zahra, et al.
Pubblicazione: (2024)
di: Mousavi, Zahra, et al.
Pubblicazione: (2024)
Dual Traits in Probabilistic Reasoning of Large Language Models
di: Li, Shenxiong, et al.
Pubblicazione: (2024)
di: Li, Shenxiong, et al.
Pubblicazione: (2024)
Navigating the Risks of Using Large Language Models for Text Annotation in Social Science Research
di: Lin, Hao, et al.
Pubblicazione: (2025)
di: Lin, Hao, et al.
Pubblicazione: (2025)
Math anxiety and associative knowledge structure are entwined in psychology students but not in Large Language Models like GPT-3.5 and GPT-4o
di: Ciringione, Luciana, et al.
Pubblicazione: (2025)
di: Ciringione, Luciana, et al.
Pubblicazione: (2025)
Adding Alignment Control to Language Models
di: Zhu, Wenhong, et al.
Pubblicazione: (2025)
di: Zhu, Wenhong, et al.
Pubblicazione: (2025)
A Systematic Analysis of Biases in Large Language Models
di: Zhang, Xulang, et al.
Pubblicazione: (2025)
di: Zhang, Xulang, et al.
Pubblicazione: (2025)
Editing Personality for Large Language Models
di: Mao, Shengyu, et al.
Pubblicazione: (2023)
di: Mao, Shengyu, et al.
Pubblicazione: (2023)
What do Large Language Models Say About Animals? Investigating Risks of Animal Harm in Generated Text
di: Kanepajs, Arturs, et al.
Pubblicazione: (2025)
di: Kanepajs, Arturs, et al.
Pubblicazione: (2025)
Open Models, Closed Minds? On Agents Capabilities in Mimicking Human Personalities through Open Large Language Models
di: La Cava, Lucio, et al.
Pubblicazione: (2024)
di: La Cava, Lucio, et al.
Pubblicazione: (2024)
Born With a Silver Spoon? Investigating Socioeconomic Bias in Large Language Models
di: Singh, Smriti, et al.
Pubblicazione: (2024)
di: Singh, Smriti, et al.
Pubblicazione: (2024)
MirrorStories: Reflecting Diversity through Personalized Narrative Generation with Large Language Models
di: Yunusov, Sarfaroz, et al.
Pubblicazione: (2024)
di: Yunusov, Sarfaroz, et al.
Pubblicazione: (2024)
Cancer-Myth: Evaluating Large Language Models on Patient Questions with False Presuppositions
di: Zhu, Wang Bill, et al.
Pubblicazione: (2025)
di: Zhu, Wang Bill, et al.
Pubblicazione: (2025)
Self-Blinding and Counterfactual Self-Simulation Mitigate Biases and Sycophancy in Large Language Models
di: Christian, Brian, et al.
Pubblicazione: (2026)
di: Christian, Brian, et al.
Pubblicazione: (2026)
Accuracy and Political Bias of News Source Credibility Ratings by Large Language Models
di: Yang, Kai-Cheng, et al.
Pubblicazione: (2023)
di: Yang, Kai-Cheng, et al.
Pubblicazione: (2023)
Evaluating Proactive Risk Awareness of Large Language Models
di: Luo, Xuan, et al.
Pubblicazione: (2026)
di: Luo, Xuan, et al.
Pubblicazione: (2026)
Mapping Trustworthiness in Large Language Models: A Bibliometric Analysis Bridging Theory to Practice
di: de Cerqueira, José Siqueira, et al.
Pubblicazione: (2025)
di: de Cerqueira, José Siqueira, et al.
Pubblicazione: (2025)
Raising the Bar: Investigating the Values of Large Language Models via Generative Evolving Testing
di: Jiang, Han, et al.
Pubblicazione: (2024)
di: Jiang, Han, et al.
Pubblicazione: (2024)
CDEval: A Benchmark for Measuring the Cultural Dimensions of Large Language Models
di: Wang, Yuhang, et al.
Pubblicazione: (2023)
di: Wang, Yuhang, et al.
Pubblicazione: (2023)
When Symptoms Are Not Enough: Evidence-Weighting Patterns in Large Language Model Psychiatric Screening
di: Zhu, Jianfeng, et al.
Pubblicazione: (2026)
di: Zhu, Jianfeng, et al.
Pubblicazione: (2026)
Motivation in Large Language Models
di: Nahum, Omer, et al.
Pubblicazione: (2026)
di: Nahum, Omer, et al.
Pubblicazione: (2026)
ELMES: An Automated Framework for Evaluating Large Language Models in Educational Scenarios
di: Wei, Shou'ang, et al.
Pubblicazione: (2025)
di: Wei, Shou'ang, et al.
Pubblicazione: (2025)
Question-Answering (QA) Model for a Personalized Learning Assistant for Arabic Language
di: Sammoudi, Mohammad, et al.
Pubblicazione: (2024)
di: Sammoudi, Mohammad, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Improving Open-Ended Text Generation via Adaptive Decoding
di: Zhu, Wenhong, et al.
Pubblicazione: (2024) -
CLEAN-EVAL: Clean Evaluation on Contaminated Large Language Models
di: Zhu, Wenhong, et al.
Pubblicazione: (2023) -
Do Large Language Models Truly Understand Geometric Structures?
di: Wang, Xiaofeng, et al.
Pubblicazione: (2025) -
Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models
di: He, Zhiwei, et al.
Pubblicazione: (2024) -
JiraiBench: A Bilingual Benchmark for Evaluating Large Language Models' Detection of Human Self-Destructive Behavior Content in Jirai Community
di: Xiao, Yunze, et al.
Pubblicazione: (2025)