Salvato in:
| Autori principali: | Wiegmann, Matti, Rakete, Jennifer, Wolska, Magdalena, Stein, Benno, Potthast, Martin |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2404.09615 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Understanding the Perceptions of Trigger Warning and Content Warning on Social Media Platforms in the U.S
di: Zhang, Xinyi, et al.
Pubblicazione: (2025)
di: Zhang, Xinyi, et al.
Pubblicazione: (2025)
Trigger Warnings
Pubblicazione: (2026)
Pubblicazione: (2026)
An Investigation of Warning Erroneous Chat Translations in Cross-lingual Communication
di: Li, Yunmeng, et al.
Pubblicazione: (2024)
di: Li, Yunmeng, et al.
Pubblicazione: (2024)
Analyzing the Safety of Japanese Large Language Models in Stereotype-Triggering Prompts
di: Nakanishi, Akito, et al.
Pubblicazione: (2025)
di: Nakanishi, Akito, et al.
Pubblicazione: (2025)
VIGIL: An Extensible System for Real-Time Detection and Mitigation of Cognitive Bias Triggers
di: Kang, Bo, et al.
Pubblicazione: (2026)
di: Kang, Bo, et al.
Pubblicazione: (2026)
BadFair: Backdoored Fairness Attacks with Group-conditioned Triggers
di: Xue, Jiaqi, et al.
Pubblicazione: (2024)
di: Xue, Jiaqi, et al.
Pubblicazione: (2024)
Task-Oriented Paraphrase Analytics
di: Gohsen, Marcel, et al.
Pubblicazione: (2024)
di: Gohsen, Marcel, et al.
Pubblicazione: (2024)
The Ontological Dissonance Hypothesis: AI-Triggered Delusional Ideation as Folie a Deux Technologique
di: Lipinska, Izabela, et al.
Pubblicazione: (2025)
di: Lipinska, Izabela, et al.
Pubblicazione: (2025)
Are Triggers Needed for Document-Level Event Extraction?
di: Shaar, Shaden, et al.
Pubblicazione: (2024)
di: Shaar, Shaden, et al.
Pubblicazione: (2024)
Causal Effects of Trigger Words in Social Media Discussions: A Large-Scale Case Study about UK Politics on Reddit
di: Antypas, Dimosthenis, et al.
Pubblicazione: (2024)
di: Antypas, Dimosthenis, et al.
Pubblicazione: (2024)
Investigating Adversarial Trigger Transfer in Large Language Models
di: Meade, Nicholas, et al.
Pubblicazione: (2024)
di: Meade, Nicholas, et al.
Pubblicazione: (2024)
Does the Source of a Warning Matter? Examining the Effectiveness of Veracity Warning Labels Across Warners
di: Horne, Benjamin D.
Pubblicazione: (2024)
di: Horne, Benjamin D.
Pubblicazione: (2024)
Universal Adversarial Triggers
di: Arockiaraj, Benedict Florance, et al.
Pubblicazione: (2026)
di: Arockiaraj, Benedict Florance, et al.
Pubblicazione: (2026)
Detecting Generated Native Ads in Conversational Search
di: Schmidt, Sebastian, et al.
Pubblicazione: (2024)
di: Schmidt, Sebastian, et al.
Pubblicazione: (2024)
Linguistic Hooks: Investigating The Role of Language Triggers in Phishing Emails Targeting African Refugees and Students
di: Menon, Mythili, et al.
Pubblicazione: (2025)
di: Menon, Mythili, et al.
Pubblicazione: (2025)
Argumentation in Waltz's "Emerging Structure of International Politics''
di: Wolska, Magdalena, et al.
Pubblicazione: (2023)
di: Wolska, Magdalena, et al.
Pubblicazione: (2023)
An Early Warning Model for Forced Displacement
di: Henningsen, Geraldine
Pubblicazione: (2025)
di: Henningsen, Geraldine
Pubblicazione: (2025)
Future Events as Backdoor Triggers: Investigating Temporal Vulnerabilities in LLMs
di: Price, Sara, et al.
Pubblicazione: (2024)
di: Price, Sara, et al.
Pubblicazione: (2024)
Can I guess where you are from? Modeling dialectal morphosyntactic similarities in Brazilian Portuguese
di: Siqueira, Manoel, et al.
Pubblicazione: (2026)
di: Siqueira, Manoel, et al.
Pubblicazione: (2026)
Storm Warning.
di: Filmer, Paul E.
Pubblicazione: (1995)
di: Filmer, Paul E.
Pubblicazione: (1995)
NatLan: Native Language Prompting Facilitates Knowledge Elicitation Through Language Trigger Provision and Domain Trigger Retention
di: Li, Baixuan, et al.
Pubblicazione: (2024)
di: Li, Baixuan, et al.
Pubblicazione: (2024)
Contextualising (Im)plausible Events Triggers Figurative Language
di: Eichel, Annerose, et al.
Pubblicazione: (2026)
di: Eichel, Annerose, et al.
Pubblicazione: (2026)
DeepInnovator: Triggering the Innovative Capabilities of LLMs
di: Fan, Tianyu, et al.
Pubblicazione: (2026)
di: Fan, Tianyu, et al.
Pubblicazione: (2026)
Investigating Symbolic Triggers of Hallucination in Gemma Models Across HaluEval and TruthfulQA
di: Lamba, Naveen, et al.
Pubblicazione: (2025)
di: Lamba, Naveen, et al.
Pubblicazione: (2025)
Toward Finding and Supporting Struggling Students in a Programming Course with an Early Warning System
di: Schantong, Belinda, et al.
Pubblicazione: (2024)
di: Schantong, Belinda, et al.
Pubblicazione: (2024)
Data Voids and Warning Banners on Google Search
di: Robertson, Ronald E., et al.
Pubblicazione: (2025)
di: Robertson, Ronald E., et al.
Pubblicazione: (2025)
Backdoor Attacks on Dense Retrieval via Public and Unintentional Triggers
di: Long, Quanyu, et al.
Pubblicazione: (2024)
di: Long, Quanyu, et al.
Pubblicazione: (2024)
Adaptive Deep Reasoning: Triggering Deep Thinking When Needed
di: Wang, Yunhao, et al.
Pubblicazione: (2025)
di: Wang, Yunhao, et al.
Pubblicazione: (2025)
Are Security Cues Static? Rethinking Warning and Trust Indicators for Life Transitions
di: Tabassum, Sarah
Pubblicazione: (2026)
di: Tabassum, Sarah
Pubblicazione: (2026)
Learning from Negative Examples: Why Warning-Framed Training Data Teaches What It Warns Against
di: Enkhbayar, Tsogt-Ochir
Pubblicazione: (2025)
di: Enkhbayar, Tsogt-Ochir
Pubblicazione: (2025)
Mid-Think: Training-Free Intermediate-Budget Reasoning via Token-Level Triggers
di: Yang, Wang, et al.
Pubblicazione: (2026)
di: Yang, Wang, et al.
Pubblicazione: (2026)
Language-Switching Triggers Take a Latent Detour Through Language Models
di: Kulumba, Francis, et al.
Pubblicazione: (2026)
di: Kulumba, Francis, et al.
Pubblicazione: (2026)
Trigger$^3$: Refining Query Correction via Adaptive Model Selector
di: Zhang, Kepu, et al.
Pubblicazione: (2024)
di: Zhang, Kepu, et al.
Pubblicazione: (2024)
TWeddit : A Dataset of Triggering Stories Predominantly Shared by Women on Reddit
di: Bandela, Shirlene Rose, et al.
Pubblicazione: (2026)
di: Bandela, Shirlene Rose, et al.
Pubblicazione: (2026)
Small Models are LLM Knowledge Triggers on Medical Tabular Prediction
di: Yan, Jiahuan, et al.
Pubblicazione: (2024)
di: Yan, Jiahuan, et al.
Pubblicazione: (2024)
Prompt as Triggers for Backdoor Attack: Examining the Vulnerability in Language Models
di: Zhao, Shuai, et al.
Pubblicazione: (2023)
di: Zhao, Shuai, et al.
Pubblicazione: (2023)
ExpSeek: Self-Triggered Experience Seeking for Web Agents
di: Zhang, Wenyuan, et al.
Pubblicazione: (2026)
di: Zhang, Wenyuan, et al.
Pubblicazione: (2026)
Coordinated Disclosure of Dual-Use Capabilities: An Early Warning System for Advanced AI
di: O'Brien, Joe, et al.
Pubblicazione: (2024)
di: O'Brien, Joe, et al.
Pubblicazione: (2024)
Earthquake Early Warning and Beyond: Systems Challenges in Smartphone-based Seismic Network
di: Kong, Qingkai, et al.
Pubblicazione: (2019)
di: Kong, Qingkai, et al.
Pubblicazione: (2019)
Multi-Trigger Poisoning Amplifies Backdoor Vulnerabilities in LLMs
di: Sivapiromrat, Sanhanat, et al.
Pubblicazione: (2025)
di: Sivapiromrat, Sanhanat, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Understanding the Perceptions of Trigger Warning and Content Warning on Social Media Platforms in the U.S
di: Zhang, Xinyi, et al.
Pubblicazione: (2025) -
Trigger Warnings
Pubblicazione: (2026) -
An Investigation of Warning Erroneous Chat Translations in Cross-lingual Communication
di: Li, Yunmeng, et al.
Pubblicazione: (2024) -
Analyzing the Safety of Japanese Large Language Models in Stereotype-Triggering Prompts
di: Nakanishi, Akito, et al.
Pubblicazione: (2025) -
VIGIL: An Extensible System for Real-Time Detection and Mitigation of Cognitive Bias Triggers
di: Kang, Bo, et al.
Pubblicazione: (2026)