محفوظ في:
التفاصيل البيبلوغرافية
المؤلف الرئيسي: Llorente-Saguer, Isaac
التنسيق: Recurso digital
اللغة:
منشور في: Zenodo 2026
الموضوعات:
الوصول للمادة أونلاين:https://doi.org/10.5281/zenodo.19294977
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
جدول المحتويات:
  • A zero-shot geometric anomaly detector for LLM residual streams. The method identifies harmful or anomalous prompts by measuring angular deviations from a normative (safe) manifold in hidden representations, using PCA-derived reference directions and Gaussian Mixture Model scoring. No harmful examples are required at fit time under the normative reference strategy.