محفوظ في:
| المؤلف الرئيسي: | |
|---|---|
| التنسيق: | Recurso digital |
| اللغة: | |
| منشور في: |
Zenodo
2026
|
| الموضوعات: | |
| الوصول للمادة أونلاين: | https://doi.org/10.5281/zenodo.19294977 |
| الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
جدول المحتويات:
- A zero-shot geometric anomaly detector for LLM residual streams. The method identifies harmful or anomalous prompts by measuring angular deviations from a normative (safe) manifold in hidden representations, using PCA-derived reference directions and Gaussian Mixture Model scoring. No harmful examples are required at fit time under the normative reference strategy.