Gespeichert in:
| Hauptverfasser: | Heydari, Samar, Said, Jawher, Yolcu, Galip Ümit, Kortukov, Evgenii, Golimblevskaia, Elena, Vlachos, Evgenios, Mygdalis, Vasileios, Pitas, Ioannis, Lapuschkin, Sebastian, Arras, Leila |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2603.23020 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Federated Unsupervised Semantic Segmentation
von: Charalampakis, Evangelos, et al.
Veröffentlicht: (2025)
von: Charalampakis, Evangelos, et al.
Veröffentlicht: (2025)
Sparse, Efficient and Explainable Data Attribution with DualXDA
von: Yolcu, Galip Ümit, et al.
Veröffentlicht: (2024)
von: Yolcu, Galip Ümit, et al.
Veröffentlicht: (2024)
Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond
von: Bareeva, Dilyara, et al.
Veröffentlicht: (2024)
von: Bareeva, Dilyara, et al.
Veröffentlicht: (2024)
Leveraging Influence Functions for Resampling Data in Physics-Informed Neural Networks
von: Naujoks, Jonas R., et al.
Veröffentlicht: (2025)
von: Naujoks, Jonas R., et al.
Veröffentlicht: (2025)
A Close Look at Decomposition-based XAI-Methods for Transformer Language Models
von: Arras, Leila, et al.
Veröffentlicht: (2025)
von: Arras, Leila, et al.
Veröffentlicht: (2025)
Concept activation vectors: a unifying view and adversarial attacks
von: Schnoor, Ekkehard, et al.
Veröffentlicht: (2025)
von: Schnoor, Ekkehard, et al.
Veröffentlicht: (2025)
Attribution-Guided Decoding
von: Komorowski, Piotr, et al.
Veröffentlicht: (2025)
von: Komorowski, Piotr, et al.
Veröffentlicht: (2025)
Circuit Insights: Towards Interpretability Beyond Activations
von: Golimblevskaia, Elena, et al.
Veröffentlicht: (2025)
von: Golimblevskaia, Elena, et al.
Veröffentlicht: (2025)
$α$-TCAV: A Unified Framework for Testing with Concept Activation Vectors
von: Schnoor, Ekkehard, et al.
Veröffentlicht: (2026)
von: Schnoor, Ekkehard, et al.
Veröffentlicht: (2026)
FCL-ViT: Task-Aware Attention Tuning for Continual Learning
von: Kaimakamidis, Anestis, et al.
Veröffentlicht: (2024)
von: Kaimakamidis, Anestis, et al.
Veröffentlicht: (2024)
FADE: Why Bad Descriptions Happen to Good Features
von: Puri, Bruno, et al.
Veröffentlicht: (2025)
von: Puri, Bruno, et al.
Veröffentlicht: (2025)
ASIDE: Architectural Separation of Instructions and Data in Language Models
von: Zverev, Egor, et al.
Veröffentlicht: (2025)
von: Zverev, Egor, et al.
Veröffentlicht: (2025)
Collaborative Knowledge Distillation via a Learning-by-Education Node Community
von: Kaimakamidis, Anestis, et al.
Veröffentlicht: (2024)
von: Kaimakamidis, Anestis, et al.
Veröffentlicht: (2024)
Strategic Dishonesty Can Undermine AI Safety Evaluations of Frontier LLMs
von: Panfilov, Alexander, et al.
Veröffentlicht: (2025)
von: Panfilov, Alexander, et al.
Veröffentlicht: (2025)
Synthetic Generation of Dermatoscopic Images with GAN and Closed-Form Factorization
von: Mekala, Rohan Reddy, et al.
Veröffentlicht: (2024)
von: Mekala, Rohan Reddy, et al.
Veröffentlicht: (2024)
Studying Large Language Model Behaviors Under Context-Memory Conflicts With Real Documents
von: Kortukov, Evgenii, et al.
Veröffentlicht: (2024)
von: Kortukov, Evgenii, et al.
Veröffentlicht: (2024)
LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual Semantic Segmentation for Autonomous Driving
von: Guo, Sicen, et al.
Veröffentlicht: (2024)
von: Guo, Sicen, et al.
Veröffentlicht: (2024)
Towards User-Focused Research in Training Data Attribution for Human-Centered Explainable AI
von: Nguyen, Elisa, et al.
Veröffentlicht: (2024)
von: Nguyen, Elisa, et al.
Veröffentlicht: (2024)
Lower bounds for set-blocked clauses proofs
von: Yolcu, Emre
Veröffentlicht: (2024)
von: Yolcu, Emre
Veröffentlicht: (2024)
On Fock covariance for product systems and the reduced Hao-Ng isomorphism problem by discrete actions
von: Kakariadis, Evgenios T. A., et al.
Veröffentlicht: (2024)
von: Kakariadis, Evgenios T. A., et al.
Veröffentlicht: (2024)
How Reliable Are AI Attackers Against a Fixed Vulnerable Target? A 400-Run Empirical Study of LLM Penetration Testing Consistency
von: Erdem, Galip Tolga
Veröffentlicht: (2026)
von: Erdem, Galip Tolga
Veröffentlicht: (2026)
Patrimônio cultural no âmbito escolar no município de Primavera do Leste/MT (1990-2012): entre a experiência e o institucional
von: Janaina Rodrigues Pitas
Veröffentlicht: (2013)
von: Janaina Rodrigues Pitas
Veröffentlicht: (2013)
Post-Hoc Concept Disentanglement: From Correlated to Isolated Concept Representations
von: Erogullari, Eren, et al.
Veröffentlicht: (2025)
von: Erogullari, Eren, et al.
Veröffentlicht: (2025)
Kurumsal Kültürün Cinsiyet Eşitliği Perspektifiyle Yeniden İnşası: Smircich ve Calás Bağlamında Eleştirel Bir Yönetim Yaklaşımı
von: Faruk Selahattin Yolcu
Veröffentlicht: (2025)
von: Faruk Selahattin Yolcu
Veröffentlicht: (2025)
Just rotate it! Uncertainty estimation in closed-source models via multiple queries
von: Pitas, Konstantinos, et al.
Veröffentlicht: (2024)
von: Pitas, Konstantinos, et al.
Veröffentlicht: (2024)
SNE-RoadSegV2: Advancing Heterogeneous Feature Fusion and Fallibility Awareness for Freespace Detection
von: Feng, Yi, et al.
Veröffentlicht: (2024)
von: Feng, Yi, et al.
Veröffentlicht: (2024)
Abductive explanations of classifiers under constraints: Complexity and properties
von: Cooper, Martin, et al.
Veröffentlicht: (2024)
von: Cooper, Martin, et al.
Veröffentlicht: (2024)
TENNOR: Trustworthy Execution for Neural Networks through Obliviousness and Retrievals
von: Qu, Zifan, et al.
Veröffentlicht: (2026)
von: Qu, Zifan, et al.
Veröffentlicht: (2026)
These Maps Are Made by Propagation: Adapting Deep Stereo Networks to Road Scenarios with Decisive Disparity Diffusion
von: Liu, Chuang-Wei, et al.
Veröffentlicht: (2024)
von: Liu, Chuang-Wei, et al.
Veröffentlicht: (2024)
Kompetenzorientierung im Fremdsprachenunterricht - was heißt das eigentlich?
von: Ulrike Arras
Veröffentlicht: (2009)
von: Ulrike Arras
Veröffentlicht: (2009)
Random Schrödinger operators and convolution on wreath products
von: Arras, Adam
Veröffentlicht: (2025)
von: Arras, Adam
Veröffentlicht: (2025)
Some Notes on Quantitative Generalized CLTs with Self-Decomposable Limiting Laws by Spectral Methods
von: Arras, Benjamin
Veröffentlicht: (2023)
von: Arras, Benjamin
Veröffentlicht: (2023)
Regular resolution effectively simulates resolution
von: Buss, Sam, et al.
Veröffentlicht: (2024)
von: Buss, Sam, et al.
Veröffentlicht: (2024)
Mechanism design augmented with output advice
von: Christodoulou, George, et al.
Veröffentlicht: (2024)
von: Christodoulou, George, et al.
Veröffentlicht: (2024)
On hyperrigidity and non-degenerate C*-correspondences
von: Dessi, Joseph A., et al.
Veröffentlicht: (2025)
von: Dessi, Joseph A., et al.
Veröffentlicht: (2025)
TabVer: Tabular Fact Verification with Natural Logic
von: Aly, Rami, et al.
Veröffentlicht: (2024)
von: Aly, Rami, et al.
Veröffentlicht: (2024)
Key Ingredients of Self-Driving Cars
von: Fan, Rui, et al.
Veröffentlicht: (2019)
von: Fan, Rui, et al.
Veröffentlicht: (2019)
Understanding the (Extra-)Ordinary: Validating Deep Model Decisions with Prototypical Concept-based Explanations
von: Dreyer, Maximilian, et al.
Veröffentlicht: (2023)
von: Dreyer, Maximilian, et al.
Veröffentlicht: (2023)
ekornaro2013/Kornaropoulos-et-al.-IEEE-JBHI-paper-2022-Supplementary-Material: Initial release of supplementary material
von: Evgenios N. Kornaropoulos
Veröffentlicht: (2025)
von: Evgenios N. Kornaropoulos
Veröffentlicht: (2025)
One-Step Early Stopping Strategy using Neural Tangent Kernel Theory and Rademacher Complexity
von: Xavier, Daniel Martin, et al.
Veröffentlicht: (2024)
von: Xavier, Daniel Martin, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Federated Unsupervised Semantic Segmentation
von: Charalampakis, Evangelos, et al.
Veröffentlicht: (2025) -
Sparse, Efficient and Explainable Data Attribution with DualXDA
von: Yolcu, Galip Ümit, et al.
Veröffentlicht: (2024) -
Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond
von: Bareeva, Dilyara, et al.
Veröffentlicht: (2024) -
Leveraging Influence Functions for Resampling Data in Physics-Informed Neural Networks
von: Naujoks, Jonas R., et al.
Veröffentlicht: (2025) -
A Close Look at Decomposition-based XAI-Methods for Transformer Language Models
von: Arras, Leila, et al.
Veröffentlicht: (2025)