:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Mao, Yuhao, Müller, Mark Niklas, Fischer, Marc, Vechev, Martin
Format:	Preprint
Publié:	2023
Sujets:	Machine Learning Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2306.10426
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

CTBENCH: A Library and Benchmark for Certified Training
par: Mao, Yuhao, et autres
Publié: (2024)

Gaussian Loss Smoothing Enables Certified Training with Tight Convex Relaxations
par: Balauca, Stefan, et autres
Publié: (2024)

Automated Classification of Model Errors on ImageNet
par: Peychev, Momchil, et autres
Publié: (2023)

Average Certified Radius is a Poor Metric for Randomized Smoothing
par: Sun, Chenhao, et autres
Publié: (2024)

Evading Data Contamination Detection for Language Models is (too) Easy
par: Dekoninck, Jasper, et autres
Publié: (2024)

Expressiveness of Multi-Neuron Convex Relaxations in Neural Network Certification
par: Mao, Yuhao, et autres
Publié: (2024)

Dual Randomized Smoothing: Beyond Global Noise Variance
par: Sun, Chenhao, et autres
Publié: (2025)

Learning Compact Boolean Networks
par: Wang, Shengpu, et autres
Publié: (2026)

SWT-Bench: Testing and Validating Real-World Bug-Fixes with Code Agents
par: Mündler, Niels, et autres
Publié: (2024)

Make Interval Bound Propagation great again
par: Krukowski, Patryk, et autres
Publié: (2024)

Back to the Drawing Board for Fair Representation Learning
par: Pouget, Angéline, et autres
Publié: (2024)

Widening the Gap: Exploiting LLM Quantization via Outlier Injection
par: Zhan, Xiaohua, et autres
Publié: (2026)

Watch your steps: Dormant Adversarial Behaviors that Activate upon LLM Finetuning
par: Gloaguen, Thibaud, et autres
Publié: (2025)

A Synthetic Dataset for Personal Attribute Inference
par: Yukhymenko, Hanna, et autres
Publié: (2024)

Quantum Interval Bound Propagation for Certified Training of Quantum Neural Networks
par: Andrews, Emma, et autres
Publié: (2026)

Certified Training with Branch-and-Bound for Lyapunov-stable Neural Control
par: Shi, Zhouxing, et autres
Publié: (2024)

Beyond Memorization: Violating Privacy Via Inference with Large Language Models
par: Staab, Robin, et autres
Publié: (2023)

Pay Attention to the Triggers: Constructing Backdoors That Survive Distillation
par: De Muri, Giovanni, et autres
Publié: (2025)

Private Attribute Inference from Images with Vision-Language Models
par: Tömekçe, Batuhan, et autres
Publié: (2024)

Instruction Tuning for Secure Code Generation
par: He, Jingxuan, et autres
Publié: (2024)

Exploiting LLM Quantization
par: Egashira, Kazuki, et autres
Publié: (2024)

Fewer Weights, More Problems: A Practical Attack on LLM Pruning
par: Egashira, Kazuki, et autres
Publié: (2025)

Mind the Gap: A Practical Attack on GGUF Quantization
par: Egashira, Kazuki, et autres
Publié: (2025)

Watermark Stealing in Large Language Models
par: Jovanović, Nikola, et autres
Publié: (2024)

AlphaIntegrator: Transformer Action Search for Symbolic Integration Proofs
par: Ünsal, Mert, et autres
Publié: (2024)

BrokenMath: A Benchmark for Sycophancy in Theorem Proving with LLMs
par: Petrov, Ivo, et autres
Publié: (2025)

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets
par: Yukhymenko, Hanna, et autres
Publié: (2026)

Delay, Plateau, or Collapse: Evaluating the Impact of Systematic Verification Error on RLVR
par: Egashira, Kazuki, et autres
Publié: (2026)

Automated Benchmark Generation for Repository-Level Coding Tasks
par: Vergopoulos, Konstantinos, et autres
Publié: (2025)

Runtime-Certified Bounded-Error Quantized Attention
par: Calver, Dean
Publié: (2026)

Certified Robustness Under Bounded Levenshtein Distance
par: Rocamora, Elias Abad, et autres
Publié: (2025)

Self-contradictory Hallucinations of Large Language Models: Evaluation, Detection and Mitigation
par: Mündler, Niels, et autres
Publié: (2023)

Discovering Spoofing Attempts on Language Model Watermarks
par: Gloaguen, Thibaud, et autres
Publié: (2024)

Watermarking Diffusion Language Models
par: Gloaguen, Thibaud, et autres
Publié: (2025)

CodeTaste: Can LLMs Generate Human-Level Code Refactorings?
par: Thillen, Alex, et autres
Publié: (2026)

A Unified Framework for LLM Watermarks
par: Gloaguen, Thibaud, et autres
Publié: (2026)

Ward: Provable RAG Dataset Inference via LLM Watermarks
par: Jovanović, Nikola, et autres
Publié: (2024)

AutoBaxBuilder: Bootstrapping Code Security Benchmarking
par: von Arx, Tobias, et autres
Publié: (2025)

MixAT: Combining Continuous and Discrete Adversarial Training for LLMs
par: Dékány, Csaba, et autres
Publié: (2025)

Symmetric Equilibrium Propagation for Thermodynamic Diffusion Training
par: De, Aditi
Publié: (2026)