Enregistré dans:
| Auteurs principaux: | Mao, Yuhao, Müller, Mark Niklas, Fischer, Marc, Vechev, Martin |
|---|---|
| Format: | Preprint |
| Publié: |
2023
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2306.10426 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
CTBENCH: A Library and Benchmark for Certified Training
par: Mao, Yuhao, et autres
Publié: (2024)
par: Mao, Yuhao, et autres
Publié: (2024)
Gaussian Loss Smoothing Enables Certified Training with Tight Convex Relaxations
par: Balauca, Stefan, et autres
Publié: (2024)
par: Balauca, Stefan, et autres
Publié: (2024)
Automated Classification of Model Errors on ImageNet
par: Peychev, Momchil, et autres
Publié: (2023)
par: Peychev, Momchil, et autres
Publié: (2023)
Average Certified Radius is a Poor Metric for Randomized Smoothing
par: Sun, Chenhao, et autres
Publié: (2024)
par: Sun, Chenhao, et autres
Publié: (2024)
Evading Data Contamination Detection for Language Models is (too) Easy
par: Dekoninck, Jasper, et autres
Publié: (2024)
par: Dekoninck, Jasper, et autres
Publié: (2024)
Expressiveness of Multi-Neuron Convex Relaxations in Neural Network Certification
par: Mao, Yuhao, et autres
Publié: (2024)
par: Mao, Yuhao, et autres
Publié: (2024)
Dual Randomized Smoothing: Beyond Global Noise Variance
par: Sun, Chenhao, et autres
Publié: (2025)
par: Sun, Chenhao, et autres
Publié: (2025)
Learning Compact Boolean Networks
par: Wang, Shengpu, et autres
Publié: (2026)
par: Wang, Shengpu, et autres
Publié: (2026)
SWT-Bench: Testing and Validating Real-World Bug-Fixes with Code Agents
par: Mündler, Niels, et autres
Publié: (2024)
par: Mündler, Niels, et autres
Publié: (2024)
Make Interval Bound Propagation great again
par: Krukowski, Patryk, et autres
Publié: (2024)
par: Krukowski, Patryk, et autres
Publié: (2024)
Back to the Drawing Board for Fair Representation Learning
par: Pouget, Angéline, et autres
Publié: (2024)
par: Pouget, Angéline, et autres
Publié: (2024)
Widening the Gap: Exploiting LLM Quantization via Outlier Injection
par: Zhan, Xiaohua, et autres
Publié: (2026)
par: Zhan, Xiaohua, et autres
Publié: (2026)
Watch your steps: Dormant Adversarial Behaviors that Activate upon LLM Finetuning
par: Gloaguen, Thibaud, et autres
Publié: (2025)
par: Gloaguen, Thibaud, et autres
Publié: (2025)
A Synthetic Dataset for Personal Attribute Inference
par: Yukhymenko, Hanna, et autres
Publié: (2024)
par: Yukhymenko, Hanna, et autres
Publié: (2024)
Quantum Interval Bound Propagation for Certified Training of Quantum Neural Networks
par: Andrews, Emma, et autres
Publié: (2026)
par: Andrews, Emma, et autres
Publié: (2026)
Certified Training with Branch-and-Bound for Lyapunov-stable Neural Control
par: Shi, Zhouxing, et autres
Publié: (2024)
par: Shi, Zhouxing, et autres
Publié: (2024)
Beyond Memorization: Violating Privacy Via Inference with Large Language Models
par: Staab, Robin, et autres
Publié: (2023)
par: Staab, Robin, et autres
Publié: (2023)
Pay Attention to the Triggers: Constructing Backdoors That Survive Distillation
par: De Muri, Giovanni, et autres
Publié: (2025)
par: De Muri, Giovanni, et autres
Publié: (2025)
Private Attribute Inference from Images with Vision-Language Models
par: Tömekçe, Batuhan, et autres
Publié: (2024)
par: Tömekçe, Batuhan, et autres
Publié: (2024)
Instruction Tuning for Secure Code Generation
par: He, Jingxuan, et autres
Publié: (2024)
par: He, Jingxuan, et autres
Publié: (2024)
Exploiting LLM Quantization
par: Egashira, Kazuki, et autres
Publié: (2024)
par: Egashira, Kazuki, et autres
Publié: (2024)
Fewer Weights, More Problems: A Practical Attack on LLM Pruning
par: Egashira, Kazuki, et autres
Publié: (2025)
par: Egashira, Kazuki, et autres
Publié: (2025)
Mind the Gap: A Practical Attack on GGUF Quantization
par: Egashira, Kazuki, et autres
Publié: (2025)
par: Egashira, Kazuki, et autres
Publié: (2025)
Watermark Stealing in Large Language Models
par: Jovanović, Nikola, et autres
Publié: (2024)
par: Jovanović, Nikola, et autres
Publié: (2024)
AlphaIntegrator: Transformer Action Search for Symbolic Integration Proofs
par: Ünsal, Mert, et autres
Publié: (2024)
par: Ünsal, Mert, et autres
Publié: (2024)
BrokenMath: A Benchmark for Sycophancy in Theorem Proving with LLMs
par: Petrov, Ivo, et autres
Publié: (2025)
par: Petrov, Ivo, et autres
Publié: (2025)
Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets
par: Yukhymenko, Hanna, et autres
Publié: (2026)
par: Yukhymenko, Hanna, et autres
Publié: (2026)
Delay, Plateau, or Collapse: Evaluating the Impact of Systematic Verification Error on RLVR
par: Egashira, Kazuki, et autres
Publié: (2026)
par: Egashira, Kazuki, et autres
Publié: (2026)
Automated Benchmark Generation for Repository-Level Coding Tasks
par: Vergopoulos, Konstantinos, et autres
Publié: (2025)
par: Vergopoulos, Konstantinos, et autres
Publié: (2025)
Runtime-Certified Bounded-Error Quantized Attention
par: Calver, Dean
Publié: (2026)
par: Calver, Dean
Publié: (2026)
Certified Robustness Under Bounded Levenshtein Distance
par: Rocamora, Elias Abad, et autres
Publié: (2025)
par: Rocamora, Elias Abad, et autres
Publié: (2025)
Self-contradictory Hallucinations of Large Language Models: Evaluation, Detection and Mitigation
par: Mündler, Niels, et autres
Publié: (2023)
par: Mündler, Niels, et autres
Publié: (2023)
Discovering Spoofing Attempts on Language Model Watermarks
par: Gloaguen, Thibaud, et autres
Publié: (2024)
par: Gloaguen, Thibaud, et autres
Publié: (2024)
Watermarking Diffusion Language Models
par: Gloaguen, Thibaud, et autres
Publié: (2025)
par: Gloaguen, Thibaud, et autres
Publié: (2025)
CodeTaste: Can LLMs Generate Human-Level Code Refactorings?
par: Thillen, Alex, et autres
Publié: (2026)
par: Thillen, Alex, et autres
Publié: (2026)
A Unified Framework for LLM Watermarks
par: Gloaguen, Thibaud, et autres
Publié: (2026)
par: Gloaguen, Thibaud, et autres
Publié: (2026)
Ward: Provable RAG Dataset Inference via LLM Watermarks
par: Jovanović, Nikola, et autres
Publié: (2024)
par: Jovanović, Nikola, et autres
Publié: (2024)
AutoBaxBuilder: Bootstrapping Code Security Benchmarking
par: von Arx, Tobias, et autres
Publié: (2025)
par: von Arx, Tobias, et autres
Publié: (2025)
MixAT: Combining Continuous and Discrete Adversarial Training for LLMs
par: Dékány, Csaba, et autres
Publié: (2025)
par: Dékány, Csaba, et autres
Publié: (2025)
Symmetric Equilibrium Propagation for Thermodynamic Diffusion Training
par: De, Aditi
Publié: (2026)
par: De, Aditi
Publié: (2026)
Documents similaires
-
CTBENCH: A Library and Benchmark for Certified Training
par: Mao, Yuhao, et autres
Publié: (2024) -
Gaussian Loss Smoothing Enables Certified Training with Tight Convex Relaxations
par: Balauca, Stefan, et autres
Publié: (2024) -
Automated Classification of Model Errors on ImageNet
par: Peychev, Momchil, et autres
Publié: (2023) -
Average Certified Radius is a Poor Metric for Randomized Smoothing
par: Sun, Chenhao, et autres
Publié: (2024) -
Evading Data Contamination Detection for Language Models is (too) Easy
par: Dekoninck, Jasper, et autres
Publié: (2024)