Salvato in:
| Autori principali: | Zhang, Ziming, Li, Li, Feng, Guorui, Wu, Hanzhou, Zhang, Xinpeng |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2604.25247 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Generative Model Watermarking Suppressing High-Frequency Artifacts
di: Zhang, Li, et al.
Pubblicazione: (2023)
di: Zhang, Li, et al.
Pubblicazione: (2023)
Yet Another Watermark for Large Language Models
di: Bao, Siyuan, et al.
Pubblicazione: (2025)
di: Bao, Siyuan, et al.
Pubblicazione: (2025)
Transferable Watermarking to Self-supervised Pre-trained Graph Encoders by Trigger Embeddings
di: Zhao, Xiangyu, et al.
Pubblicazione: (2024)
di: Zhao, Xiangyu, et al.
Pubblicazione: (2024)
Robust and Imperceptible Black-box DNN Watermarking Based on Fourier Perturbation Analysis and Frequency Sensitivity Clustering
di: Liu, Yong, et al.
Pubblicazione: (2022)
di: Liu, Yong, et al.
Pubblicazione: (2022)
ShadowCoT: Cognitive Hijacking for Stealthy Reasoning Backdoors in LLMs
di: Zhao, Gejian, et al.
Pubblicazione: (2025)
di: Zhao, Gejian, et al.
Pubblicazione: (2025)
AuthenLoRA: Entangling Stylization with Imperceptible Watermarks for Copyright-Secure LoRA Adapters
di: Shi, Fangming, et al.
Pubblicazione: (2025)
di: Shi, Fangming, et al.
Pubblicazione: (2025)
CoTSRF: Utilize Chain of Thought as Stealthy and Robust Fingerprint of Large Language Models
di: Ren, Zhenzhen, et al.
Pubblicazione: (2025)
di: Ren, Zhenzhen, et al.
Pubblicazione: (2025)
Trigger Where It Hurts: Unveiling Hidden Backdoors through Sensitivity with Sensitron
di: Zhao, Gejian, et al.
Pubblicazione: (2025)
di: Zhao, Gejian, et al.
Pubblicazione: (2025)
A Game Between the Defender and the Attacker for Trigger-based Black-box Model Watermarking
di: Huang, Chaoyue, et al.
Pubblicazione: (2025)
di: Huang, Chaoyue, et al.
Pubblicazione: (2025)
A Fingerprint for Large Language Models
di: Yang, Zhiguang, et al.
Pubblicazione: (2024)
di: Yang, Zhiguang, et al.
Pubblicazione: (2024)
Watermarking Quantum Neural Networks Based on Sample Grouped and Paired Training
di: Zhou, Limengnan, et al.
Pubblicazione: (2025)
di: Zhou, Limengnan, et al.
Pubblicazione: (2025)
Echoes within the Reasoning: Stealthy and Effective Watermarking via Chain of Thought
di: Lu, Jiacheng, et al.
Pubblicazione: (2026)
di: Lu, Jiacheng, et al.
Pubblicazione: (2026)
Defining Cost Function of Steganography with Large Language Models
di: Wu, Hanzhou, et al.
Pubblicazione: (2025)
di: Wu, Hanzhou, et al.
Pubblicazione: (2025)
An Information Asymmetry Game for Trigger-based DNN Model Watermarking
di: Huang, Chaoyue, et al.
Pubblicazione: (2025)
di: Huang, Chaoyue, et al.
Pubblicazione: (2025)
Turning Your Strength into Watermark: Watermarking Large Language Model via Knowledge Injection
di: Li, Shuai, et al.
Pubblicazione: (2023)
di: Li, Shuai, et al.
Pubblicazione: (2023)
BadThink: Triggered Overthinking Attacks on Chain-of-Thought Reasoning in Large Language Models
di: Liu, Shuaitong, et al.
Pubblicazione: (2025)
di: Liu, Shuaitong, et al.
Pubblicazione: (2025)
Large Language Model-driven Security Assistant for Internet of Things via Chain-of-Thought
di: Zeng, Mingfei, et al.
Pubblicazione: (2025)
di: Zeng, Mingfei, et al.
Pubblicazione: (2025)
TRAP: Hijacking VLA CoT-Reasoning via Adversarial Patches
di: Huang, Zhengxian, et al.
Pubblicazione: (2026)
di: Huang, Zhengxian, et al.
Pubblicazione: (2026)
Learning to Watermark: A Selective Watermarking Framework for Large Language Models via Multi-Objective Optimization
di: Wang, Chenrui, et al.
Pubblicazione: (2025)
di: Wang, Chenrui, et al.
Pubblicazione: (2025)
BadChain: Backdoor Chain-of-Thought Prompting for Large Language Models
di: Xiang, Zhen, et al.
Pubblicazione: (2024)
di: Xiang, Zhen, et al.
Pubblicazione: (2024)
ExplainableGuard: Interpretable Adversarial Defense for Large Language Models Using Chain-of-Thought Reasoning
di: Guan, Shaowei, et al.
Pubblicazione: (2025)
di: Guan, Shaowei, et al.
Pubblicazione: (2025)
Chain-of-Thought Prompting of Large Language Models for Discovering and Fixing Software Vulnerabilities
di: Nong, Yu, et al.
Pubblicazione: (2024)
di: Nong, Yu, et al.
Pubblicazione: (2024)
Robust Reversible Watermarking in Encrypted Images Based on Dual-MSBs Spiral Embedding
di: Shen, Haoyu, et al.
Pubblicazione: (2026)
di: Shen, Haoyu, et al.
Pubblicazione: (2026)
EditMark: Watermarking Large Language Models based on Model Editing
di: Li, Shuai, et al.
Pubblicazione: (2025)
di: Li, Shuai, et al.
Pubblicazione: (2025)
A Certified Robust Watermark For Large Language Models
di: Feng, Xianheng, et al.
Pubblicazione: (2024)
di: Feng, Xianheng, et al.
Pubblicazione: (2024)
Critical-CoT: A Robust Defense Framework against Reasoning-Level Backdoor Attacks in Large Language Models
di: Truong, Vu Tuan, et al.
Pubblicazione: (2026)
di: Truong, Vu Tuan, et al.
Pubblicazione: (2026)
CEFW: A Comprehensive Evaluation Framework for Watermark in Large Language Models
di: Zhang, Shuhao, et al.
Pubblicazione: (2025)
di: Zhang, Shuhao, et al.
Pubblicazione: (2025)
SyncGuard: Robust Audio Watermarking Capable of Countering Desynchronization Attacks
di: Gan, Zhenliang, et al.
Pubblicazione: (2025)
di: Gan, Zhenliang, et al.
Pubblicazione: (2025)
PRIVMARK: Private Large Language Models Watermarking with MPC
di: Fargues, Thomas, et al.
Pubblicazione: (2025)
di: Fargues, Thomas, et al.
Pubblicazione: (2025)
Functional Subspace Watermarking for Large Language Models
di: Ding, Zikang, et al.
Pubblicazione: (2026)
di: Ding, Zikang, et al.
Pubblicazione: (2026)
A Nested Watermark for Large Language Models
di: Nagatsuka, Koichi, et al.
Pubblicazione: (2025)
di: Nagatsuka, Koichi, et al.
Pubblicazione: (2025)
VOW: Verifiable and Oblivious Watermark Detection for Large Language Models
di: Luan, Xiaokun, et al.
Pubblicazione: (2026)
di: Luan, Xiaokun, et al.
Pubblicazione: (2026)
Watermarking Text Data on Large Language Models for Dataset Copyright
di: Liu, Yixin, et al.
Pubblicazione: (2023)
di: Liu, Yixin, et al.
Pubblicazione: (2023)
CoT-Guard: Small Models for Strong Monitoring
di: Diwan, Nirav, et al.
Pubblicazione: (2026)
di: Diwan, Nirav, et al.
Pubblicazione: (2026)
MorphMark: Flexible Adaptive Watermarking for Large Language Models
di: Wang, Zongqi, et al.
Pubblicazione: (2025)
di: Wang, Zongqi, et al.
Pubblicazione: (2025)
Rotation, Scale, and Translation Resilient Black-box Fingerprinting for Intellectual Property Protection of EaaS Models
di: Zhang, Hongjie, et al.
Pubblicazione: (2025)
di: Zhang, Hongjie, et al.
Pubblicazione: (2025)
CoTDeceptor:Adversarial Code Obfuscation Against CoT-Enhanced LLM Code Agents
di: Li, Haoyang, et al.
Pubblicazione: (2025)
di: Li, Haoyang, et al.
Pubblicazione: (2025)
Debiasing Watermarks for Large Language Models via Maximal Coupling
di: Xie, Yangxinyu, et al.
Pubblicazione: (2024)
di: Xie, Yangxinyu, et al.
Pubblicazione: (2024)
Reasoning-Oriented Programming: Chaining Semantic Gadgets to Jailbreak Large Vision Language Models
di: Zou, Quanchen, et al.
Pubblicazione: (2026)
di: Zou, Quanchen, et al.
Pubblicazione: (2026)
GenPTW: Latent Image Watermarking for Provenance Tracing and Tamper Localization
di: Gan, Zhenliang, et al.
Pubblicazione: (2025)
di: Gan, Zhenliang, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Generative Model Watermarking Suppressing High-Frequency Artifacts
di: Zhang, Li, et al.
Pubblicazione: (2023) -
Yet Another Watermark for Large Language Models
di: Bao, Siyuan, et al.
Pubblicazione: (2025) -
Transferable Watermarking to Self-supervised Pre-trained Graph Encoders by Trigger Embeddings
di: Zhao, Xiangyu, et al.
Pubblicazione: (2024) -
Robust and Imperceptible Black-box DNN Watermarking Based on Fourier Perturbation Analysis and Frequency Sensitivity Clustering
di: Liu, Yong, et al.
Pubblicazione: (2022) -
ShadowCoT: Cognitive Hijacking for Stealthy Reasoning Backdoors in LLMs
di: Zhao, Gejian, et al.
Pubblicazione: (2025)