Salvato in:
| Autori principali: | Li, Zongjie, Qiu, Wenying, Ma, Pingchuan, Li, Yichen, Li, You, He, Sijia, Jiang, Baozheng, Wang, Shuai, Gu, Weixi |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2402.01723 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
InstructTA: Instruction-Tuned Targeted Attack for Large Vision-Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2023)
di: Wang, Xunguang, et al.
Pubblicazione: (2023)
Measuring and Augmenting Large Language Models for Solving Capture-the-Flag Challenges
di: Ji, Zimo, et al.
Pubblicazione: (2025)
di: Ji, Zimo, et al.
Pubblicazione: (2025)
Testing and Understanding Erroneous Planning in LLM Agents through Synthesized User Inputs
di: Ji, Zhenlan, et al.
Pubblicazione: (2024)
di: Ji, Zhenlan, et al.
Pubblicazione: (2024)
WARBENCH: A Comprehensive Benchmark for Evaluating LLMs in Military Decision-Making
di: Li, Zongjie, et al.
Pubblicazione: (2026)
di: Li, Zongjie, et al.
Pubblicazione: (2026)
STShield: Single-Token Sentinel for Real-Time Jailbreak Detection in Large Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2025)
di: Wang, Xunguang, et al.
Pubblicazione: (2025)
SkillReducer: Optimizing LLM Agent Skills for Token Efficiency
di: Gao, Yudong, et al.
Pubblicazione: (2026)
di: Gao, Yudong, et al.
Pubblicazione: (2026)
Beyond Content Safety: Real-Time Monitoring for Reasoning Vulnerabilities in Large Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2026)
di: Wang, Xunguang, et al.
Pubblicazione: (2026)
Empirical Study of Code Large Language Models for Binary Security Patch Detection
di: Li, Qingyuan, et al.
Pubblicazione: (2025)
di: Li, Qingyuan, et al.
Pubblicazione: (2025)
How Multi-Modal LLMs Reshape Visual Deep Learning Testing? A Comprehensive Study Through the Lens of Image Mutation
di: Wang, Liwen, et al.
Pubblicazione: (2024)
di: Wang, Liwen, et al.
Pubblicazione: (2024)
Taming Various Privilege Escalation in LLM-Based Agent Systems: A Mandatory Access Control Framework
di: Ji, Zimo, et al.
Pubblicazione: (2026)
di: Ji, Zimo, et al.
Pubblicazione: (2026)
OpenVNA: A Framework for Analyzing the Behavior of Multimodal Language Understanding System under Noisy Scenarios
di: Yuan, Ziqi, et al.
Pubblicazione: (2024)
di: Yuan, Ziqi, et al.
Pubblicazione: (2024)
Split and Merge: Aligning Position Biases in LLM-based Evaluators
di: Li, Zongjie, et al.
Pubblicazione: (2023)
di: Li, Zongjie, et al.
Pubblicazione: (2023)
Reasoning as a Resource: Optimizing Fast and Slow Thinking in Code Generation Models
di: Li, Zongjie, et al.
Pubblicazione: (2025)
di: Li, Zongjie, et al.
Pubblicazione: (2025)
EAMET: Robust Massive Model Editing via Embedding Alignment Optimization
di: Dai, Yanbo, et al.
Pubblicazione: (2025)
di: Dai, Yanbo, et al.
Pubblicazione: (2025)
API-guided Dataset Synthesis to Finetune Large Code Models
di: Li, Zongjie, et al.
Pubblicazione: (2024)
di: Li, Zongjie, et al.
Pubblicazione: (2024)
Taxonomy, Evaluation and Exploitation of IPI-Centric LLM Agent Defense Frameworks
di: Ji, Zimo, et al.
Pubblicazione: (2025)
di: Ji, Zimo, et al.
Pubblicazione: (2025)
SelfDefend: LLMs Can Defend Themselves against Jailbreaking in a Practical Manner
di: Wang, Xunguang, et al.
Pubblicazione: (2024)
di: Wang, Xunguang, et al.
Pubblicazione: (2024)
SoK: Evaluating Jailbreak Guardrails for Large Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2025)
di: Wang, Xunguang, et al.
Pubblicazione: (2025)
Do Large Language Models have Problem-Solving Capability under Incomplete Information Scenarios?
di: Chen, Yuyan, et al.
Pubblicazione: (2024)
di: Chen, Yuyan, et al.
Pubblicazione: (2024)
Toward Intelligent Electronic-Photonic Design Automation for Large-Scale Photonic Integrated Circuits: from Device Inverse Design to Physical Layout Generation
di: Zhou, Hongjian, et al.
Pubblicazione: (2025)
di: Zhou, Hongjian, et al.
Pubblicazione: (2025)
Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios
di: Dang, Yunkai, et al.
Pubblicazione: (2024)
di: Dang, Yunkai, et al.
Pubblicazione: (2024)
Measuring the Permission Gate: A Stress-Test Evaluation of Claude Code's Auto Mode
di: Ji, Zimo, et al.
Pubblicazione: (2026)
di: Ji, Zimo, et al.
Pubblicazione: (2026)
Differentiation-Based Extraction of Proprietary Data from Fine-Tuned LLMs
di: Li, Zongjie, et al.
Pubblicazione: (2025)
di: Li, Zongjie, et al.
Pubblicazione: (2025)
SEAL: Subspace-Anchored Watermarks for LLM Ownership
di: Dai, Yanbo, et al.
Pubblicazione: (2025)
di: Dai, Yanbo, et al.
Pubblicazione: (2025)
Beyond Accuracy: An Empirical Study on Unit Testing in Open-source Deep Learning Projects
di: Wang, Han, et al.
Pubblicazione: (2024)
di: Wang, Han, et al.
Pubblicazione: (2024)
Disabling Self-Correction in Retrieval-Augmented Generation via Stealthy Retriever Poisoning
di: Dai, Yanbo, et al.
Pubblicazione: (2025)
di: Dai, Yanbo, et al.
Pubblicazione: (2025)
Evaluating Robustness of Large Audio Language Models to Audio Injection: An Empirical Study
di: Hou, Guanyu, et al.
Pubblicazione: (2025)
di: Hou, Guanyu, et al.
Pubblicazione: (2025)
Design and Empirical Study of a Large Language Model-Based Multi-Agent Investment System for Chinese Public REITs
di: Li, Zheng
Pubblicazione: (2026)
di: Li, Zheng
Pubblicazione: (2026)
Network simulation tools for unmanned aerial vehicle communications: A survey
di: Weiwei Jiang, et al.
Pubblicazione: (2024)
di: Weiwei Jiang, et al.
Pubblicazione: (2024)
Toward Adaptive Reasoning in Large Language Models with Thought Rollback
di: Chen, Sijia, et al.
Pubblicazione: (2024)
di: Chen, Sijia, et al.
Pubblicazione: (2024)
From Evaluation to Enhancement: Large Language Models for Zero-Knowledge Proof Code Generation
di: Xue, Zhantong, et al.
Pubblicazione: (2025)
di: Xue, Zhantong, et al.
Pubblicazione: (2025)
TianHui: A Domain-Specific Large Language Model for Diverse Traditional Chinese Medicine Scenarios
di: Yin, Ji, et al.
Pubblicazione: (2025)
di: Yin, Ji, et al.
Pubblicazione: (2025)
FoundaBench: Evaluating Chinese Fundamental Knowledge Capabilities of Large Language Models
di: Li, Wei, et al.
Pubblicazione: (2024)
di: Li, Wei, et al.
Pubblicazione: (2024)
CodeJudge: Evaluating Code Generation with Large Language Models
di: Tong, Weixi, et al.
Pubblicazione: (2024)
di: Tong, Weixi, et al.
Pubblicazione: (2024)
CliMedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large Language Models in Clinical Scenarios
di: Ouyang, Zetian, et al.
Pubblicazione: (2024)
di: Ouyang, Zetian, et al.
Pubblicazione: (2024)
Eliminating Information Leakage in Hard Concept Bottleneck Models with Supervised, Hierarchical Concept Learning
di: Sun, Ao, et al.
Pubblicazione: (2024)
di: Sun, Ao, et al.
Pubblicazione: (2024)
Efficient Differentiable Causal Discovery via Reliable Super-Structure Learning
di: Ma, Pingchuan, et al.
Pubblicazione: (2026)
di: Ma, Pingchuan, et al.
Pubblicazione: (2026)
Feature engineering vs. deep learning for paper section identification: Toward applications in Chinese medical literature
di: Zhou, Sijia, et al.
Pubblicazione: (2024)
di: Zhou, Sijia, et al.
Pubblicazione: (2024)
Exploring the Effectiveness of LLMs in Automated Logging Generation: An Empirical Study
di: Li, Yichen, et al.
Pubblicazione: (2023)
di: Li, Yichen, et al.
Pubblicazione: (2023)
ADEPT-Z: Zero-Shot Automated Circuit Topology Search for Pareto-Optimal Photonic Tensor Cores
di: Jiang, Ziyang, et al.
Pubblicazione: (2024)
di: Jiang, Ziyang, et al.
Pubblicazione: (2024)
Documenti analoghi
-
InstructTA: Instruction-Tuned Targeted Attack for Large Vision-Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2023) -
Measuring and Augmenting Large Language Models for Solving Capture-the-Flag Challenges
di: Ji, Zimo, et al.
Pubblicazione: (2025) -
Testing and Understanding Erroneous Planning in LLM Agents through Synthesized User Inputs
di: Ji, Zhenlan, et al.
Pubblicazione: (2024) -
WARBENCH: A Comprehensive Benchmark for Evaluating LLMs in Military Decision-Making
di: Li, Zongjie, et al.
Pubblicazione: (2026) -
STShield: Single-Token Sentinel for Real-Time Jailbreak Detection in Large Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2025)