:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Li, Zongjie, Qiu, Wenying, Ma, Pingchuan, Li, Yichen, Li, You, He, Sijia, Jiang, Baozheng, Wang, Shuai, Gu, Weixi
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computation and Language Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2402.01723
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

InstructTA: Instruction-Tuned Targeted Attack for Large Vision-Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2023)

Measuring and Augmenting Large Language Models for Solving Capture-the-Flag Challenges
di: Ji, Zimo, et al.
Pubblicazione: (2025)

Testing and Understanding Erroneous Planning in LLM Agents through Synthesized User Inputs
di: Ji, Zhenlan, et al.
Pubblicazione: (2024)

WARBENCH: A Comprehensive Benchmark for Evaluating LLMs in Military Decision-Making
di: Li, Zongjie, et al.
Pubblicazione: (2026)

STShield: Single-Token Sentinel for Real-Time Jailbreak Detection in Large Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2025)

SkillReducer: Optimizing LLM Agent Skills for Token Efficiency
di: Gao, Yudong, et al.
Pubblicazione: (2026)

Beyond Content Safety: Real-Time Monitoring for Reasoning Vulnerabilities in Large Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2026)

Empirical Study of Code Large Language Models for Binary Security Patch Detection
di: Li, Qingyuan, et al.
Pubblicazione: (2025)

How Multi-Modal LLMs Reshape Visual Deep Learning Testing? A Comprehensive Study Through the Lens of Image Mutation
di: Wang, Liwen, et al.
Pubblicazione: (2024)

Taming Various Privilege Escalation in LLM-Based Agent Systems: A Mandatory Access Control Framework
di: Ji, Zimo, et al.
Pubblicazione: (2026)

OpenVNA: A Framework for Analyzing the Behavior of Multimodal Language Understanding System under Noisy Scenarios
di: Yuan, Ziqi, et al.
Pubblicazione: (2024)

Split and Merge: Aligning Position Biases in LLM-based Evaluators
di: Li, Zongjie, et al.
Pubblicazione: (2023)

Reasoning as a Resource: Optimizing Fast and Slow Thinking in Code Generation Models
di: Li, Zongjie, et al.
Pubblicazione: (2025)

EAMET: Robust Massive Model Editing via Embedding Alignment Optimization
di: Dai, Yanbo, et al.
Pubblicazione: (2025)

API-guided Dataset Synthesis to Finetune Large Code Models
di: Li, Zongjie, et al.
Pubblicazione: (2024)

Taxonomy, Evaluation and Exploitation of IPI-Centric LLM Agent Defense Frameworks
di: Ji, Zimo, et al.
Pubblicazione: (2025)

SelfDefend: LLMs Can Defend Themselves against Jailbreaking in a Practical Manner
di: Wang, Xunguang, et al.
Pubblicazione: (2024)

SoK: Evaluating Jailbreak Guardrails for Large Language Models
di: Wang, Xunguang, et al.
Pubblicazione: (2025)

Do Large Language Models have Problem-Solving Capability under Incomplete Information Scenarios?
di: Chen, Yuyan, et al.
Pubblicazione: (2024)

Toward Intelligent Electronic-Photonic Design Automation for Large-Scale Photonic Integrated Circuits: from Device Inverse Design to Physical Layout Generation
di: Zhou, Hongjian, et al.
Pubblicazione: (2025)

Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios
di: Dang, Yunkai, et al.
Pubblicazione: (2024)

Measuring the Permission Gate: A Stress-Test Evaluation of Claude Code's Auto Mode
di: Ji, Zimo, et al.
Pubblicazione: (2026)

Differentiation-Based Extraction of Proprietary Data from Fine-Tuned LLMs
di: Li, Zongjie, et al.
Pubblicazione: (2025)

SEAL: Subspace-Anchored Watermarks for LLM Ownership
di: Dai, Yanbo, et al.
Pubblicazione: (2025)

Beyond Accuracy: An Empirical Study on Unit Testing in Open-source Deep Learning Projects
di: Wang, Han, et al.
Pubblicazione: (2024)

Disabling Self-Correction in Retrieval-Augmented Generation via Stealthy Retriever Poisoning
di: Dai, Yanbo, et al.
Pubblicazione: (2025)

Evaluating Robustness of Large Audio Language Models to Audio Injection: An Empirical Study
di: Hou, Guanyu, et al.
Pubblicazione: (2025)

Design and Empirical Study of a Large Language Model-Based Multi-Agent Investment System for Chinese Public REITs
di: Li, Zheng
Pubblicazione: (2026)

Network simulation tools for unmanned aerial vehicle communications: A survey
di: Weiwei Jiang, et al.
Pubblicazione: (2024)

Toward Adaptive Reasoning in Large Language Models with Thought Rollback
di: Chen, Sijia, et al.
Pubblicazione: (2024)

From Evaluation to Enhancement: Large Language Models for Zero-Knowledge Proof Code Generation
di: Xue, Zhantong, et al.
Pubblicazione: (2025)

TianHui: A Domain-Specific Large Language Model for Diverse Traditional Chinese Medicine Scenarios
di: Yin, Ji, et al.
Pubblicazione: (2025)

FoundaBench: Evaluating Chinese Fundamental Knowledge Capabilities of Large Language Models
di: Li, Wei, et al.
Pubblicazione: (2024)

CodeJudge: Evaluating Code Generation with Large Language Models
di: Tong, Weixi, et al.
Pubblicazione: (2024)

CliMedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large Language Models in Clinical Scenarios
di: Ouyang, Zetian, et al.
Pubblicazione: (2024)

Eliminating Information Leakage in Hard Concept Bottleneck Models with Supervised, Hierarchical Concept Learning
di: Sun, Ao, et al.
Pubblicazione: (2024)

Efficient Differentiable Causal Discovery via Reliable Super-Structure Learning
di: Ma, Pingchuan, et al.
Pubblicazione: (2026)

Feature engineering vs. deep learning for paper section identification: Toward applications in Chinese medical literature
di: Zhou, Sijia, et al.
Pubblicazione: (2024)

Exploring the Effectiveness of LLMs in Automated Logging Generation: An Empirical Study
di: Li, Yichen, et al.
Pubblicazione: (2023)

ADEPT-Z: Zero-Shot Automated Circuit Topology Search for Pareto-Optimal Photonic Tensor Cores
di: Jiang, Ziyang, et al.
Pubblicazione: (2024)