:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Alshaalan, Mohammed, Rodrigues, Miguel R. D.
Format:	Preprint
Published:	2026
Subjects:	Machine Learning Artificial Intelligence
Online Access:	https://arxiv.org/abs/2605.19966
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

LIME-LLM: Probing Models with Fluent Counterfactuals, Not Broken Text
by: Mihaila, George, et al.
Published: (2026)

Generative Adversarial Model-Based Optimization via Source Critic Regularization
by: Yao, Michael S., et al.
Published: (2024)

Rethinking Entropy Interventions in RLVR: An Entropy Change Perspective
by: Hao, Zhezheng, et al.
Published: (2025)

PromptAudit: Auditing Prompt Sensitivity in LLM-Based Vulnerability Detection
by: Camarato, Steffen J., et al.
Published: (2026)

Query-Based Adversarial Prompt Generation
by: Hayase, Jonathan, et al.
Published: (2024)

SWAP: Towards Copyright Auditing of Soft Prompts via Sequential Watermarking
by: Yang, Wenyuan, et al.
Published: (2025)

Enhancing Adversarial Training via Reweighting Optimization Trajectory
by: Huang, Tianjin, et al.
Published: (2023)

Sequential Difference Maximization: Generating Adversarial Examples via Multi-Stage Optimization
by: Liu, Xinlei, et al.
Published: (2025)

Generative Sequential Notification Optimization via Multi-Objective Decision Transformers
by: Ocejo, Borja, et al.
Published: (2025)

Offline Multi-Agent Reinforcement Learning via In-Sample Sequential Policy Optimization
by: Liu, Zongkai, et al.
Published: (2024)

The Sequential Edge: Inverse-Entropy Voting Beats Parallel Self-Consistency at Matched Compute
by: Sharma, Aman, et al.
Published: (2025)

EntropyStop: Unsupervised Deep Outlier Detection with Loss Entropy
by: Huang, Yihong, et al.
Published: (2024)

Automatic Prompt Optimization with Prompt Distillation
by: Dyagin, Ernest A., et al.
Published: (2025)

Understanding and Preventing Entropy Collapse in RLVR with On-Policy Entropy Flow Optimization
by: Xu, Huimin, et al.
Published: (2026)

Fast and Fluent Diffusion Language Models via Convolutional Decoding and Rejective Fine-tuning
by: Seo, Yeongbin, et al.
Published: (2025)

SCOPE: Sequential Causal Optimization of Process Interventions
by: De Moor, Jakob, et al.
Published: (2025)

Sequential Policy Gradient for Adaptive Hyperparameter Optimization
by: Li, Zheng, et al.
Published: (2025)

No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping
by: Le, Thanh-Long V., et al.
Published: (2025)

Efficient Multi-objective Prompt Optimization via Pure-exploration Bandits
by: Li, Donghao, et al.
Published: (2026)

Jailbreaking GPT-4V via Self-Adversarial Attacks with System Prompts
by: Wu, Yuanwei, et al.
Published: (2023)

FedPOB: Sample-Efficient Federated Prompt Optimization via Bandits
by: Lu, Pingchen, et al.
Published: (2025)

MetaLLMix : An XAI Aided LLM-Meta-learning Based Approach for Hyper-parameters Optimization
by: Bal-Ghaoui, Mohamed, et al.
Published: (2025)

Adversarial Imitation Learning via Boosting
by: Chang, Jonathan D., et al.
Published: (2024)

Mitigating the Likelihood Paradox in Flow-based OOD Detection via Entropy Manipulation
by: Kim, Donghwan, et al.
Published: (2026)

Sequential Large Language Model-Based Hyper-parameter Optimization
by: Mahammadli, Kanan, et al.
Published: (2024)

SequentialBreak: Large Language Models Can be Fooled by Embedding Jailbreak Prompts into Sequential Prompt Chains
by: Saiem, Bijoy Ahmed, et al.
Published: (2024)

Hard Prompts Made Interpretable: Sparse Entropy Regularization for Prompt Tuning with RL
by: Choi, Yunseon, et al.
Published: (2024)

Overcoming Reward Overoptimization via Adversarial Policy Optimization with Lightweight Uncertainty Estimation
by: Zhang, Xiaoying, et al.
Published: (2024)

Prompt Optimization with Human Feedback
by: Lin, Xiaoqiang, et al.
Published: (2024)

Sequential Monte Carlo for Policy Optimization in Continuous POMDPs
by: Abdulsamad, Hany, et al.
Published: (2025)

Generative Adversarial Networks for Imputing Sparse Learning Performance
by: Zhang, Liang, et al.
Published: (2024)

Adversarial Vulnerability Under Temporal Concept Drift: A Longitudinal Study of Android Malware Detection
by: Sabbah, Ahmed, et al.
Published: (2026)

When Maximum Entropy Misleads Policy Optimization
by: Zhang, Ruipeng, et al.
Published: (2025)

ESPO: Entropy Importance Sampling Policy Optimization
by: Sheng, Yuepeng, et al.
Published: (2025)

Fight Back Against Jailbreaking via Prompt Adversarial Tuning
by: Mo, Yichuan, et al.
Published: (2024)

Maximum Entropy On-Policy Actor-Critic via Entropy Advantage Estimation
by: Choe, Jean Seong Bjorn, et al.
Published: (2024)

When are LLMs Sufficient Policy Optimizers for Sequential RL Tasks?
by: Hatgis-Kessell, Stephane, et al.
Published: (2026)

Sequential Stochastic Combinatorial Optimization Using Hierarchal Reinforcement Learning
by: Feng, Xinsong, et al.
Published: (2025)

MASPOB: Bandit-Based Prompt Optimization for Multi-Agent Systems with Graph Neural Networks
by: Hong, Zhi, et al.
Published: (2026)

Towards Interpretable Adversarial Examples via Sparse Adversarial Attack
by: Lin, Fudong, et al.
Published: (2025)