Salvato in:
| Autori principali: | Wang, Zi, Weng, Shiwei, Alhanahnah, Mohannad, Jha, Somesh, Reps, Tom |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2502.10938 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Rethinking Diversity in Deep Neural Network Testing
di: Wang, Zi, et al.
Pubblicazione: (2023)
di: Wang, Zi, et al.
Pubblicazione: (2023)
Functional Homotopy: Smoothing Discrete Optimization via Continuous Parameters for LLM Jailbreak Attacks
di: Wang, Zi, et al.
Pubblicazione: (2024)
di: Wang, Zi, et al.
Pubblicazione: (2024)
DepsRAG: Towards Agentic Reasoning and Planning for Software Dependency Management
di: Alhanahnah, Mohannad, et al.
Pubblicazione: (2024)
di: Alhanahnah, Mohannad, et al.
Pubblicazione: (2024)
How Not to Detect Prompt Injections with an LLM
di: Choudhary, Sarthak, et al.
Pubblicazione: (2025)
di: Choudhary, Sarthak, et al.
Pubblicazione: (2025)
PolicyBank: Evolving Policy Understanding for LLM Agents
di: Choi, Jihye, et al.
Pubblicazione: (2026)
di: Choi, Jihye, et al.
Pubblicazione: (2026)
A New Era in LLM Security: Exploring Security Concerns in Real-World LLM-based Systems
di: Wu, Fangzhou, et al.
Pubblicazione: (2024)
di: Wu, Fangzhou, et al.
Pubblicazione: (2024)
Data-to-Dashboard: Multi-Agent LLM Framework for Insightful Visualization in Enterprise Analytics
di: Zhang, Ran, et al.
Pubblicazione: (2025)
di: Zhang, Ran, et al.
Pubblicazione: (2025)
Demystifying the Roles of LLM Layers in Retrieval, Knowledge, and Reasoning
di: Song, Xinyuan, et al.
Pubblicazione: (2025)
di: Song, Xinyuan, et al.
Pubblicazione: (2025)
SoK: Software Debloating Landscape and Future Directions
di: Alhanahnah, Mohannad, et al.
Pubblicazione: (2024)
di: Alhanahnah, Mohannad, et al.
Pubblicazione: (2024)
ATLAS: Constraints-Aware Multi-Agent Collaboration for Real-World Travel Planning
di: Choi, Jihye, et al.
Pubblicazione: (2025)
di: Choi, Jihye, et al.
Pubblicazione: (2025)
Adaptive Concept Bottleneck for Foundation Models Under Distribution Shifts
di: Choi, Jihye, et al.
Pubblicazione: (2024)
di: Choi, Jihye, et al.
Pubblicazione: (2024)
SACTOR: LLM-Driven Correct and Idiomatic C to Rust Translation with Static Analysis and FFI-Based Verification
di: Zhou, Tianyang, et al.
Pubblicazione: (2025)
di: Zhou, Tianyang, et al.
Pubblicazione: (2025)
Through the Stealth Lens: Attention-Aware Defenses Against Poisoning in RAG
di: Choudhary, Sarthak, et al.
Pubblicazione: (2025)
di: Choudhary, Sarthak, et al.
Pubblicazione: (2025)
MHA-RAG: Improving Efficiency, Accuracy, and Consistency by Encoding Exemplars as Soft Prompts
di: Jain, Abhinav, et al.
Pubblicazione: (2025)
di: Jain, Abhinav, et al.
Pubblicazione: (2025)
Auto-SPT: Automating Semantic Preserving Transformations for Code
di: Hooda, Ashish, et al.
Pubblicazione: (2025)
di: Hooda, Ashish, et al.
Pubblicazione: (2025)
Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning
di: Bi, Zhenni, et al.
Pubblicazione: (2024)
di: Bi, Zhenni, et al.
Pubblicazione: (2024)
LLM & HPC:Benchmarking DeepSeek's Performance in High-Performance Computing Tasks
di: Nader, Noujoud, et al.
Pubblicazione: (2025)
di: Nader, Noujoud, et al.
Pubblicazione: (2025)
Formal Policy Enforcement for Real-World Agentic Systems
di: Palumbo, Nils, et al.
Pubblicazione: (2026)
di: Palumbo, Nils, et al.
Pubblicazione: (2026)
Prompt Tuning Strikes Back: Customizing Foundation Models with Low-Rank Prompt Adaptation
di: Jain, Abhinav, et al.
Pubblicazione: (2024)
di: Jain, Abhinav, et al.
Pubblicazione: (2024)
MALADE: Orchestration of LLM-powered Agents with Retrieval Augmented Generation for Pharmacovigilance
di: Choi, Jihye, et al.
Pubblicazione: (2024)
di: Choi, Jihye, et al.
Pubblicazione: (2024)
Impact of Noise on LLM-Models Performance in Abstraction and Reasoning Corpus (ARC) Tasks with Model Temperature Considerations
di: Khandalkar, Nikhil, et al.
Pubblicazione: (2025)
di: Khandalkar, Nikhil, et al.
Pubblicazione: (2025)
Undetectable Backdoors in Model Parameters: Hiding Sparse Secrets in High Dimensions
di: Choudhary, Sarthak, et al.
Pubblicazione: (2026)
di: Choudhary, Sarthak, et al.
Pubblicazione: (2026)
Beyond Memorization: Testing LLM Reasoning on Unseen Theory of Computation Tasks
di: Shelat, Shlok, et al.
Pubblicazione: (2026)
di: Shelat, Shlok, et al.
Pubblicazione: (2026)
Multi-Task GRPO: Reliable LLM Reasoning Across Tasks
di: Ramesh, Shyam Sundhar, et al.
Pubblicazione: (2026)
di: Ramesh, Shyam Sundhar, et al.
Pubblicazione: (2026)
Do Large Code Models Understand Programming Concepts? Counterfactual Analysis for Code Predicates
di: Hooda, Ashish, et al.
Pubblicazione: (2024)
di: Hooda, Ashish, et al.
Pubblicazione: (2024)
Enhance Reasoning for Large Language Models in the Game Werewolf
di: Wu, Shuang, et al.
Pubblicazione: (2024)
di: Wu, Shuang, et al.
Pubblicazione: (2024)
Effective Learning for Small Reasoning Models: An Empirical Study on 0.5B Reasoning LLMs
di: Zhuang, Xialie, et al.
Pubblicazione: (2025)
di: Zhuang, Xialie, et al.
Pubblicazione: (2025)
Extending Token Computation for LLM Reasoning
di: Liao, Bingli, et al.
Pubblicazione: (2024)
di: Liao, Bingli, et al.
Pubblicazione: (2024)
Bag of Tricks for Inference-time Computation of LLM Reasoning
di: Liu, Fan, et al.
Pubblicazione: (2025)
di: Liu, Fan, et al.
Pubblicazione: (2025)
Prolonged Reasoning Is Not All You Need: Certainty-Based Adaptive Routing for Efficient LLM/MLLM Reasoning
di: Lu, Jinghui, et al.
Pubblicazione: (2025)
di: Lu, Jinghui, et al.
Pubblicazione: (2025)
Debate Only When Necessary: Adaptive Multiagent Collaboration for Efficient LLM Reasoning
di: Eo, Sugyeong, et al.
Pubblicazione: (2025)
di: Eo, Sugyeong, et al.
Pubblicazione: (2025)
ALKAFI-LLAMA3: Fine-Tuning LLMs for Precise Legal Understanding in Palestine
di: Qasem, Rabee, et al.
Pubblicazione: (2024)
di: Qasem, Rabee, et al.
Pubblicazione: (2024)
Reason from Future: Reverse Thought Chain Enhances LLM Reasoning
di: Xu, Yinlong, et al.
Pubblicazione: (2025)
di: Xu, Yinlong, et al.
Pubblicazione: (2025)
CPL: Critical Plan Step Learning Boosts LLM Generalization in Reasoning Tasks
di: Wang, Tianlong, et al.
Pubblicazione: (2024)
di: Wang, Tianlong, et al.
Pubblicazione: (2024)
HyperTree Planning: Enhancing LLM Reasoning via Hierarchical Thinking
di: Gui, Runquan, et al.
Pubblicazione: (2025)
di: Gui, Runquan, et al.
Pubblicazione: (2025)
DNN Task Assignment in UAV Networks: A Generative AI Enhanced Multi-Agent Reinforcement Learning Approach
di: Tang, Xin, et al.
Pubblicazione: (2024)
di: Tang, Xin, et al.
Pubblicazione: (2024)
An Empirical Evaluation of Pre-trained Large Language Models for Repairing Declarative Formal Specifications
di: Alhanahnah, Mohannad, et al.
Pubblicazione: (2024)
di: Alhanahnah, Mohannad, et al.
Pubblicazione: (2024)
The Cure is in the Cause: A Filesystem for Container Debloating
di: Zhang, Huaifeng, et al.
Pubblicazione: (2023)
di: Zhang, Huaifeng, et al.
Pubblicazione: (2023)
LLM-guided Task and Motion Planning using Knowledge-based Reasoning
di: Din, Muhayy Ud, et al.
Pubblicazione: (2024)
di: Din, Muhayy Ud, et al.
Pubblicazione: (2024)
Knowledge Graph-Driven Expert-Level Reasoning for Neuroscience
di: Stephen, Jake, et al.
Pubblicazione: (2026)
di: Stephen, Jake, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Rethinking Diversity in Deep Neural Network Testing
di: Wang, Zi, et al.
Pubblicazione: (2023) -
Functional Homotopy: Smoothing Discrete Optimization via Continuous Parameters for LLM Jailbreak Attacks
di: Wang, Zi, et al.
Pubblicazione: (2024) -
DepsRAG: Towards Agentic Reasoning and Planning for Software Dependency Management
di: Alhanahnah, Mohannad, et al.
Pubblicazione: (2024) -
How Not to Detect Prompt Injections with an LLM
di: Choudhary, Sarthak, et al.
Pubblicazione: (2025) -
PolicyBank: Evolving Policy Understanding for LLM Agents
di: Choi, Jihye, et al.
Pubblicazione: (2026)