Salvato in:
| Autori principali: | Chen, Zhaorun, Zhao, Zhuokai, Zhang, Kai, Liu, Bo, Qi, Qi, Wu, Yifan, Kalluri, Tarun, Cao, Sara, Xiong, Yuanhao, Tong, Haibo, Yao, Huaxiu, Li, Hengduo, Zhu, Jiacheng, Li, Xian, Song, Dawn, Li, Bo, Weston, Jason, Huynh, Dat |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2511.03773 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
HALC: Object Hallucination Reduction via Adaptive Focal-Contrast Decoding
di: Chen, Zhaorun, et al.
Pubblicazione: (2024)
di: Chen, Zhaorun, et al.
Pubblicazione: (2024)
Agent Learning via Early Experience
di: Zhang, Kai, et al.
Pubblicazione: (2025)
di: Zhang, Kai, et al.
Pubblicazione: (2025)
AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via Controllable Question Decomposition
di: Chen, Zhaorun, et al.
Pubblicazione: (2024)
di: Chen, Zhaorun, et al.
Pubblicazione: (2024)
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases
di: Chen, Zhaorun, et al.
Pubblicazione: (2024)
di: Chen, Zhaorun, et al.
Pubblicazione: (2024)
ShieldAgent: Shielding Agents via Verifiable Safety Policy Reasoning
di: Chen, Zhaorun, et al.
Pubblicazione: (2025)
di: Chen, Zhaorun, et al.
Pubblicazione: (2025)
UDA-Bench: Revisiting Common Assumptions in Unsupervised Domain Adaptation Using a Standardized Framework
di: Kalluri, Tarun, et al.
Pubblicazione: (2024)
di: Kalluri, Tarun, et al.
Pubblicazione: (2024)
Enhancing Vision-Language Model Reliability with Uncertainty-Guided Dropout Decoding
di: Fang, Yixiong, et al.
Pubblicazione: (2024)
di: Fang, Yixiong, et al.
Pubblicazione: (2024)
Not all Temperature Shocks are Alike: Disentangling Heat and High Temperature Shocks and Their Effects on Inflation in Australia
di: Tan Dat Huynh, et al.
Pubblicazione: (2026)
di: Tan Dat Huynh, et al.
Pubblicazione: (2026)
Tell, Don't Show!: Language Guidance Eases Transfer Across Domains in Images and Videos
di: Kalluri, Tarun, et al.
Pubblicazione: (2024)
di: Kalluri, Tarun, et al.
Pubblicazione: (2024)
Cer-Eval: Certifiable and Cost-Efficient Evaluation Framework for LLMs
di: Wang, Ganghua, et al.
Pubblicazione: (2025)
di: Wang, Ganghua, et al.
Pubblicazione: (2025)
SafeWatch: An Efficient Safety-Policy Following Video Guardrail Model with Transparent Explanations
di: Chen, Zhaorun, et al.
Pubblicazione: (2024)
di: Chen, Zhaorun, et al.
Pubblicazione: (2024)
Beyond Training: Dynamic Token Merging for Zero-Shot Video Understanding
di: Zhang, Yiming, et al.
Pubblicazione: (2024)
di: Zhang, Yiming, et al.
Pubblicazione: (2024)
RankCLIP: Ranking-Consistent Language-Image Pretraining
di: Zhang, Yiming, et al.
Pubblicazione: (2024)
di: Zhang, Yiming, et al.
Pubblicazione: (2024)
Token-Level LLM Collaboration via FusionRoute
di: Xiong, Nuoya, et al.
Pubblicazione: (2026)
di: Xiong, Nuoya, et al.
Pubblicazione: (2026)
RedCodeAgent: Automatic Red-teaming Agent against Diverse Code Agents
di: Guo, Chengquan, et al.
Pubblicazione: (2025)
di: Guo, Chengquan, et al.
Pubblicazione: (2025)
Learning to Plan & Reason for Evaluation with Thinking-LLM-as-a-Judge
di: Saha, Swarnadeep, et al.
Pubblicazione: (2025)
di: Saha, Swarnadeep, et al.
Pubblicazione: (2025)
Self-Challenging Language Model Agents
di: Zhou, Yifei, et al.
Pubblicazione: (2025)
di: Zhou, Yifei, et al.
Pubblicazione: (2025)
ML-Bench&Guard: Policy-Grounded Multilingual Safety Benchmark and Guardrail for Large Language Models
di: Zhao, Yunhan, et al.
Pubblicazione: (2026)
di: Zhao, Yunhan, et al.
Pubblicazione: (2026)
BEEAR: Embedding-based Adversarial Removal of Safety Backdoors in Instruction-tuned Language Models
di: Zeng, Yi, et al.
Pubblicazione: (2024)
di: Zeng, Yi, et al.
Pubblicazione: (2024)
Safe Reinforcement Learning via Hierarchical Adaptive Chance-Constraint Safeguards
di: Chen, Zhaorun, et al.
Pubblicazione: (2023)
di: Chen, Zhaorun, et al.
Pubblicazione: (2023)
Anyprefer: An Agentic Framework for Preference Data Synthesis
di: Zhou, Yiyang, et al.
Pubblicazione: (2025)
di: Zhou, Yiyang, et al.
Pubblicazione: (2025)
GRATH: Gradual Self-Truthifying for Large Language Models
di: Chen, Weixin, et al.
Pubblicazione: (2024)
di: Chen, Weixin, et al.
Pubblicazione: (2024)
DiffAttack: Evasion Attacks Against Diffusion-Based Adversarial Purification
di: Kang, Mintong, et al.
Pubblicazione: (2023)
di: Kang, Mintong, et al.
Pubblicazione: (2023)
The Era of Real-World Human Interaction: RL from User Conversations
di: Jin, Chuanyang, et al.
Pubblicazione: (2025)
di: Jin, Chuanyang, et al.
Pubblicazione: (2025)
SafeVision: Efficient Image Guardrail with Robust Policy Adherence and Explainability
di: Xu, Peiyang, et al.
Pubblicazione: (2025)
di: Xu, Peiyang, et al.
Pubblicazione: (2025)
Psychological Antecedents to Emergence of Team Autonomy in Agile Scrum Teams
di: Kalluri, Ravikiran
Pubblicazione: (2024)
di: Kalluri, Ravikiran
Pubblicazione: (2024)
Agent-Based Simulation of Trust Development in Human-Robot Teams: An Empirically-Validated Framework
di: Kalluri, Ravi
Pubblicazione: (2026)
di: Kalluri, Ravi
Pubblicazione: (2026)
Why Does the Engineering Manager Still Exist in Agile Software Development?
di: Kalluri, Ravi
Pubblicazione: (2025)
di: Kalluri, Ravi
Pubblicazione: (2025)
scPER: A Rigorous Computational Approach to Determine Cellular Subtypes in Tumors Aligned With Cancer Phenotypes From Total RNA Sequencing
di: Bingrui Li, et al.
Pubblicazione: (2025)
di: Bingrui Li, et al.
Pubblicazione: (2025)
MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding
di: He, Bo, et al.
Pubblicazione: (2024)
di: He, Bo, et al.
Pubblicazione: (2024)
Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment
di: Cui, Chenhang, et al.
Pubblicazione: (2024)
di: Cui, Chenhang, et al.
Pubblicazione: (2024)
YAP prevents senescence of dermal fibroblast and inhibits melanogenesis via paracrine effect of DKK1
di: Tong Li, et al.
Pubblicazione: (2024)
di: Tong Li, et al.
Pubblicazione: (2024)
Branch-Solve-Merge Improves Large Language Model Evaluation and Generation
di: Saha, Swarnadeep, et al.
Pubblicazione: (2023)
di: Saha, Swarnadeep, et al.
Pubblicazione: (2023)
Better Alignment with Instruction Back-and-Forth Translation
di: Nguyen, Thao, et al.
Pubblicazione: (2024)
di: Nguyen, Thao, et al.
Pubblicazione: (2024)
The Shielding Effect of Foreign Managers: Evidence From Chinese Listed Companies During the U.S.‐China Trade War
di: Bo Pu, et al.
Pubblicazione: (2026)
di: Bo Pu, et al.
Pubblicazione: (2026)
Open-world Instance Segmentation: Top-down Learning with Bottom-up Supervision
di: Kalluri, Tarun, et al.
Pubblicazione: (2023)
di: Kalluri, Tarun, et al.
Pubblicazione: (2023)
Novel Blockchain-based Protocols for Electronic Voting and Auctions
di: Lin, Zhaorun
Pubblicazione: (2025)
di: Lin, Zhaorun
Pubblicazione: (2025)
SPICE: Self-Play In Corpus Environments Improves Reasoning
di: Liu, Bo, et al.
Pubblicazione: (2025)
di: Liu, Bo, et al.
Pubblicazione: (2025)
On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment
di: Yin, Bo, et al.
Pubblicazione: (2026)
di: Yin, Bo, et al.
Pubblicazione: (2026)
Feedback-Free Resource Scheduling for Flexible Multi-BS Cooperation in FD-RAN
di: Liu, Jingbo, et al.
Pubblicazione: (2025)
di: Liu, Jingbo, et al.
Pubblicazione: (2025)
Documenti analoghi
-
HALC: Object Hallucination Reduction via Adaptive Focal-Contrast Decoding
di: Chen, Zhaorun, et al.
Pubblicazione: (2024) -
Agent Learning via Early Experience
di: Zhang, Kai, et al.
Pubblicazione: (2025) -
AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via Controllable Question Decomposition
di: Chen, Zhaorun, et al.
Pubblicazione: (2024) -
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases
di: Chen, Zhaorun, et al.
Pubblicazione: (2024) -
ShieldAgent: Shielding Agents via Verifiable Safety Policy Reasoning
di: Chen, Zhaorun, et al.
Pubblicazione: (2025)