Salvato in:
| Autori principali: | Wang, Jialiang, Liu, Yuchen, Xu, Hang, Hu, Kaichun, Di, Shimin, Ni, Wangze, Yue, Linan, Zhang, Min-Ling, Ren, Kui, Chen, Lei |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2604.23593 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
TravelEval: A Comprehensive Benchmarking Framework for Evaluating LLM-Powered Travel Planning Agents
di: Chen, Weiyi, et al.
Pubblicazione: (2026)
di: Chen, Weiyi, et al.
Pubblicazione: (2026)
Guided by Trajectories: Repairing and Rewarding Tool-Use Trajectories for Tool-Integrated Reasoning
di: Gong, Siyu, et al.
Pubblicazione: (2026)
di: Gong, Siyu, et al.
Pubblicazione: (2026)
RxnNano:Training Compact LLMs for Chemical Reaction and Retrosynthesis Prediction via Hierarchical Curriculum Learning
di: Li, Ran, et al.
Pubblicazione: (2026)
di: Li, Ran, et al.
Pubblicazione: (2026)
Code2MCP: Transforming Code Repositories into MCP Services
di: Ouyang, Chaoqian, et al.
Pubblicazione: (2025)
di: Ouyang, Chaoqian, et al.
Pubblicazione: (2025)
ContextCache: Context-Aware Semantic Cache for Multi-Turn Queries in Large Language Models
di: Yan, Jianxin, et al.
Pubblicazione: (2025)
di: Yan, Jianxin, et al.
Pubblicazione: (2025)
ERASER: Machine Unlearning in MLaaS via an Inference Serving-Aware Approach
di: Hu, Yuke, et al.
Pubblicazione: (2023)
di: Hu, Yuke, et al.
Pubblicazione: (2023)
Can we trust the evaluation on ChatGPT?
di: Aiyappa, Rachith, et al.
Pubblicazione: (2023)
di: Aiyappa, Rachith, et al.
Pubblicazione: (2023)
Editorial: Why should we care about preparing referee reports?
di: Matheus Albergaria
Pubblicazione: (2021)
di: Matheus Albergaria
Pubblicazione: (2021)
RAC: Relation-Aware Cache Replacement for Large Language Models
di: Wu, Yuchong, et al.
Pubblicazione: (2026)
di: Wu, Yuchong, et al.
Pubblicazione: (2026)
Learning to Compose for Cross-domain Agentic Workflow Generation
di: Wang, Jialiang, et al.
Pubblicazione: (2026)
di: Wang, Jialiang, et al.
Pubblicazione: (2026)
FactReview: Evidence-Grounded Peer Review with Execution-Based Claim Verification
di: Yue, Ling, et al.
Pubblicazione: (2026)
di: Yue, Ling, et al.
Pubblicazione: (2026)
SJP referees
Pubblicazione: (2025)
Pubblicazione: (2025)
Can we disrupt the momentum of the AI colonization of science education?
di: Lucy Avraamidou
Pubblicazione: (2024)
di: Lucy Avraamidou
Pubblicazione: (2024)
SRBench: A Comprehensive Benchmark for Sequential Recommendation with Large Language Models
di: Li, Jianhong, et al.
Pubblicazione: (2026)
di: Li, Jianhong, et al.
Pubblicazione: (2026)
Class-aware and Augmentation-free Contrastive Learning from Label Proportion
di: Wang, Jialiang, et al.
Pubblicazione: (2024)
di: Wang, Jialiang, et al.
Pubblicazione: (2024)
Bridging Efficiency and Transparency: Explainable CoT Compression in Multimodal Large Reasoning Models
di: Wang, Yizhi, et al.
Pubblicazione: (2026)
di: Wang, Yizhi, et al.
Pubblicazione: (2026)
Training Multimodal Large Reasoning Models Needs Better Thoughts: A Three-Stage Framework for Long Chain-of-Thought Synthesis and Selection
di: Wang, Yizhi, et al.
Pubblicazione: (2025)
di: Wang, Yizhi, et al.
Pubblicazione: (2025)
Can we trust LLM Self-Explanations for Entity Resolution?
di: Teofili, Tommaso, et al.
Pubblicazione: (2026)
di: Teofili, Tommaso, et al.
Pubblicazione: (2026)
QCFuse: Query-Centric Cache Fusion for Efficient RAG Inference
di: Yan, Jianxin, et al.
Pubblicazione: (2026)
di: Yan, Jianxin, et al.
Pubblicazione: (2026)
HarmMetric Eval: Benchmarking Metrics and Judges for LLM Harmfulness Assessment
di: Yang, Langqi, et al.
Pubblicazione: (2025)
di: Yang, Langqi, et al.
Pubblicazione: (2025)
When I say … trust in AI
di: Levent Çetinkaya
Pubblicazione: (2025)
di: Levent Çetinkaya
Pubblicazione: (2025)
Can we trust AI for acne advice: A double‐blind performance comparison with NICE guidelines
di: Xufei Luo, et al.
Pubblicazione: (2025)
di: Xufei Luo, et al.
Pubblicazione: (2025)
DualBreach: Efficient Dual-Jailbreaking via Target-Driven Initialization and Multi-Target Optimization
di: Huang, Xinzhe, et al.
Pubblicazione: (2025)
di: Huang, Xinzhe, et al.
Pubblicazione: (2025)
Don't Overthink It: A Survey of Efficient R1-style Large Reasoning Models
di: Yue, Linan, et al.
Pubblicazione: (2025)
di: Yue, Linan, et al.
Pubblicazione: (2025)
Guest editors and referees 2023
Pubblicazione: (2024)
Pubblicazione: (2024)
TCT referee recognition 2023
Pubblicazione: (2024)
Pubblicazione: (2024)
Why do referees end their careers and which factors determine the duration of a referee’s career?
di: Christian Rullang
Pubblicazione: (2017)
di: Christian Rullang
Pubblicazione: (2017)
ExplainitAI: When do we trust artificial intelligence? The influence of content and explainability in a cross-cultural comparison
di: Kang, Sora, et al.
Pubblicazione: (2025)
di: Kang, Sora, et al.
Pubblicazione: (2025)
Can we automatize scientific discovery in the cognitive sciences?
di: Jagadish, Akshay K., et al.
Pubblicazione: (2026)
di: Jagadish, Akshay K., et al.
Pubblicazione: (2026)
Misfortunes of a mathematicians' trio using Computer Algebra Systems: Can we trust?
di: Durán, Antonio J., et al.
Pubblicazione: (2013)
di: Durán, Antonio J., et al.
Pubblicazione: (2013)
Scientific writing and referee professional training
di: George Argota Pérez
Pubblicazione: (2023)
di: George Argota Pérez
Pubblicazione: (2023)
When End-to-End is Overkill: Rethinking Cascaded Speech-to-Text Translation
di: Min, Anna, et al.
Pubblicazione: (2025)
di: Min, Anna, et al.
Pubblicazione: (2025)
SpatialJB: How Text Distribution Art Becomes the "Jailbreak Key" for LLM Guardrails
di: Mou, Zhiyi, et al.
Pubblicazione: (2026)
di: Mou, Zhiyi, et al.
Pubblicazione: (2026)
Proficient Graph Neural Network Design by Accumulating Knowledge on Large Language Models
di: Wang, Jialiang, et al.
Pubblicazione: (2024)
di: Wang, Jialiang, et al.
Pubblicazione: (2024)
Beyond Model Base Retrieval: Weaving Knowledge to Master Fine-grained Neural Network Design
di: Wang, Jialiang, et al.
Pubblicazione: (2025)
di: Wang, Jialiang, et al.
Pubblicazione: (2025)
Can we coevolve with AI?
di: Joshua E Lerner, et al.
Pubblicazione: (2024)
di: Joshua E Lerner, et al.
Pubblicazione: (2024)
When can we trust untrusted monitoring? A safety case sketch across collusion strategies
di: Gardner-Challis, Nelson, et al.
Pubblicazione: (2026)
di: Gardner-Challis, Nelson, et al.
Pubblicazione: (2026)
When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra
di: Jürgens, Mira, et al.
Pubblicazione: (2026)
di: Jürgens, Mira, et al.
Pubblicazione: (2026)
International. Send off referee, says Israel
Pubblicazione: (1998)
Pubblicazione: (1998)
Visible Light‐Induced Polymerization to Access Polyamides
di: Haiyan Hu, et al.
Pubblicazione: (2024)
di: Haiyan Hu, et al.
Pubblicazione: (2024)
Documenti analoghi
-
TravelEval: A Comprehensive Benchmarking Framework for Evaluating LLM-Powered Travel Planning Agents
di: Chen, Weiyi, et al.
Pubblicazione: (2026) -
Guided by Trajectories: Repairing and Rewarding Tool-Use Trajectories for Tool-Integrated Reasoning
di: Gong, Siyu, et al.
Pubblicazione: (2026) -
RxnNano:Training Compact LLMs for Chemical Reaction and Retrosynthesis Prediction via Hierarchical Curriculum Learning
di: Li, Ran, et al.
Pubblicazione: (2026) -
Code2MCP: Transforming Code Repositories into MCP Services
di: Ouyang, Chaoqian, et al.
Pubblicazione: (2025) -
ContextCache: Context-Aware Semantic Cache for Multi-Turn Queries in Large Language Models
di: Yan, Jianxin, et al.
Pubblicazione: (2025)