Salvato in:
| Autori principali: | Zhang, Yanzhi, Zhang, Zhaoxi, Guan, Haoxiang, Cheng, Yilin, Duan, Yitong, Wang, Chen, Wang, Yue, Zheng, Shuxin, He, Jiyan |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2506.17219 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Population-Evolve: a Parallel Sampling and Evolutionary Method for LLM Math Reasoning
di: Zhang, Yanzhi, et al.
Pubblicazione: (2025)
di: Zhang, Yanzhi, et al.
Pubblicazione: (2025)
Harnessing Pre-Resolution Signals for Future Prediction Agents
di: Wei, Chuyang, et al.
Pubblicazione: (2026)
di: Wei, Chuyang, et al.
Pubblicazione: (2026)
Towards Generalist Prompting for Large Language Models by Mental Models
di: Guan, Haoxiang, et al.
Pubblicazione: (2024)
di: Guan, Haoxiang, et al.
Pubblicazione: (2024)
FutureWorld: A Live Reinforcement Learning Environment for Predictive Agents with Real-World Outcome Rewards
di: Han, Zhixin, et al.
Pubblicazione: (2026)
di: Han, Zhixin, et al.
Pubblicazione: (2026)
Can a Lightweight Automated AI Pipeline Solve Research-Level Mathematical Problems?
di: Meng, Lve, et al.
Pubblicazione: (2026)
di: Meng, Lve, et al.
Pubblicazione: (2026)
No Free Lunch Theorem for Privacy-Preserving LLM Inference
di: Zhang, Xiaojin, et al.
Pubblicazione: (2024)
di: Zhang, Xiaojin, et al.
Pubblicazione: (2024)
GTM: Simulating the World of Tools for AI Agents
di: Ren, Zhenzhen, et al.
Pubblicazione: (2025)
di: Ren, Zhenzhen, et al.
Pubblicazione: (2025)
Modeling Earth-Scale Human-Like Societies with One Billion Agents
di: Guan, Haoxiang, et al.
Pubblicazione: (2025)
di: Guan, Haoxiang, et al.
Pubblicazione: (2025)
Can MLLMs Absorb Math Reasoning Abilities from LLMs as Free Lunch?
di: Hu, Yijie, et al.
Pubblicazione: (2025)
di: Hu, Yijie, et al.
Pubblicazione: (2025)
GUIGuard-Bench: Toward a General Evaluation for Privacy-Preserving GUI Agents
di: Wang, Yanxi, et al.
Pubblicazione: (2026)
di: Wang, Yanxi, et al.
Pubblicazione: (2026)
No Free Lunch with Guardrails
di: Kumar, Divyanshu, et al.
Pubblicazione: (2025)
di: Kumar, Divyanshu, et al.
Pubblicazione: (2025)
EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework
di: Wang, Chen, et al.
Pubblicazione: (2025)
di: Wang, Chen, et al.
Pubblicazione: (2025)
A Free Lunch in LLM Compression: Revisiting Retraining after Pruning
di: Wagner, Moritz, et al.
Pubblicazione: (2025)
di: Wagner, Moritz, et al.
Pubblicazione: (2025)
FreeBind: Free Lunch in Unified Multimodal Space via Knowledge Fusion
di: Wang, Zehan, et al.
Pubblicazione: (2024)
di: Wang, Zehan, et al.
Pubblicazione: (2024)
Rule Learning for Knowledge Graph Reasoning under Agnostic Distribution Shift
di: Liu, Shixuan, et al.
Pubblicazione: (2025)
di: Liu, Shixuan, et al.
Pubblicazione: (2025)
Implicit Compression Regularization: Concise Reasoning via Internal Shorter Distributions in RL Post-Training
di: Wang, Chen, et al.
Pubblicazione: (2026)
di: Wang, Chen, et al.
Pubblicazione: (2026)
Free-Lunch Long Video Generation via Layer-Adaptive O.O.D Correction
di: Tian, Jiahao, et al.
Pubblicazione: (2026)
di: Tian, Jiahao, et al.
Pubblicazione: (2026)
Feedback Lunch: Learned Feedback Codes for Secure Communications
di: Zhou, Yingyao, et al.
Pubblicazione: (2025)
di: Zhou, Yingyao, et al.
Pubblicazione: (2025)
Step-GRPO: Internalizing Dynamic Early Exit for Efficient Reasoning
di: Chen, Benteng, et al.
Pubblicazione: (2026)
di: Chen, Benteng, et al.
Pubblicazione: (2026)
Navigating the Alpha Jungle: An LLM-Powered MCTS Framework for Formulaic Factor Mining
di: Shi, Yu, et al.
Pubblicazione: (2025)
di: Shi, Yu, et al.
Pubblicazione: (2025)
Internalizing Safety Understanding in Large Reasoning Models via Verification
di: Zhang, Yi, et al.
Pubblicazione: (2026)
di: Zhang, Yi, et al.
Pubblicazione: (2026)
Sparse Autoencoders Reveal Interpretable Structure in Small Gene Language Models
di: Guan, Haoxiang, et al.
Pubblicazione: (2025)
di: Guan, Haoxiang, et al.
Pubblicazione: (2025)
No Free Lunch for Defending Against Prefilling Attack by In-Context Learning
di: Xue, Zhiyu, et al.
Pubblicazione: (2024)
di: Xue, Zhiyu, et al.
Pubblicazione: (2024)
Internalizing LLM Reasoning via Discovery and Replay of Latent Actions
di: Shi, Zhenning, et al.
Pubblicazione: (2026)
di: Shi, Zhenning, et al.
Pubblicazione: (2026)
No Free Lunch from Audio Pretraining in Bioacoustics: A Benchmark Study of Embeddings
di: Chen, Chenggang, et al.
Pubblicazione: (2025)
di: Chen, Chenggang, et al.
Pubblicazione: (2025)
Asking LLMs to Verify First is Almost Free Lunch
di: Wu, Shiguang, et al.
Pubblicazione: (2025)
di: Wu, Shiguang, et al.
Pubblicazione: (2025)
Is It a Free Lunch for Removing Outliers during Pretraining?
di: Liao, Baohao, et al.
Pubblicazione: (2024)
di: Liao, Baohao, et al.
Pubblicazione: (2024)
Celo2: Towards Learned Optimization Free Lunch
di: Moudgil, Abhinav, et al.
Pubblicazione: (2026)
di: Moudgil, Abhinav, et al.
Pubblicazione: (2026)
Is Factuality Enhancement a Free Lunch For LLMs? Better Factuality Can Lead to Worse Context-Faithfulness
di: Bi, Baolong, et al.
Pubblicazione: (2024)
di: Bi, Baolong, et al.
Pubblicazione: (2024)
Enhancing LLM Reasoning with Reward-guided Tree Search
di: Jiang, Jinhao, et al.
Pubblicazione: (2024)
di: Jiang, Jinhao, et al.
Pubblicazione: (2024)
BioGraphFusion: Graph Knowledge Embedding for Biological Completion and Reasoning
di: Lin, Yitong, et al.
Pubblicazione: (2025)
di: Lin, Yitong, et al.
Pubblicazione: (2025)
No Free Lunch in Active Learning: LLM Embedding Quality Dictates Query Strategy Success
di: Rauch, Lukas, et al.
Pubblicazione: (2025)
di: Rauch, Lukas, et al.
Pubblicazione: (2025)
Integer Scale: A Free Lunch for Faster Fine-grained Quantization of LLMs
di: Li, Qingyuan, et al.
Pubblicazione: (2024)
di: Li, Qingyuan, et al.
Pubblicazione: (2024)
Rethinking the Bounds of LLM Reasoning: Are Multi-Agent Discussions the Key?
di: Wang, Qineng, et al.
Pubblicazione: (2024)
di: Wang, Qineng, et al.
Pubblicazione: (2024)
GeoMind: An Agentic Workflow for Lithology Classification with Reasoned Tool Invocation
di: Zhou, Yitong, et al.
Pubblicazione: (2026)
di: Zhou, Yitong, et al.
Pubblicazione: (2026)
Character-Level Perturbations Disrupt LLM Watermarks
di: Zhang, Zhaoxi, et al.
Pubblicazione: (2025)
di: Zhang, Zhaoxi, et al.
Pubblicazione: (2025)
Empowering Small Language Models with Factual Hallucination-Aware Reasoning for Financial Classification
di: Yuan, Han, et al.
Pubblicazione: (2026)
di: Yuan, Han, et al.
Pubblicazione: (2026)
Free Lunch in Medical Image Foundation Model Pre-training via Randomized Synthesis and Disentanglement
di: Wei, Yuhan, et al.
Pubblicazione: (2026)
di: Wei, Yuhan, et al.
Pubblicazione: (2026)
Generating Graph-like Rules for Knowledge Graph Reasoning via Diffusion Models
di: Cheng, Haoxiang, et al.
Pubblicazione: (2026)
di: Cheng, Haoxiang, et al.
Pubblicazione: (2026)
FreeCond: Free Lunch in the Input Conditions of Text-Guided Inpainting
di: Hsiao, Teng-Fang, et al.
Pubblicazione: (2024)
di: Hsiao, Teng-Fang, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Population-Evolve: a Parallel Sampling and Evolutionary Method for LLM Math Reasoning
di: Zhang, Yanzhi, et al.
Pubblicazione: (2025) -
Harnessing Pre-Resolution Signals for Future Prediction Agents
di: Wei, Chuyang, et al.
Pubblicazione: (2026) -
Towards Generalist Prompting for Large Language Models by Mental Models
di: Guan, Haoxiang, et al.
Pubblicazione: (2024) -
FutureWorld: A Live Reinforcement Learning Environment for Predictive Agents with Real-World Outcome Rewards
di: Han, Zhixin, et al.
Pubblicazione: (2026) -
Can a Lightweight Automated AI Pipeline Solve Research-Level Mathematical Problems?
di: Meng, Lve, et al.
Pubblicazione: (2026)