Salvato in:
| Autori principali: | Liu, Peidong, Lin, Junjiang, Wang, Shaowen, Xu, Yao, Li, Haiqing, Xie, Xuhao, Wu, Siyi, Li, Hao |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2510.01620 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Just Enough Thinking: Efficient Reasoning with Adaptive Length Penalties Reinforcement Learning
di: Xiang, Violet, et al.
Pubblicazione: (2025)
di: Xiang, Violet, et al.
Pubblicazione: (2025)
Information-Theoretic Distillation for Reference-less Summarization
di: Jung, Jaehun, et al.
Pubblicazione: (2024)
di: Jung, Jaehun, et al.
Pubblicazione: (2024)
Context-CoT: Enhancing Context Learning via High-Quality Reasoning Synthesis
di: Jin, Hongbo, et al.
Pubblicazione: (2026)
di: Jin, Hongbo, et al.
Pubblicazione: (2026)
Escaping the Context Bottleneck: Active Context Curation for LLM Agents via Reinforcement Learning
di: Li, Xiaozhe, et al.
Pubblicazione: (2026)
di: Li, Xiaozhe, et al.
Pubblicazione: (2026)
One Token Is Enough: Improving Diffusion Language Models with a Sink Token
di: Zhang, Zihou, et al.
Pubblicazione: (2026)
di: Zhang, Zihou, et al.
Pubblicazione: (2026)
To Theoretically Understand Transformer-Based In-Context Learning for Optimizing CSMA
di: Hao, Shugang, et al.
Pubblicazione: (2025)
di: Hao, Shugang, et al.
Pubblicazione: (2025)
Language Models for Text Classification: Is In-Context Learning Enough?
di: Edwards, Aleksandra, et al.
Pubblicazione: (2024)
di: Edwards, Aleksandra, et al.
Pubblicazione: (2024)
DeepContext: A Context-aware, Cross-platform, and Cross-framework Tool for Performance Profiling and Analysis of Deep Learning Workloads
di: Zhao, Qidong, et al.
Pubblicazione: (2024)
di: Zhao, Qidong, et al.
Pubblicazione: (2024)
Innate Reasoning is Not Enough: In-Context Learning Enhances Reasoning Large Language Models with Less Overthinking
di: Ge, Yuyao, et al.
Pubblicazione: (2025)
di: Ge, Yuyao, et al.
Pubblicazione: (2025)
Think Just Enough: Sequence-Level Entropy as a Confidence Signal for LLM Reasoning
di: Sharma, Aman, et al.
Pubblicazione: (2025)
di: Sharma, Aman, et al.
Pubblicazione: (2025)
Fitting Is Not Enough: Smoothness in Extremely Quantized LLMs
di: Xu, Yuzhuang, et al.
Pubblicazione: (2026)
di: Xu, Yuzhuang, et al.
Pubblicazione: (2026)
Context-Aware Pseudo-Label Scoring for Zero-Shot Video Summarization
di: Wu, Yuanli, et al.
Pubblicazione: (2025)
di: Wu, Yuanli, et al.
Pubblicazione: (2025)
Improving Factual Consistency of News Summarization by Contrastive Preference Optimization
di: Feng, Huawen, et al.
Pubblicazione: (2023)
di: Feng, Huawen, et al.
Pubblicazione: (2023)
OptiLeak: Efficient Prompt Reconstruction via Reinforcement Learning in Multi-tenant LLM Services
di: Wang, Longxiang, et al.
Pubblicazione: (2026)
di: Wang, Longxiang, et al.
Pubblicazione: (2026)
Enhancing In-Context Learning Performance with just SVD-Based Weight Pruning: A Theoretical Perspective
di: Yao, Xinhao, et al.
Pubblicazione: (2024)
di: Yao, Xinhao, et al.
Pubblicazione: (2024)
Quotient DAGs for Off-Policy Evaluation:Forward-Flow Importance Sampling and Exact Slate Propensities
di: Xie, Ziwen, et al.
Pubblicazione: (2026)
di: Xie, Ziwen, et al.
Pubblicazione: (2026)
KITE: Kernelized and Information Theoretic Exemplars for In-Context Learning
di: Singh, Vaibhav, et al.
Pubblicazione: (2025)
di: Singh, Vaibhav, et al.
Pubblicazione: (2025)
Is Distance Matrix Enough for Geometric Deep Learning?
di: Li, Zian, et al.
Pubblicazione: (2023)
di: Li, Zian, et al.
Pubblicazione: (2023)
Beyond Prompting: Efficient and Robust Contextual Biasing for Speech LLMs via Logit-Space Integration (LOGIC)
di: Wang, Peidong
Pubblicazione: (2026)
di: Wang, Peidong
Pubblicazione: (2026)
RLPF: Reinforcement Learning from Prediction Feedback for User Summarization with LLMs
di: Wu, Jiaxing, et al.
Pubblicazione: (2024)
di: Wu, Jiaxing, et al.
Pubblicazione: (2024)
Just Enough Shifts: Mitigating Over-Refusal in Aligned Language Models with Targeted Representation Fine-Tuning
di: Dabas, Mahavir, et al.
Pubblicazione: (2025)
di: Dabas, Mahavir, et al.
Pubblicazione: (2025)
Reward Is Enough: LLMs Are In-Context Reinforcement Learners
di: Song, Kefan, et al.
Pubblicazione: (2025)
di: Song, Kefan, et al.
Pubblicazione: (2025)
Shortcut Learning in In-Context Learning: A Survey
di: Song, Rui, et al.
Pubblicazione: (2024)
di: Song, Rui, et al.
Pubblicazione: (2024)
On the Size Complexity and Decidability of First-Order Progression
di: Classen, Jens, et al.
Pubblicazione: (2026)
di: Classen, Jens, et al.
Pubblicazione: (2026)
Tracking vs. Deciding: The Dual-Capability Bottleneck in Searchless Chess Transformers
di: Li, Quanhao, et al.
Pubblicazione: (2026)
di: Li, Quanhao, et al.
Pubblicazione: (2026)
Learning Agent-Compatible Context Management for Long-Horizon Tasks
di: Yi, Lu, et al.
Pubblicazione: (2026)
di: Yi, Lu, et al.
Pubblicazione: (2026)
Vibe Medicine: Redefining Biomedical Research Through Human-AI Co-Work
di: Wu, Zihao, et al.
Pubblicazione: (2026)
di: Wu, Zihao, et al.
Pubblicazione: (2026)
Memorizing is Not Enough: Deep Knowledge Injection Through Reasoning
di: Xu, Ruoxi, et al.
Pubblicazione: (2025)
di: Xu, Ruoxi, et al.
Pubblicazione: (2025)
Scaling LLM Multi-turn RL with End-to-end Summarization-based Context Management
di: Lu, Miao, et al.
Pubblicazione: (2025)
di: Lu, Miao, et al.
Pubblicazione: (2025)
Addressing Imbalance for Class Incremental Learning in Medical Image Classification
di: Hao, Xuze, et al.
Pubblicazione: (2024)
di: Hao, Xuze, et al.
Pubblicazione: (2024)
VLSBench: Unveiling Visual Leakage in Multimodal Safety
di: Hu, Xuhao, et al.
Pubblicazione: (2024)
di: Hu, Xuhao, et al.
Pubblicazione: (2024)
Value-Sensitive AI for Prayer: Balancing the Agencies Between Human and AI Agents in Spiritual Context
di: Kwon, Soonho, et al.
Pubblicazione: (2026)
di: Kwon, Soonho, et al.
Pubblicazione: (2026)
Enhancing Video Summarization with Context Awareness
di: Huynh-Lam, Hai-Dang, et al.
Pubblicazione: (2024)
di: Huynh-Lam, Hai-Dang, et al.
Pubblicazione: (2024)
Hallucination Diversity-Aware Active Learning for Text Summarization
di: Xia, Yu, et al.
Pubblicazione: (2024)
di: Xia, Yu, et al.
Pubblicazione: (2024)
Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws
di: Pan, Zhixuan, et al.
Pubblicazione: (2025)
di: Pan, Zhixuan, et al.
Pubblicazione: (2025)
S^2tory: Story Spine Distillation for Movie Script Summarization
di: Lu, Mingzhe, et al.
Pubblicazione: (2026)
di: Lu, Mingzhe, et al.
Pubblicazione: (2026)
Empowering In-Browser Deep Learning Inference on Edge Devices with Just-in-Time Kernel Optimizations
di: Jia, Fucheng, et al.
Pubblicazione: (2023)
di: Jia, Fucheng, et al.
Pubblicazione: (2023)
Large Language Model Agent for Hyper-Parameter Optimization
di: Liu, Siyi, et al.
Pubblicazione: (2024)
di: Liu, Siyi, et al.
Pubblicazione: (2024)
Disentangling Instructive Information from Ranked Multiple Candidates for Multi-Document Scientific Summarization
di: Wang, Pancheng, et al.
Pubblicazione: (2024)
di: Wang, Pancheng, et al.
Pubblicazione: (2024)
Just-In-Time Reinforcement Learning: Continual Learning in LLM Agents Without Gradient Updates
di: Li, Yibo, et al.
Pubblicazione: (2026)
di: Li, Yibo, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Just Enough Thinking: Efficient Reasoning with Adaptive Length Penalties Reinforcement Learning
di: Xiang, Violet, et al.
Pubblicazione: (2025) -
Information-Theoretic Distillation for Reference-less Summarization
di: Jung, Jaehun, et al.
Pubblicazione: (2024) -
Context-CoT: Enhancing Context Learning via High-Quality Reasoning Synthesis
di: Jin, Hongbo, et al.
Pubblicazione: (2026) -
Escaping the Context Bottleneck: Active Context Curation for LLM Agents via Reinforcement Learning
di: Li, Xiaozhe, et al.
Pubblicazione: (2026) -
One Token Is Enough: Improving Diffusion Language Models with a Sink Token
di: Zhang, Zihou, et al.
Pubblicazione: (2026)