Enregistré dans:
| Auteurs principaux: | Gabor, Jonathan, Lynch, Jayson, Rosenfeld, Jonathan |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2511.21654 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Guided Speculative Inference for Efficient Test-Time Alignment of LLMs
par: Geuter, Jonathan, et autres
Publié: (2025)
par: Geuter, Jonathan, et autres
Publié: (2025)
PRPO: Aligning Process Reward with Outcome Reward in Policy Optimization
par: Ding, Ruiyi, et autres
Publié: (2026)
par: Ding, Ruiyi, et autres
Publié: (2026)
Merge-Bench: Resolve Merge Conflicts with Large Language Models
par: Schesch, Benedikt, et autres
Publié: (2026)
par: Schesch, Benedikt, et autres
Publié: (2026)
R-Genie: Reasoning-Guided Generative Image Editing
par: Zhang, Dong, et autres
Publié: (2025)
par: Zhang, Dong, et autres
Publié: (2025)
Time-to-Injury Forecasting in Elite Female Football: A DeepHit Survival Approach
par: Catterall, Victoria, et autres
Publié: (2026)
par: Catterall, Victoria, et autres
Publié: (2026)
The Price of Progress: Price Performance and the Future of AI
par: Gundlach, Hans, et autres
Publié: (2025)
par: Gundlach, Hans, et autres
Publié: (2025)
Evaluating the Efficacy of Hybrid Deep Learning Models in Distinguishing AI-Generated Text
par: Oketunji, Abiodun Finbarrs
Publié: (2023)
par: Oketunji, Abiodun Finbarrs
Publié: (2023)
Decoding-Time Debiasing via Process Reward Models: From Controlled Fill-in to Open-Ended Generation
par: Khan, Muneeb Ur Raheem
Publié: (2026)
par: Khan, Muneeb Ur Raheem
Publié: (2026)
OCRR: A Benchmark for Online Correction Recovery under Distribution Shift
par: Grassi, Adrian
Publié: (2026)
par: Grassi, Adrian
Publié: (2026)
ContextBench: A Benchmark for Context Retrieval in Coding Agents
par: Li, Han, et autres
Publié: (2026)
par: Li, Han, et autres
Publié: (2026)
Smaller Models, Smarter Rewards: A Two-Sided Approach to Process and Outcome Rewards
par: Groeneveld, Jan Niklas, et autres
Publié: (2025)
par: Groeneveld, Jan Niklas, et autres
Publié: (2025)
Random Heterogeneous Neurochaos Learning Architecture for Data Classification
par: S, Remya Ajai A, et autres
Publié: (2024)
par: S, Remya Ajai A, et autres
Publié: (2024)
The Hidden Attention of Mamba Models
par: Ali, Ameen, et autres
Publié: (2024)
par: Ali, Ameen, et autres
Publié: (2024)
LLM Unlearning on Noisy Forget Sets: A Study of Incomplete, Rewritten, and Watermarked Data
par: Wang, Changsheng, et autres
Publié: (2025)
par: Wang, Changsheng, et autres
Publié: (2025)
Introducing Three New Benchmark Datasets for Hierarchical Text Classification
par: Toit, Jaco du, et autres
Publié: (2024)
par: Toit, Jaco du, et autres
Publié: (2024)
Engineering A Large Language Model From Scratch
par: Oketunji, Abiodun Finbarrs
Publié: (2024)
par: Oketunji, Abiodun Finbarrs
Publié: (2024)
TensLoRA: Tensor Alternatives for Low-Rank Adaptation
par: Marmoret, Axel, et autres
Publié: (2025)
par: Marmoret, Axel, et autres
Publié: (2025)
FlexQuant: A Flexible and Efficient Dynamic Precision Switching Framework for LLM Quantization
par: Liu, Fangxin, et autres
Publié: (2025)
par: Liu, Fangxin, et autres
Publié: (2025)
Synergy over Discrepancy: A Partition-Based Approach to Multi-Domain LLM Fine-Tuning
par: Ye, Hua, et autres
Publié: (2025)
par: Ye, Hua, et autres
Publié: (2025)
MMSciBench: Benchmarking Language Models on Chinese Multimodal Scientific Problems
par: Ye, Xinwu, et autres
Publié: (2025)
par: Ye, Xinwu, et autres
Publié: (2025)
Why LoRA Resists Label Noise: A Theoretical Framework for Noise-Robust Parameter-Efficient Fine-Tuning
par: Steele, Brady
Publié: (2026)
par: Steele, Brady
Publié: (2026)
Entropy-Based Measurement of Value Drift and Alignment Work in Large Language Models
par: Fadli, Samih
Publié: (2025)
par: Fadli, Samih
Publié: (2025)
Alternating Reinforcement Learning with Contextual Rubric Rewards: Beyond the Scalarization Strategy
par: Lan, Guangchen, et autres
Publié: (2026)
par: Lan, Guangchen, et autres
Publié: (2026)
Procedural Environment Generation for Tool-Use Agents
par: Sullivan, Michael, et autres
Publié: (2025)
par: Sullivan, Michael, et autres
Publié: (2025)
Unsupervised Evaluation of Multi-Turn Objective-Driven Interactions
par: Soroka, Emi, et autres
Publié: (2025)
par: Soroka, Emi, et autres
Publié: (2025)
Random Scaling of Emergent Capabilities
par: Zhao, Rosie, et autres
Publié: (2025)
par: Zhao, Rosie, et autres
Publié: (2025)
Mr. Snuffleupagus at SemEval-2025 Task 4: Unlearning Factual Knowledge from LLMs Using Adaptive RMU
par: Dosajh, Arjun, et autres
Publié: (2025)
par: Dosajh, Arjun, et autres
Publié: (2025)
Echo Chamber: RL Post-training Amplifies Behaviors Learned in Pretraining
par: Zhao, Rosie, et autres
Publié: (2025)
par: Zhao, Rosie, et autres
Publié: (2025)
On the Challenges of Creating Datasets for Analyzing Commercial Sex Advertisements to Assess Human Trafficking Risk and Organized Activity
par: Rivas, Pablo, et autres
Publié: (2024)
par: Rivas, Pablo, et autres
Publié: (2024)
Hierarchical Shift Mixing -- Beyond Dense Attention in Transformers
par: Forchheimer, Robert
Publié: (2026)
par: Forchheimer, Robert
Publié: (2026)
Spectral Clustering in Convex and Constrained Settings
par: Behera, Swarup Ranjan, et autres
Publié: (2024)
par: Behera, Swarup Ranjan, et autres
Publié: (2024)
Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs
par: Ahmadian, Arash, et autres
Publié: (2024)
par: Ahmadian, Arash, et autres
Publié: (2024)
On Robustness and Chain-of-Thought Consistency of RL-Finetuned VLMs
par: Zhao, Rosie, et autres
Publié: (2026)
par: Zhao, Rosie, et autres
Publié: (2026)
Large Language Model (LLM) Bias Index -- LLMBI
par: Oketunji, Abiodun Finbarrs, et autres
Publié: (2023)
par: Oketunji, Abiodun Finbarrs, et autres
Publié: (2023)
ACE: Exploring Activation Cosine Similarity and Variance for Accurate and Calibration-Efficient LLM Pruning
par: Mi, Zhendong, et autres
Publié: (2025)
par: Mi, Zhendong, et autres
Publié: (2025)
Scalable GPU-Accelerated Euler Characteristic Curves: Optimization and Differentiable Learning for PyTorch
par: Saxena, Udit
Publié: (2025)
par: Saxena, Udit
Publié: (2025)
Memory-Efficient Differentially Private Training with Gradient Random Projection
par: Mulrooney, Alex, et autres
Publié: (2025)
par: Mulrooney, Alex, et autres
Publié: (2025)
KerZOO: Kernel Function Informed Zeroth-Order Optimization for Accurate and Accelerated LLM Fine-Tuning
par: Mi, Zhendong, et autres
Publié: (2025)
par: Mi, Zhendong, et autres
Publié: (2025)
Revisiting LRP: Positional Attribution as the Missing Ingredient for Transformer Explainability
par: Bakish, Yarden, et autres
Publié: (2025)
par: Bakish, Yarden, et autres
Publié: (2025)
QuAnTS: Question Answering on Time Series
par: Divo, Felix, et autres
Publié: (2025)
par: Divo, Felix, et autres
Publié: (2025)
Documents similaires
-
Guided Speculative Inference for Efficient Test-Time Alignment of LLMs
par: Geuter, Jonathan, et autres
Publié: (2025) -
PRPO: Aligning Process Reward with Outcome Reward in Policy Optimization
par: Ding, Ruiyi, et autres
Publié: (2026) -
Merge-Bench: Resolve Merge Conflicts with Large Language Models
par: Schesch, Benedikt, et autres
Publié: (2026) -
R-Genie: Reasoning-Guided Generative Image Editing
par: Zhang, Dong, et autres
Publié: (2025) -
Time-to-Injury Forecasting in Elite Female Football: A DeepHit Survival Approach
par: Catterall, Victoria, et autres
Publié: (2026)