:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Gabor, Jonathan, Lynch, Jayson, Rosenfeld, Jonathan
Format:	Preprint
Publié:	2025
Sujets:	Machine Learning I.2.7
Accès en ligne:	https://arxiv.org/abs/2511.21654
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Guided Speculative Inference for Efficient Test-Time Alignment of LLMs
par: Geuter, Jonathan, et autres
Publié: (2025)

PRPO: Aligning Process Reward with Outcome Reward in Policy Optimization
par: Ding, Ruiyi, et autres
Publié: (2026)

Merge-Bench: Resolve Merge Conflicts with Large Language Models
par: Schesch, Benedikt, et autres
Publié: (2026)

R-Genie: Reasoning-Guided Generative Image Editing
par: Zhang, Dong, et autres
Publié: (2025)

Time-to-Injury Forecasting in Elite Female Football: A DeepHit Survival Approach
par: Catterall, Victoria, et autres
Publié: (2026)

The Price of Progress: Price Performance and the Future of AI
par: Gundlach, Hans, et autres
Publié: (2025)

Evaluating the Efficacy of Hybrid Deep Learning Models in Distinguishing AI-Generated Text
par: Oketunji, Abiodun Finbarrs
Publié: (2023)

Decoding-Time Debiasing via Process Reward Models: From Controlled Fill-in to Open-Ended Generation
par: Khan, Muneeb Ur Raheem
Publié: (2026)

OCRR: A Benchmark for Online Correction Recovery under Distribution Shift
par: Grassi, Adrian
Publié: (2026)

ContextBench: A Benchmark for Context Retrieval in Coding Agents
par: Li, Han, et autres
Publié: (2026)

Smaller Models, Smarter Rewards: A Two-Sided Approach to Process and Outcome Rewards
par: Groeneveld, Jan Niklas, et autres
Publié: (2025)

Random Heterogeneous Neurochaos Learning Architecture for Data Classification
par: S, Remya Ajai A, et autres
Publié: (2024)

The Hidden Attention of Mamba Models
par: Ali, Ameen, et autres
Publié: (2024)

LLM Unlearning on Noisy Forget Sets: A Study of Incomplete, Rewritten, and Watermarked Data
par: Wang, Changsheng, et autres
Publié: (2025)

Introducing Three New Benchmark Datasets for Hierarchical Text Classification
par: Toit, Jaco du, et autres
Publié: (2024)

Engineering A Large Language Model From Scratch
par: Oketunji, Abiodun Finbarrs
Publié: (2024)

TensLoRA: Tensor Alternatives for Low-Rank Adaptation
par: Marmoret, Axel, et autres
Publié: (2025)

FlexQuant: A Flexible and Efficient Dynamic Precision Switching Framework for LLM Quantization
par: Liu, Fangxin, et autres
Publié: (2025)

Synergy over Discrepancy: A Partition-Based Approach to Multi-Domain LLM Fine-Tuning
par: Ye, Hua, et autres
Publié: (2025)

MMSciBench: Benchmarking Language Models on Chinese Multimodal Scientific Problems
par: Ye, Xinwu, et autres
Publié: (2025)

Why LoRA Resists Label Noise: A Theoretical Framework for Noise-Robust Parameter-Efficient Fine-Tuning
par: Steele, Brady
Publié: (2026)

Entropy-Based Measurement of Value Drift and Alignment Work in Large Language Models
par: Fadli, Samih
Publié: (2025)

Alternating Reinforcement Learning with Contextual Rubric Rewards: Beyond the Scalarization Strategy
par: Lan, Guangchen, et autres
Publié: (2026)

Procedural Environment Generation for Tool-Use Agents
par: Sullivan, Michael, et autres
Publié: (2025)

Unsupervised Evaluation of Multi-Turn Objective-Driven Interactions
par: Soroka, Emi, et autres
Publié: (2025)

Random Scaling of Emergent Capabilities
par: Zhao, Rosie, et autres
Publié: (2025)

Mr. Snuffleupagus at SemEval-2025 Task 4: Unlearning Factual Knowledge from LLMs Using Adaptive RMU
par: Dosajh, Arjun, et autres
Publié: (2025)

Echo Chamber: RL Post-training Amplifies Behaviors Learned in Pretraining
par: Zhao, Rosie, et autres
Publié: (2025)

On the Challenges of Creating Datasets for Analyzing Commercial Sex Advertisements to Assess Human Trafficking Risk and Organized Activity
par: Rivas, Pablo, et autres
Publié: (2024)

Hierarchical Shift Mixing -- Beyond Dense Attention in Transformers
par: Forchheimer, Robert
Publié: (2026)

Spectral Clustering in Convex and Constrained Settings
par: Behera, Swarup Ranjan, et autres
Publié: (2024)

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs
par: Ahmadian, Arash, et autres
Publié: (2024)

On Robustness and Chain-of-Thought Consistency of RL-Finetuned VLMs
par: Zhao, Rosie, et autres
Publié: (2026)

Large Language Model (LLM) Bias Index -- LLMBI
par: Oketunji, Abiodun Finbarrs, et autres
Publié: (2023)

ACE: Exploring Activation Cosine Similarity and Variance for Accurate and Calibration-Efficient LLM Pruning
par: Mi, Zhendong, et autres
Publié: (2025)

Scalable GPU-Accelerated Euler Characteristic Curves: Optimization and Differentiable Learning for PyTorch
par: Saxena, Udit
Publié: (2025)

Memory-Efficient Differentially Private Training with Gradient Random Projection
par: Mulrooney, Alex, et autres
Publié: (2025)

KerZOO: Kernel Function Informed Zeroth-Order Optimization for Accurate and Accelerated LLM Fine-Tuning
par: Mi, Zhendong, et autres
Publié: (2025)

Revisiting LRP: Positional Attribution as the Missing Ingredient for Transformer Explainability
par: Bakish, Yarden, et autres
Publié: (2025)

QuAnTS: Question Answering on Time Series
par: Divo, Felix, et autres
Publié: (2025)