Enregistré dans:
| Auteurs principaux: | Sheibanian, Mohsen, Shaeri, Pouya, Beigi, Alimohammad, Woo, Ryan T., Keluskar, Aryan |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.16905 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Evaluating Adaptive Personalization of Educational Readings with Simulated Learners
par: Woo, Ryan T., et autres
Publié: (2026)
par: Woo, Ryan T., et autres
Publié: (2026)
A Semi-supervised Fake News Detection using Sentiment Encoding and LSTM with Self-Attention
par: Shaeri, Pouya, et autres
Publié: (2024)
par: Shaeri, Pouya, et autres
Publié: (2024)
Sentiment and Social Signals in the Climate Crisis: A Survey on Analyzing Social Media Responses to Extreme Weather Events
par: Shaeri, Pouya, et autres
Publié: (2025)
par: Shaeri, Pouya, et autres
Publié: (2025)
MID-L: Matrix-Interpolated Dropout Layer with Layer-wise Neuron Selection
par: Shaeri, Pouya, et autres
Publié: (2025)
par: Shaeri, Pouya, et autres
Publié: (2025)
Explainable Human-in-the-Loop Segmentation via Critic Feedback Signals
par: Shaeri, Pouya, et autres
Publié: (2025)
par: Shaeri, Pouya, et autres
Publié: (2025)
MNIST-Gen: A Modular MNIST-Style Dataset Generation Using Hierarchical Semantics, Reinforcement Learning, and Category Theory
par: Shaeri, Pouya, et autres
Publié: (2025)
par: Shaeri, Pouya, et autres
Publié: (2025)
LOOKAT: Lookup-Optimized Key-Attention for Memory-Efficient Transformers
par: Karmore, Aryan
Publié: (2026)
par: Karmore, Aryan
Publié: (2026)
Do LLMs Understand Ambiguity in Text? A Case Study in Open-world Question Answering
par: Keluskar, Aryan, et autres
Publié: (2024)
par: Keluskar, Aryan, et autres
Publié: (2024)
LLMem: Estimating GPU Memory Usage for Fine-Tuning Pre-Trained LLMs
par: Kim, Taeho, et autres
Publié: (2024)
par: Kim, Taeho, et autres
Publié: (2024)
Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
par: Levine, Reese, et autres
Publié: (2026)
par: Levine, Reese, et autres
Publié: (2026)
Can LLMs Improve Multimodal Fact-Checking by Asking Relevant Questions?
par: Beigi, Alimohammad, et autres
Publié: (2024)
par: Beigi, Alimohammad, et autres
Publié: (2024)
CurvZO: Adaptive Curvature-Guided Sparse Zeroth-Order Optimization for Efficient LLM Fine-Tuning
par: Wang, Shuo, et autres
Publié: (2026)
par: Wang, Shuo, et autres
Publié: (2026)
Memory-Efficient Sequential Pattern Mining with Hybrid Tries
par: Hosseininasab, Amin, et autres
Publié: (2022)
par: Hosseininasab, Amin, et autres
Publié: (2022)
Sample-Efficient Bayesian Optimization with Transfer Learning for Heterogeneous Search Spaces
par: Deshwal, Aryan, et autres
Publié: (2024)
par: Deshwal, Aryan, et autres
Publié: (2024)
Efficient Arbitrary Precision Acceleration for Large Language Models on GPU Tensor Cores
par: Ma, Shaobo, et autres
Publié: (2024)
par: Ma, Shaobo, et autres
Publié: (2024)
CoMERA: Computing- and Memory-Efficient Training via Rank-Adaptive Tensor Optimization
par: Yang, Zi, et autres
Publié: (2024)
par: Yang, Zi, et autres
Publié: (2024)
COM-BOM: Bayesian Exemplar Search for Efficiently Exploring the Accuracy-Calibration Pareto Frontier
par: Luo, Gaoxiang, et autres
Publié: (2025)
par: Luo, Gaoxiang, et autres
Publié: (2025)
Efficient Edge LLMs Deployment via HessianAware Quantization and CPU GPU Collaborative
par: Zhang, Tuo, et autres
Publié: (2025)
par: Zhang, Tuo, et autres
Publié: (2025)
CurvaDion: Curvature-Adaptive Distributed Orthonormalization
par: Kumar, Bhavesh, et autres
Publié: (2025)
par: Kumar, Bhavesh, et autres
Publié: (2025)
CUROCKET: Optimizing ROCKET for GPU
par: Stüven, Ole, et autres
Publié: (2026)
par: Stüven, Ole, et autres
Publié: (2026)
Carnatic Raga Identification System using Rigorous Time-Delay Neural Network
par: Natesan, Sanjay, et autres
Publié: (2024)
par: Natesan, Sanjay, et autres
Publié: (2024)
Dynamic Memory Based Adaptive Optimization
par: Szegedy, Balázs, et autres
Publié: (2024)
par: Szegedy, Balázs, et autres
Publié: (2024)
Bayesian Optimization for Function-Valued Responses under Min-Max Criteria
par: Ahadi, Pouya, et autres
Publié: (2025)
par: Ahadi, Pouya, et autres
Publié: (2025)
GPU Memory Requirement Prediction for Deep Learning Task Based on Bidirectional Gated Recurrent Unit Optimization Transformer
par: Wang, Chao, et autres
Publié: (2025)
par: Wang, Chao, et autres
Publié: (2025)
Towards Optimizing the Costs of LLM Usage
par: Shekhar, Shivanshu, et autres
Publié: (2024)
par: Shekhar, Shivanshu, et autres
Publié: (2024)
FlashOptim: Optimizers for Memory-Efficient Training
par: Ortiz, Jose Javier Gonzalez, et autres
Publié: (2026)
par: Ortiz, Jose Javier Gonzalez, et autres
Publié: (2026)
AgentKernelArena: Generalization-Aware Benchmarking of GPU Kernel Optimization Agents
par: Younesian, Sharareh, et autres
Publié: (2026)
par: Younesian, Sharareh, et autres
Publié: (2026)
Scale When Needed: Adaptive Neuron-level Mixed Precision Quantization Aware Training
par: Varshney, Ayush K., et autres
Publié: (2026)
par: Varshney, Ayush K., et autres
Publié: (2026)
Tri-MTL: A Triple Multitask Learning Approach for Respiratory Disease Diagnosis
par: Kim, June-Woo, et autres
Publié: (2025)
par: Kim, June-Woo, et autres
Publié: (2025)
ButterflyMoE: Sub-Linear Ternary Experts via Structured Butterfly Orbits
par: Karmore, Aryan
Publié: (2026)
par: Karmore, Aryan
Publié: (2026)
RAMP: Reinforcement Adaptive Mixed Precision Quantization for Efficient On Device LLM Inference
par: Gautam, Arpit Singh, et autres
Publié: (2026)
par: Gautam, Arpit Singh, et autres
Publié: (2026)
Curvature-Aware Optimization for High-Accuracy Physics-Informed Neural Networks
par: Jnini, Anas, et autres
Publié: (2026)
par: Jnini, Anas, et autres
Publié: (2026)
Online GPU Energy Optimization with Switching-Aware Bandits
par: Xu, Xiongxiao, et autres
Publié: (2024)
par: Xu, Xiongxiao, et autres
Publié: (2024)
Geometry-Aware Backdoor Attacks: Leveraging Curvature in Hyperbolic Embeddings
par: Baheri, Ali
Publié: (2025)
par: Baheri, Ali
Publié: (2025)
SECRET: Semi-supervised Clinical Trial Document Similarity Search
par: Das, Trisha, et autres
Publié: (2025)
par: Das, Trisha, et autres
Publié: (2025)
Adversarial Reward Auditing for Active Detection and Mitigation of Reward Hacking
par: Beigi, Mohammad, et autres
Publié: (2026)
par: Beigi, Mohammad, et autres
Publié: (2026)
Harnessing Optimization Dynamics for Curvature-Informed Model Merging
par: Mahdavinia, Pouria, et autres
Publié: (2025)
par: Mahdavinia, Pouria, et autres
Publié: (2025)
Constraint-Adaptive Policy Switching for Offline Safe Reinforcement Learning
par: Chemingui, Yassine, et autres
Publié: (2024)
par: Chemingui, Yassine, et autres
Publié: (2024)
$\texttt{AMEND++}$: Benchmarking Eligibility Criteria Amendments in Clinical Trials
par: Das, Trisha, et autres
Publié: (2026)
par: Das, Trisha, et autres
Publié: (2026)
SMMF: Square-Matricized Momentum Factorization for Memory-Efficient Optimization
par: Park, Kwangryeol, et autres
Publié: (2024)
par: Park, Kwangryeol, et autres
Publié: (2024)
Documents similaires
-
Evaluating Adaptive Personalization of Educational Readings with Simulated Learners
par: Woo, Ryan T., et autres
Publié: (2026) -
A Semi-supervised Fake News Detection using Sentiment Encoding and LSTM with Self-Attention
par: Shaeri, Pouya, et autres
Publié: (2024) -
Sentiment and Social Signals in the Climate Crisis: A Survey on Analyzing Social Media Responses to Extreme Weather Events
par: Shaeri, Pouya, et autres
Publié: (2025) -
MID-L: Matrix-Interpolated Dropout Layer with Layer-wise Neuron Selection
par: Shaeri, Pouya, et autres
Publié: (2025) -
Explainable Human-in-the-Loop Segmentation via Critic Feedback Signals
par: Shaeri, Pouya, et autres
Publié: (2025)