Enregistré dans:
| Auteur principal: | Bloem, Peter |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2506.20057 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Predicting integers from continuous parameters
par: Maat, Bas, et autres
Publié: (2026)
par: Maat, Bas, et autres
Publié: (2026)
LLM Probing with Contrastive Eigenproblems: Improving Understanding and Applicability of CCS
par: Schouten, Stefan F., et autres
Publié: (2025)
par: Schouten, Stefan F., et autres
Publié: (2025)
Non-parametric Hypothesis Tests for Distributional Group Symmetry
par: Chiu, Kenny, et autres
Publié: (2023)
par: Chiu, Kenny, et autres
Publié: (2023)
Debiased Counterfactual Generation via Flow Matching from Observations
par: Dance, Hugh, et autres
Publié: (2026)
par: Dance, Hugh, et autres
Publié: (2026)
Distinguishing Cause from Effect with Causal Velocity Models
par: Xi, Johnny, et autres
Publié: (2025)
par: Xi, Johnny, et autres
Publié: (2025)
Clustering Internet Memes Through Template Matching and Multi-Dimensional Similarity
par: Bloem, Tygo, et autres
Publié: (2025)
par: Bloem, Tygo, et autres
Publié: (2025)
Counterfactual Cocycles: A Framework for Robust and Coherent Counterfactual Transports
par: Dance, Hugh, et autres
Publié: (2024)
par: Dance, Hugh, et autres
Publié: (2024)
Stepsize anything: A unified learning rate schedule for budgeted-iteration training
par: Tang, Anda, et autres
Publié: (2025)
par: Tang, Anda, et autres
Publié: (2025)
From pre-training to downstream performance: Does domain-specific pre-training make sense?
par: Krones, Felix
Publié: (2026)
par: Krones, Felix
Publié: (2026)
Data-efficient pre-training by scaling synthetic megadocs
par: Kim, Konwoo, et autres
Publié: (2026)
par: Kim, Konwoo, et autres
Publié: (2026)
Pre-training under infinite compute
par: Kim, Konwoo, et autres
Publié: (2025)
par: Kim, Konwoo, et autres
Publié: (2025)
Photonic convolutional neural network with pre-trained in-situ training
par: Ranjan, Saurabh, et autres
Publié: (2026)
par: Ranjan, Saurabh, et autres
Publié: (2026)
Towards a deeper GCN: Alleviate over-smoothing with iterative training and fine-tuning
par: Peng, Furong, et autres
Publié: (2025)
par: Peng, Furong, et autres
Publié: (2025)
Mixed Variational Flows for Discrete Variables
par: Diluvi, Gian Carlo, et autres
Publié: (2023)
par: Diluvi, Gian Carlo, et autres
Publié: (2023)
GRAPES: Learning to Sample Graphs for Scalable Graph Neural Networks
par: Younesian, Taraneh, et autres
Publié: (2023)
par: Younesian, Taraneh, et autres
Publié: (2023)
Table Foundation Models: on knowledge pre-training for tabular learning
par: Kim, Myung Jun, et autres
Publié: (2025)
par: Kim, Myung Jun, et autres
Publié: (2025)
Replaying pre-training data improves fine-tuning
par: Kotha, Suhas, et autres
Publié: (2026)
par: Kotha, Suhas, et autres
Publié: (2026)
Why pre-training is beneficial for downstream classification tasks?
par: Jiang, Xin, et autres
Publié: (2024)
par: Jiang, Xin, et autres
Publié: (2024)
Embedding spatial context in urban traffic forecasting with contrastive pre-training
par: Low, Matthew, et autres
Publié: (2025)
par: Low, Matthew, et autres
Publié: (2025)
Negative binomial regression and inference using a pre-trained transformer
par: Svensson, Valentine
Publié: (2025)
par: Svensson, Valentine
Publié: (2025)
Extraction of linearized models from pre-trained networks via knowledge distillation
par: Kimura, Fumito, et autres
Publié: (2026)
par: Kimura, Fumito, et autres
Publié: (2026)
Brain-inspired continual pre-trained learner via silent synaptic consolidation
par: Ran, Xuming, et autres
Publié: (2024)
par: Ran, Xuming, et autres
Publié: (2024)
Rademacher learning rates for iterated random functions
par: Sandrić, Nikola
Publié: (2025)
par: Sandrić, Nikola
Publié: (2025)
Identifying Metric Structures of Deep Latent Variable Models
par: Syrota, Stas, et autres
Publié: (2025)
par: Syrota, Stas, et autres
Publié: (2025)
Fast constrained sampling in pre-trained diffusion models
par: Graikos, Alexandros, et autres
Publié: (2024)
par: Graikos, Alexandros, et autres
Publié: (2024)
eCP: Equivariant Conformal Prediction with pre-trained models
par: Bousias, Nikolaos, et autres
Publié: (2026)
par: Bousias, Nikolaos, et autres
Publié: (2026)
An empirical study of task and feature correlations in the reuse of pre-trained models
par: Mohamud, Jama Hussein, et autres
Publié: (2025)
par: Mohamud, Jama Hussein, et autres
Publié: (2025)
Convergence of variational Monte Carlo simulation and scale-invariant pre-training
par: Abrahamsen, Nilin, et autres
Publié: (2023)
par: Abrahamsen, Nilin, et autres
Publié: (2023)
Your decision path does matter in pre-training industrial recommenders with multi-source behaviors
par: Gan, Chunjing, et autres
Publié: (2024)
par: Gan, Chunjing, et autres
Publié: (2024)
Structured adaptive and random spinners for fast machine learning computations
par: Bojarski, Mariusz, et autres
Publié: (2016)
par: Bojarski, Mariusz, et autres
Publié: (2016)
DemoDiffusion: One-Shot Human Imitation using pre-trained Diffusion Policy
par: Park, Sungjae, et autres
Publié: (2025)
par: Park, Sungjae, et autres
Publié: (2025)
Towards training digitally-tied analog blocks via hybrid gradient computation
par: Nest, Timothy, et autres
Publié: (2024)
par: Nest, Timothy, et autres
Publié: (2024)
Paving the way for scientific foundation models: enhancing generalization and robustness in PDEs with constraint-aware pre-training
par: Totounferoush, Amin, et autres
Publié: (2025)
par: Totounferoush, Amin, et autres
Publié: (2025)
Continual Quantization-Aware Pre-Training: When to transition from 16-bit to 1.58-bit pre-training for BitNet language models?
par: Nielsen, Jacob, et autres
Publié: (2025)
par: Nielsen, Jacob, et autres
Publié: (2025)
Improving conversion rate prediction via self-supervised pre-training in online advertising
par: Shtoff, Alex, et autres
Publié: (2024)
par: Shtoff, Alex, et autres
Publié: (2024)
Improving fine-grained understanding in image-text pre-training
par: Bica, Ioana, et autres
Publié: (2024)
par: Bica, Ioana, et autres
Publié: (2024)
Machine-assisted writing evaluation: Exploring pre-trained language models in analyzing argumentative moves
par: Qin, Wenjuan, et autres
Publié: (2025)
par: Qin, Wenjuan, et autres
Publié: (2025)
Learning sum of diverse features: computational hardness and efficient gradient-based training for ridge combinations
par: Oko, Kazusato, et autres
Publié: (2024)
par: Oko, Kazusato, et autres
Publié: (2024)
Comprehensive language-image pre-training for 3D medical image understanding
par: Wald, Tassilo, et autres
Publié: (2025)
par: Wald, Tassilo, et autres
Publié: (2025)
Post-pre-training for Modality Alignment in Vision-Language Foundation Models
par: Yamaguchi, Shin'ya, et autres
Publié: (2025)
par: Yamaguchi, Shin'ya, et autres
Publié: (2025)
Documents similaires
-
Predicting integers from continuous parameters
par: Maat, Bas, et autres
Publié: (2026) -
LLM Probing with Contrastive Eigenproblems: Improving Understanding and Applicability of CCS
par: Schouten, Stefan F., et autres
Publié: (2025) -
Non-parametric Hypothesis Tests for Distributional Group Symmetry
par: Chiu, Kenny, et autres
Publié: (2023) -
Debiased Counterfactual Generation via Flow Matching from Observations
par: Dance, Hugh, et autres
Publié: (2026) -
Distinguishing Cause from Effect with Causal Velocity Models
par: Xi, Johnny, et autres
Publié: (2025)