Gespeichert in:
| Hauptverfasser: | Bonino, Matteo, Ghione, Giorgia, Cirrincione, Giansalvo |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2502.12033 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Rank, Head-Channel Non-Identifiability, and Symmetry Breaking: A Precise Analysis of Representational Collapse in Transformers
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
On the Geometry of Positional Encodings in Transformers
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
DDCL: Deep Dual Competitive Learning: A Differentiable End-to-End Framework for Unsupervised Prototype-Based Representation Learning
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
DDCL-INCRT: A Self-Organising Transformer with Hierarchical Prototype Structure (Theoretical Foundations)
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
INCRT: An Incremental Transformer That Determines Its Own Architecture
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
Hierarchical Kernel Transformer: Multi-Scale Attention with an Information-Theoretic Approximation Analysis
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)
Learned Lyapunov Shielding for Adaptive Control
von: Cirrincione, Giansalvo, et al.
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo, et al.
Veröffentlicht: (2026)
Temporal Attention for Adaptive Control of Euler-Lagrange Systems with Unobservable Memory
von: Cirrincione, Giansalvo, et al.
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo, et al.
Veröffentlicht: (2026)
Collapse-Free Prototype Readout Layer for Transformer Encoders
von: Cirrincione, Giansalvo, et al.
Veröffentlicht: (2026)
von: Cirrincione, Giansalvo, et al.
Veröffentlicht: (2026)
Learning Complex Physical Regimes via Coverage-oriented Uncertainty Quantification: An application to the Critical Heat Flux
von: Cazzola, Michele, et al.
Veröffentlicht: (2026)
von: Cazzola, Michele, et al.
Veröffentlicht: (2026)
TimesBERT: A BERT-Style Foundation Model for Time Series Understanding
von: Zhang, Haoran, et al.
Veröffentlicht: (2025)
von: Zhang, Haoran, et al.
Veröffentlicht: (2025)
Task structure and nonlinearity jointly determine learned representational geometry
von: Alleman, Matteo, et al.
Veröffentlicht: (2024)
von: Alleman, Matteo, et al.
Veröffentlicht: (2024)
GoBERT: Gene Ontology Graph Informed BERT for Universal Gene Function Prediction
von: Miao, Yuwei, et al.
Veröffentlicht: (2025)
von: Miao, Yuwei, et al.
Veröffentlicht: (2025)
FlowBERT: Prompt-tuned BERT for variable flow field prediction
von: Zou, Weihao, et al.
Veröffentlicht: (2025)
von: Zou, Weihao, et al.
Veröffentlicht: (2025)
On Feasible Rewards in Multi-Agent Inverse Reinforcement Learning
von: Freihaut, Till, et al.
Veröffentlicht: (2024)
von: Freihaut, Till, et al.
Veröffentlicht: (2024)
BarcodeBERT: Transformers for Biodiversity Analysis
von: Arias, Pablo Millan, et al.
Veröffentlicht: (2023)
von: Arias, Pablo Millan, et al.
Veröffentlicht: (2023)
An investigation of structures responsible for gender bias in BERT and DistilBERT
von: Leteno, Thibaud, et al.
Veröffentlicht: (2024)
von: Leteno, Thibaud, et al.
Veröffentlicht: (2024)
MaxPoolBERT: Enhancing BERT Classification via Layer- and Token-Wise Aggregation
von: Behrendt, Maike, et al.
Veröffentlicht: (2025)
von: Behrendt, Maike, et al.
Veröffentlicht: (2025)
DE$^3$-BERT: Distance-Enhanced Early Exiting for BERT based on Prototypical Networks
von: He, Jianing, et al.
Veröffentlicht: (2024)
von: He, Jianing, et al.
Veröffentlicht: (2024)
Spam Detection Using BERT
von: Sahmoud, Thaer, et al.
Veröffentlicht: (2022)
von: Sahmoud, Thaer, et al.
Veröffentlicht: (2022)
MenakBERT -- Hebrew Diacriticizer
von: Cohen, Ido, et al.
Veröffentlicht: (2024)
von: Cohen, Ido, et al.
Veröffentlicht: (2024)
Empowering Interdisciplinary Research with BERT-Based Models: An Approach Through SciBERT-CNN with Topic Modeling
von: Likhareva, Darya, et al.
Veröffentlicht: (2024)
von: Likhareva, Darya, et al.
Veröffentlicht: (2024)
MelHuBERT: A simplified HuBERT on Mel spectrograms
von: Lin, Tzu-Quan, et al.
Veröffentlicht: (2022)
von: Lin, Tzu-Quan, et al.
Veröffentlicht: (2022)
MedicalBERT: enhancing biomedical natural language processing using pretrained BERT-based model
von: Reddy, K. Sahit, et al.
Veröffentlicht: (2025)
von: Reddy, K. Sahit, et al.
Veröffentlicht: (2025)
LegalPro-BERT: Classification of Legal Provisions by fine-tuning BERT Large Language Model
von: Tewari, Amit
Veröffentlicht: (2024)
von: Tewari, Amit
Veröffentlicht: (2024)
TREB: a BERT attempt for imputing tabular data imputation
von: Wang, Shuyue, et al.
Veröffentlicht: (2024)
von: Wang, Shuyue, et al.
Veröffentlicht: (2024)
Privacy-Preserving Inference for Quantized BERT Models
von: Lu, Tianpei, et al.
Veröffentlicht: (2025)
von: Lu, Tianpei, et al.
Veröffentlicht: (2025)
Energy and Carbon Considerations of Fine-Tuning BERT
von: Wang, Xiaorong, et al.
Veröffentlicht: (2023)
von: Wang, Xiaorong, et al.
Veröffentlicht: (2023)
BERT Learns (and Teaches) Chemistry
von: Payne, Josh, et al.
Veröffentlicht: (2020)
von: Payne, Josh, et al.
Veröffentlicht: (2020)
Enhancing TinyBERT for Financial Sentiment Analysis Using GPT-Augmented FinBERT Distillation
von: Thomas, Graison Jos
Veröffentlicht: (2024)
von: Thomas, Graison Jos
Veröffentlicht: (2024)
DiceHuBERT: Distilling HuBERT with a Self-Supervised Learning Objective
von: Chi, Hyung Gun, et al.
Veröffentlicht: (2025)
von: Chi, Hyung Gun, et al.
Veröffentlicht: (2025)
ColBERT: Using BERT Sentence Embedding in Parallel Neural Networks for Computational Humor
von: Annamoradnejad, Issa, et al.
Veröffentlicht: (2020)
von: Annamoradnejad, Issa, et al.
Veröffentlicht: (2020)
RoboBERT: An End-to-end Multimodal Robotic Manipulation Model
von: Wang, Sicheng, et al.
Veröffentlicht: (2025)
von: Wang, Sicheng, et al.
Veröffentlicht: (2025)
CSI-BERT2: A BERT-inspired Framework for Efficient CSI Prediction and Classification in Wireless Communication and Sensing
von: Zhao, Zijian, et al.
Veröffentlicht: (2024)
von: Zhao, Zijian, et al.
Veröffentlicht: (2024)
From BERT to Qwen: Hate Detection across architectures
von: Mon, Ariadna, et al.
Veröffentlicht: (2025)
von: Mon, Ariadna, et al.
Veröffentlicht: (2025)
A Contextualized BERT model for Knowledge Graph Completion
von: Gul, Haji, et al.
Veröffentlicht: (2024)
von: Gul, Haji, et al.
Veröffentlicht: (2024)
Weight-Inherited Distillation for Task-Agnostic BERT Compression
von: Wu, Taiqiang, et al.
Veröffentlicht: (2023)
von: Wu, Taiqiang, et al.
Veröffentlicht: (2023)
GottBERT: a pure German Language Model
von: Scheible, Raphael, et al.
Veröffentlicht: (2020)
von: Scheible, Raphael, et al.
Veröffentlicht: (2020)
MCUBERT: Memory-Efficient BERT Inference on Commodity Microcontrollers
von: Yang, Zebin, et al.
Veröffentlicht: (2024)
von: Yang, Zebin, et al.
Veröffentlicht: (2024)
Sarcasm Detection in Tweets with BERT and GloVe Embeddings
von: Khatri, Akshay, et al.
Veröffentlicht: (2020)
von: Khatri, Akshay, et al.
Veröffentlicht: (2020)
Ähnliche Einträge
-
Rank, Head-Channel Non-Identifiability, and Symmetry Breaking: A Precise Analysis of Representational Collapse in Transformers
von: Cirrincione, Giansalvo
Veröffentlicht: (2026) -
On the Geometry of Positional Encodings in Transformers
von: Cirrincione, Giansalvo
Veröffentlicht: (2026) -
DDCL: Deep Dual Competitive Learning: A Differentiable End-to-End Framework for Unsupervised Prototype-Based Representation Learning
von: Cirrincione, Giansalvo
Veröffentlicht: (2026) -
DDCL-INCRT: A Self-Organising Transformer with Hierarchical Prototype Structure (Theoretical Foundations)
von: Cirrincione, Giansalvo
Veröffentlicht: (2026) -
INCRT: An Incremental Transformer That Determines Its Own Architecture
von: Cirrincione, Giansalvo
Veröffentlicht: (2026)