Salvato in:
| Autore principale: | Jeong, Hong |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2603.16413 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Trained Persistent Memory for Frozen Decoder-Only LLMs
di: Jeong, Hong
Pubblicazione: (2026)
di: Jeong, Hong
Pubblicazione: (2026)
Zero-Sacrifice Persistent-Robustness Adversarial Defense for Pre-Trained Encoders
di: Lei, Zhuxin, et al.
Pubblicazione: (2026)
di: Lei, Zhuxin, et al.
Pubblicazione: (2026)
Encoder-Decoder Diffusion Language Models for Efficient Training and Inference
di: Arriola, Marianne, et al.
Pubblicazione: (2025)
di: Arriola, Marianne, et al.
Pubblicazione: (2025)
Spatio-Temporal Forecasting of PM2.5 via Spatial-Diffusion guided Encoder-Decoder Architecture
di: Pandey, Malay, et al.
Pubblicazione: (2024)
di: Pandey, Malay, et al.
Pubblicazione: (2024)
Frozen Layers: Memory-efficient Many-fidelity Hyperparameter Optimization
di: Carstensen, Timur, et al.
Pubblicazione: (2025)
di: Carstensen, Timur, et al.
Pubblicazione: (2025)
Aligning Frozen LLMs by Reinforcement Learning: An Iterative Reweight-then-Optimize Approach
di: Zhang, Xinnan, et al.
Pubblicazione: (2025)
di: Zhang, Xinnan, et al.
Pubblicazione: (2025)
Knowledge Guided Encoder-Decoder Framework: Integrating Multiple Physical Models for Agricultural Ecosystem Modeling
di: Cheng, Qi, et al.
Pubblicazione: (2025)
di: Cheng, Qi, et al.
Pubblicazione: (2025)
Preference Goal Tuning: Post-Training as Latent Control for Frozen Policies
di: Zhao, Guangyu, et al.
Pubblicazione: (2024)
di: Zhao, Guangyu, et al.
Pubblicazione: (2024)
A Multi-Encoder Frozen-Decoder Approach for Fine-Tuning Large Language Models
di: Dhole, Kaustubh D.
Pubblicazione: (2025)
di: Dhole, Kaustubh D.
Pubblicazione: (2025)
Steering Frozen LLMs: Adaptive Social Alignment via Online Prompt Routing
di: Zhang, Zeyu, et al.
Pubblicazione: (2026)
di: Zhang, Zeyu, et al.
Pubblicazione: (2026)
EGA: Adapting Frozen Encoders for Vector Search with Bounded Out-of-Distribution Degradation
di: Zhao, Dongfang
Pubblicazione: (2026)
di: Zhao, Dongfang
Pubblicazione: (2026)
Frozen Transformers in Language Models Are Effective Visual Encoder Layers
di: Pang, Ziqi, et al.
Pubblicazione: (2023)
di: Pang, Ziqi, et al.
Pubblicazione: (2023)
TimePerceiver: An Encoder-Decoder Framework for Generalized Time-Series Forecasting
di: Lee, Jaebin, et al.
Pubblicazione: (2025)
di: Lee, Jaebin, et al.
Pubblicazione: (2025)
Latent Adversarial Training Improves Robustness to Persistent Harmful Behaviors in LLMs
di: Sheshadri, Abhay, et al.
Pubblicazione: (2024)
di: Sheshadri, Abhay, et al.
Pubblicazione: (2024)
Beyond Experience Retrieval: Learning to Generate Utility-Optimized Structured Experience for Frozen LLMs
di: Li, Xuancheng, et al.
Pubblicazione: (2026)
di: Li, Xuancheng, et al.
Pubblicazione: (2026)
Multi-View Encoders for Performance Prediction in LLM-Based Agentic Workflows
di: Trirat, Patara, et al.
Pubblicazione: (2025)
di: Trirat, Patara, et al.
Pubblicazione: (2025)
CFASL: Composite Factor-Aligned Symmetry Learning for Disentanglement in Variational AutoEncoder
di: Jung, Hee-Jun, et al.
Pubblicazione: (2024)
di: Jung, Hee-Jun, et al.
Pubblicazione: (2024)
StreamBP: Memory-Efficient Exact Backpropagation for Long Sequence Training of LLMs
di: Luo, Qijun, et al.
Pubblicazione: (2025)
di: Luo, Qijun, et al.
Pubblicazione: (2025)
Encoder vs Decoder: Comparative Analysis of Encoder and Decoder Language Models on Multilingual NLU Tasks
di: Nielsen, Dan Saattrup, et al.
Pubblicazione: (2024)
di: Nielsen, Dan Saattrup, et al.
Pubblicazione: (2024)
ReST-RL: Achieving Accurate Code Reasoning of LLMs with Optimized Self-Training and Decoding
di: Zhoubian, Sining, et al.
Pubblicazione: (2025)
di: Zhoubian, Sining, et al.
Pubblicazione: (2025)
Targeted Visualization of the Backbone of Encoder LLMs
di: Roberts, Isaac, et al.
Pubblicazione: (2024)
di: Roberts, Isaac, et al.
Pubblicazione: (2024)
GRASPED: Graph Anomaly Detection using Autoencoder with Spectral Encoder and Decoder (Full Version)
di: Choong, Wei Herng, et al.
Pubblicazione: (2025)
di: Choong, Wei Herng, et al.
Pubblicazione: (2025)
Skrr: Skip and Re-use Text Encoder Layers for Memory Efficient Text-to-Image Generation
di: Seo, Hoigi, et al.
Pubblicazione: (2025)
di: Seo, Hoigi, et al.
Pubblicazione: (2025)
TidalDecode: Fast and Accurate LLM Decoding with Position Persistent Sparse Attention
di: Yang, Lijie, et al.
Pubblicazione: (2024)
di: Yang, Lijie, et al.
Pubblicazione: (2024)
Geometrically Aligned Transfer Encoder for Inductive Transfer in Regression Tasks
di: Ko, Sung Moon, et al.
Pubblicazione: (2023)
di: Ko, Sung Moon, et al.
Pubblicazione: (2023)
SIEDD: Shared-Implicit Encoder with Discrete Decoders
di: Rangarajan, Vikram, et al.
Pubblicazione: (2025)
di: Rangarajan, Vikram, et al.
Pubblicazione: (2025)
IAA: Inner-Adaptor Architecture Empowers Frozen Large Language Model with Multimodal Capabilities
di: Wang, Bin, et al.
Pubblicazione: (2024)
di: Wang, Bin, et al.
Pubblicazione: (2024)
Universal Reasoner: A Single, Composable Plug-and-Play Reasoner for Frozen LLMs
di: Kim, Jaemin, et al.
Pubblicazione: (2025)
di: Kim, Jaemin, et al.
Pubblicazione: (2025)
Vision Transformers for Multi-Variable Climate Downscaling: Emulating Regional Climate Models with a Shared Encoder and Multi-Decoder Architecture
di: Merizzi, Fabio, et al.
Pubblicazione: (2025)
di: Merizzi, Fabio, et al.
Pubblicazione: (2025)
Emergence and Effectiveness of Task Vectors in In-Context Learning: An Encoder Decoder Perspective
di: Han, Seungwook, et al.
Pubblicazione: (2024)
di: Han, Seungwook, et al.
Pubblicazione: (2024)
A Large Encoder-Decoder Family of Foundation Models For Chemical Language
di: Soares, Eduardo, et al.
Pubblicazione: (2024)
di: Soares, Eduardo, et al.
Pubblicazione: (2024)
RAVEN: In-Context Learning with Retrieval-Augmented Encoder-Decoder Language Models
di: Huang, Jie, et al.
Pubblicazione: (2023)
di: Huang, Jie, et al.
Pubblicazione: (2023)
Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training
di: Hubinger, Evan, et al.
Pubblicazione: (2024)
di: Hubinger, Evan, et al.
Pubblicazione: (2024)
Multi-task Federated Learning with Encoder-Decoder Structure: Enabling Collaborative Learning Across Different Tasks
di: Zhou, Jingxuan, et al.
Pubblicazione: (2025)
di: Zhou, Jingxuan, et al.
Pubblicazione: (2025)
SplitFrozen: Split Learning with Device-side Model Frozen for Fine-Tuning LLM on Heterogeneous Resource-Constrained Devices
di: Ma, Jian, et al.
Pubblicazione: (2025)
di: Ma, Jian, et al.
Pubblicazione: (2025)
DMax: Aggressive Parallel Decoding for dLLMs
di: Chen, Zigeng, et al.
Pubblicazione: (2026)
di: Chen, Zigeng, et al.
Pubblicazione: (2026)
Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics
di: May, Victor, et al.
Pubblicazione: (2026)
di: May, Victor, et al.
Pubblicazione: (2026)
TURNA: A Turkish Encoder-Decoder Language Model for Enhanced Understanding and Generation
di: Uludoğan, Gökçe, et al.
Pubblicazione: (2024)
di: Uludoğan, Gökçe, et al.
Pubblicazione: (2024)
Beyond the Answer: Decoding the Behavior of LLMs as Scientific Reasoners
di: Pandey, Rohan, et al.
Pubblicazione: (2026)
di: Pandey, Rohan, et al.
Pubblicazione: (2026)
LLMem: Estimating GPU Memory Usage for Fine-Tuning Pre-Trained LLMs
di: Kim, Taeho, et al.
Pubblicazione: (2024)
di: Kim, Taeho, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Trained Persistent Memory for Frozen Decoder-Only LLMs
di: Jeong, Hong
Pubblicazione: (2026) -
Zero-Sacrifice Persistent-Robustness Adversarial Defense for Pre-Trained Encoders
di: Lei, Zhuxin, et al.
Pubblicazione: (2026) -
Encoder-Decoder Diffusion Language Models for Efficient Training and Inference
di: Arriola, Marianne, et al.
Pubblicazione: (2025) -
Spatio-Temporal Forecasting of PM2.5 via Spatial-Diffusion guided Encoder-Decoder Architecture
di: Pandey, Malay, et al.
Pubblicazione: (2024) -
Frozen Layers: Memory-efficient Many-fidelity Hyperparameter Optimization
di: Carstensen, Timur, et al.
Pubblicazione: (2025)