Salvato in:
| Autori principali: | Xie, Zhihui, Zhao, Handong, Yu, Tong, Li, Shuai |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2401.05792 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Discovering Decoupled Functional Modules in Large Language Models
di: Yu, Yanke, et al.
Pubblicazione: (2026)
di: Yu, Yanke, et al.
Pubblicazione: (2026)
GLaPE: Gold Label-agnostic Prompt Evaluation and Optimization for Large Language Model
di: Zhang, Xuanchang, et al.
Pubblicazione: (2024)
di: Zhang, Xuanchang, et al.
Pubblicazione: (2024)
Demystifying Language Model Forgetting with Low-rank Example Associations
di: Jin, Xisen, et al.
Pubblicazione: (2024)
di: Jin, Xisen, et al.
Pubblicazione: (2024)
Subspace Representations for Soft Set Operations and Sentence Similarities
di: Ishibashi, Yoichi, et al.
Pubblicazione: (2022)
di: Ishibashi, Yoichi, et al.
Pubblicazione: (2022)
KS-Lottery: Finding Certified Lottery Tickets for Multilingual Language Models
di: Yuan, Fei, et al.
Pubblicazione: (2024)
di: Yuan, Fei, et al.
Pubblicazione: (2024)
ReAGent: A Model-agnostic Feature Attribution Method for Generative Language Models
di: Zhao, Zhixue, et al.
Pubblicazione: (2024)
di: Zhao, Zhixue, et al.
Pubblicazione: (2024)
Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models
di: Zhao, Siyan, et al.
Pubblicazione: (2026)
di: Zhao, Siyan, et al.
Pubblicazione: (2026)
Characterizing the Accuracy -- Efficiency Trade-off of Low-rank Decomposition in Language Models
di: Moar, Chakshu, et al.
Pubblicazione: (2024)
di: Moar, Chakshu, et al.
Pubblicazione: (2024)
Discovering Hierarchical Latent Capabilities of Language Models via Causal Representation Learning
di: Jin, Jikai, et al.
Pubblicazione: (2025)
di: Jin, Jikai, et al.
Pubblicazione: (2025)
Scaling Laws for Multilingual Language Models
di: He, Yifei, et al.
Pubblicazione: (2024)
di: He, Yifei, et al.
Pubblicazione: (2024)
Beyond Shared Vocabulary: Increasing Representational Word Similarities across Languages for Multilingual Machine Translation
di: Wu, Di, et al.
Pubblicazione: (2023)
di: Wu, Di, et al.
Pubblicazione: (2023)
MIC: Maximizing Informational Capacity in Adaptive Representations via Isotropic Subspace Alignment
di: Hong, Dang Nguyen, et al.
Pubblicazione: (2026)
di: Hong, Dang Nguyen, et al.
Pubblicazione: (2026)
tnGPS: Discovering Unknown Tensor Network Structure Search Algorithms via Large Language Models (LLMs)
di: Zeng, Junhua, et al.
Pubblicazione: (2024)
di: Zeng, Junhua, et al.
Pubblicazione: (2024)
CoRA: Optimizing Low-Rank Adaptation with Common Subspace of Large Language Models
di: Xiao, Xiaojun, et al.
Pubblicazione: (2024)
di: Xiao, Xiaojun, et al.
Pubblicazione: (2024)
Decomposing Representation Space into Interpretable Subspaces with Unsupervised Learning
di: Huang, Xinting, et al.
Pubblicazione: (2025)
di: Huang, Xinting, et al.
Pubblicazione: (2025)
Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models
di: Chua, Lynn, et al.
Pubblicazione: (2024)
di: Chua, Lynn, et al.
Pubblicazione: (2024)
Beyond Language: Format-Agnostic Reasoning Subspaces in Large Language Models
di: Yuan, Aojie, et al.
Pubblicazione: (2026)
di: Yuan, Aojie, et al.
Pubblicazione: (2026)
TAGCOS: Task-agnostic Gradient Clustered Coreset Selection for Instruction Tuning Data
di: Zhang, Jipeng, et al.
Pubblicazione: (2024)
di: Zhang, Jipeng, et al.
Pubblicazione: (2024)
Adapting Multilingual LLMs to Low-Resource Languages using Continued Pre-training and Synthetic Corpus
di: Joshi, Raviraj, et al.
Pubblicazione: (2024)
di: Joshi, Raviraj, et al.
Pubblicazione: (2024)
Challenges in Adapting Multilingual LLMs to Low-Resource Languages using LoRA PEFT Tuning
di: Khade, Omkar, et al.
Pubblicazione: (2024)
di: Khade, Omkar, et al.
Pubblicazione: (2024)
Better To Ask in English? Evaluating Factual Accuracy of Multilingual LLMs in English and Low-Resource Languages
di: Rohera, Pritika, et al.
Pubblicazione: (2025)
di: Rohera, Pritika, et al.
Pubblicazione: (2025)
Exploring Multilingual Probing in Large Language Models: A Cross-Language Analysis
di: Li, Daoyang, et al.
Pubblicazione: (2024)
di: Li, Daoyang, et al.
Pubblicazione: (2024)
Discovering Implicit Large Language Model Alignment Objectives
di: Chen, Edward, et al.
Pubblicazione: (2026)
di: Chen, Edward, et al.
Pubblicazione: (2026)
Can Language Models Discover Scaling Laws?
di: Lin, Haowei, et al.
Pubblicazione: (2025)
di: Lin, Haowei, et al.
Pubblicazione: (2025)
Pretrained Multilingual Transformers Reveal Quantitative Distance Between Human Languages
di: Zhao, Yue, et al.
Pubblicazione: (2026)
di: Zhao, Yue, et al.
Pubblicazione: (2026)
Disentangling Language Roles in Multilingual LLM Task Execution
di: Zhan, Qishi, et al.
Pubblicazione: (2026)
di: Zhan, Qishi, et al.
Pubblicazione: (2026)
SOMP: Scalable Gradient Inversion for Large Language Models via Subspace-Guided Orthogonal Matching Pursuit
di: Li, Yibo, et al.
Pubblicazione: (2026)
di: Li, Yibo, et al.
Pubblicazione: (2026)
LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning
di: Guo, Han, et al.
Pubblicazione: (2023)
di: Guo, Han, et al.
Pubblicazione: (2023)
Low-rank Optimization Trajectories Modeling for LLM RLVR Acceleration
di: Chen, Zhipeng, et al.
Pubblicazione: (2026)
di: Chen, Zhipeng, et al.
Pubblicazione: (2026)
Scalable Bayesian Low-Rank Adaptation of Large Language Models via Stochastic Variational Subspace Inference
di: Samplawski, Colin, et al.
Pubblicazione: (2025)
di: Samplawski, Colin, et al.
Pubblicazione: (2025)
Calibrating Reasoning in Language Models with Internal Consistency
di: Xie, Zhihui, et al.
Pubblicazione: (2024)
di: Xie, Zhihui, et al.
Pubblicazione: (2024)
Discovering Forbidden Topics in Language Models
di: Rager, Can, et al.
Pubblicazione: (2025)
di: Rager, Can, et al.
Pubblicazione: (2025)
Jailbreaking as a Reward Misspecification Problem
di: Xie, Zhihui, et al.
Pubblicazione: (2024)
di: Xie, Zhihui, et al.
Pubblicazione: (2024)
Learning Multiplex Representations on Text-Attributed Graphs with One Language Model Encoder
di: Jin, Bowen, et al.
Pubblicazione: (2023)
di: Jin, Bowen, et al.
Pubblicazione: (2023)
OrthAlign: Orthogonal Subspace Decomposition for Non-Interfering Multi-Objective Alignment
di: Lin, Liang, et al.
Pubblicazione: (2025)
di: Lin, Liang, et al.
Pubblicazione: (2025)
Low-Dimensional Structure in the Space of Language Representations is Reflected in Brain Responses
di: Antonello, Richard, et al.
Pubblicazione: (2021)
di: Antonello, Richard, et al.
Pubblicazione: (2021)
Analytic Subspace Routing: How Recursive Least Squares Works in Continual Learning of Large Language Model
di: Tong, Kai, et al.
Pubblicazione: (2025)
di: Tong, Kai, et al.
Pubblicazione: (2025)
Multilingual Needle in a Haystack: Investigating Long-Context Behavior of Multilingual Large Language Models
di: Hengle, Amey, et al.
Pubblicazione: (2024)
di: Hengle, Amey, et al.
Pubblicazione: (2024)
Investigating the Multilingual Calibration Effects of Language Model Instruction-Tuning
di: Huang, Jerry, et al.
Pubblicazione: (2026)
di: Huang, Jerry, et al.
Pubblicazione: (2026)
Factual Consistency of Multilingual Pretrained Language Models
di: Fierro, Constanza, et al.
Pubblicazione: (2022)
di: Fierro, Constanza, et al.
Pubblicazione: (2022)
Documenti analoghi
-
Discovering Decoupled Functional Modules in Large Language Models
di: Yu, Yanke, et al.
Pubblicazione: (2026) -
GLaPE: Gold Label-agnostic Prompt Evaluation and Optimization for Large Language Model
di: Zhang, Xuanchang, et al.
Pubblicazione: (2024) -
Demystifying Language Model Forgetting with Low-rank Example Associations
di: Jin, Xisen, et al.
Pubblicazione: (2024) -
Subspace Representations for Soft Set Operations and Sentence Similarities
di: Ishibashi, Yoichi, et al.
Pubblicazione: (2022) -
KS-Lottery: Finding Certified Lottery Tickets for Multilingual Language Models
di: Yuan, Fei, et al.
Pubblicazione: (2024)