:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Xie, Zhihui, Zhao, Handong, Yu, Tong, Li, Shuai
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computation and Language Machine Learning
Accesso online:	https://arxiv.org/abs/2401.05792
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Discovering Decoupled Functional Modules in Large Language Models
di: Yu, Yanke, et al.
Pubblicazione: (2026)

GLaPE: Gold Label-agnostic Prompt Evaluation and Optimization for Large Language Model
di: Zhang, Xuanchang, et al.
Pubblicazione: (2024)

Demystifying Language Model Forgetting with Low-rank Example Associations
di: Jin, Xisen, et al.
Pubblicazione: (2024)

Subspace Representations for Soft Set Operations and Sentence Similarities
di: Ishibashi, Yoichi, et al.
Pubblicazione: (2022)

KS-Lottery: Finding Certified Lottery Tickets for Multilingual Language Models
di: Yuan, Fei, et al.
Pubblicazione: (2024)

ReAGent: A Model-agnostic Feature Attribution Method for Generative Language Models
di: Zhao, Zhixue, et al.
Pubblicazione: (2024)

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models
di: Zhao, Siyan, et al.
Pubblicazione: (2026)

Characterizing the Accuracy -- Efficiency Trade-off of Low-rank Decomposition in Language Models
di: Moar, Chakshu, et al.
Pubblicazione: (2024)

Discovering Hierarchical Latent Capabilities of Language Models via Causal Representation Learning
di: Jin, Jikai, et al.
Pubblicazione: (2025)

Scaling Laws for Multilingual Language Models
di: He, Yifei, et al.
Pubblicazione: (2024)

Beyond Shared Vocabulary: Increasing Representational Word Similarities across Languages for Multilingual Machine Translation
di: Wu, Di, et al.
Pubblicazione: (2023)

MIC: Maximizing Informational Capacity in Adaptive Representations via Isotropic Subspace Alignment
di: Hong, Dang Nguyen, et al.
Pubblicazione: (2026)

tnGPS: Discovering Unknown Tensor Network Structure Search Algorithms via Large Language Models (LLMs)
di: Zeng, Junhua, et al.
Pubblicazione: (2024)

CoRA: Optimizing Low-Rank Adaptation with Common Subspace of Large Language Models
di: Xiao, Xiaojun, et al.
Pubblicazione: (2024)

Decomposing Representation Space into Interpretable Subspaces with Unsupervised Learning
di: Huang, Xinting, et al.
Pubblicazione: (2025)

Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models
di: Chua, Lynn, et al.
Pubblicazione: (2024)

Beyond Language: Format-Agnostic Reasoning Subspaces in Large Language Models
di: Yuan, Aojie, et al.
Pubblicazione: (2026)

TAGCOS: Task-agnostic Gradient Clustered Coreset Selection for Instruction Tuning Data
di: Zhang, Jipeng, et al.
Pubblicazione: (2024)

Adapting Multilingual LLMs to Low-Resource Languages using Continued Pre-training and Synthetic Corpus
di: Joshi, Raviraj, et al.
Pubblicazione: (2024)

Challenges in Adapting Multilingual LLMs to Low-Resource Languages using LoRA PEFT Tuning
di: Khade, Omkar, et al.
Pubblicazione: (2024)

Better To Ask in English? Evaluating Factual Accuracy of Multilingual LLMs in English and Low-Resource Languages
di: Rohera, Pritika, et al.
Pubblicazione: (2025)

Exploring Multilingual Probing in Large Language Models: A Cross-Language Analysis
di: Li, Daoyang, et al.
Pubblicazione: (2024)

Discovering Implicit Large Language Model Alignment Objectives
di: Chen, Edward, et al.
Pubblicazione: (2026)

Can Language Models Discover Scaling Laws?
di: Lin, Haowei, et al.
Pubblicazione: (2025)

Pretrained Multilingual Transformers Reveal Quantitative Distance Between Human Languages
di: Zhao, Yue, et al.
Pubblicazione: (2026)

Disentangling Language Roles in Multilingual LLM Task Execution
di: Zhan, Qishi, et al.
Pubblicazione: (2026)

SOMP: Scalable Gradient Inversion for Large Language Models via Subspace-Guided Orthogonal Matching Pursuit
di: Li, Yibo, et al.
Pubblicazione: (2026)

LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning
di: Guo, Han, et al.
Pubblicazione: (2023)

Low-rank Optimization Trajectories Modeling for LLM RLVR Acceleration
di: Chen, Zhipeng, et al.
Pubblicazione: (2026)

Scalable Bayesian Low-Rank Adaptation of Large Language Models via Stochastic Variational Subspace Inference
di: Samplawski, Colin, et al.
Pubblicazione: (2025)

Calibrating Reasoning in Language Models with Internal Consistency
di: Xie, Zhihui, et al.
Pubblicazione: (2024)

Discovering Forbidden Topics in Language Models
di: Rager, Can, et al.
Pubblicazione: (2025)

Jailbreaking as a Reward Misspecification Problem
di: Xie, Zhihui, et al.
Pubblicazione: (2024)

Learning Multiplex Representations on Text-Attributed Graphs with One Language Model Encoder
di: Jin, Bowen, et al.
Pubblicazione: (2023)

OrthAlign: Orthogonal Subspace Decomposition for Non-Interfering Multi-Objective Alignment
di: Lin, Liang, et al.
Pubblicazione: (2025)

Low-Dimensional Structure in the Space of Language Representations is Reflected in Brain Responses
di: Antonello, Richard, et al.
Pubblicazione: (2021)

Analytic Subspace Routing: How Recursive Least Squares Works in Continual Learning of Large Language Model
di: Tong, Kai, et al.
Pubblicazione: (2025)

Multilingual Needle in a Haystack: Investigating Long-Context Behavior of Multilingual Large Language Models
di: Hengle, Amey, et al.
Pubblicazione: (2024)

Investigating the Multilingual Calibration Effects of Language Model Instruction-Tuning
di: Huang, Jerry, et al.
Pubblicazione: (2026)

Factual Consistency of Multilingual Pretrained Language Models
di: Fierro, Constanza, et al.
Pubblicazione: (2022)