Gespeichert in:
| Hauptverfasser: | Zhang, Zhengxin, Zhao, Dan, Miao, Xupeng, Oliaro, Gabriele, Li, Qing, Jiang, Yong, Jia, Zhihao |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2401.07159 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Executing Arithmetic: Fine-Tuning Large Language Models as Turing Machines
von: Lai, Junyu, et al.
Veröffentlicht: (2024)
von: Lai, Junyu, et al.
Veröffentlicht: (2024)
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners
von: Gao, Yifei, et al.
Veröffentlicht: (2024)
von: Gao, Yifei, et al.
Veröffentlicht: (2024)
Frequency Matters: Fast Model-Agnostic Data Curation for Pruning and Quantization
von: Monaco, Francesco Pio, et al.
Veröffentlicht: (2026)
von: Monaco, Francesco Pio, et al.
Veröffentlicht: (2026)
QUAD: Quantization and Parameter-Efficient Tuning of LLM with Activation Decomposition
von: Hu, Yuxuan, et al.
Veröffentlicht: (2025)
von: Hu, Yuxuan, et al.
Veröffentlicht: (2025)
A Performance Evaluation of a Quantized Large Language Model on Various Smartphones
von: Çöplü, Tolga, et al.
Veröffentlicht: (2023)
von: Çöplü, Tolga, et al.
Veröffentlicht: (2023)
FED-FSTQ: Fisher-Guided Token Quantization for Communication-Efficient Federated Fine-Tuning of LLMs on Edge Devices
von: Li, Changyu, et al.
Veröffentlicht: (2026)
von: Li, Changyu, et al.
Veröffentlicht: (2026)
Automated Bug Triaging using Instruction-Tuned Large Language Models
von: Kiashemshaki, Kiana, et al.
Veröffentlicht: (2025)
von: Kiashemshaki, Kiana, et al.
Veröffentlicht: (2025)
RUQuant: Towards Refining Uniform Quantization for Large Language Models
von: Liu, Han, et al.
Veröffentlicht: (2026)
von: Liu, Han, et al.
Veröffentlicht: (2026)
BitCal-TTS: Bit-Calibrated Test-Time Scaling for Quantized Reasoning Models
von: Patarlapalli, Sai Babu, et al.
Veröffentlicht: (2026)
von: Patarlapalli, Sai Babu, et al.
Veröffentlicht: (2026)
Fine-Tuned Large Language Models for Logical Translation: Reducing Hallucinations with Lang2Logic
von: Pan, Muyu, et al.
Veröffentlicht: (2025)
von: Pan, Muyu, et al.
Veröffentlicht: (2025)
ConPET: Continual Parameter-Efficient Tuning for Large Language Models
von: Song, Chenyang, et al.
Veröffentlicht: (2023)
von: Song, Chenyang, et al.
Veröffentlicht: (2023)
Effective and Efficient Schema-aware Information Extraction Using On-Device Large Language Models
von: Wen, Zhihao, et al.
Veröffentlicht: (2025)
von: Wen, Zhihao, et al.
Veröffentlicht: (2025)
SEPTQ: A Simple and Effective Post-Training Quantization Paradigm for Large Language Models
von: Liu, Han, et al.
Veröffentlicht: (2026)
von: Liu, Han, et al.
Veröffentlicht: (2026)
FlexQuant: A Flexible and Efficient Dynamic Precision Switching Framework for LLM Quantization
von: Liu, Fangxin, et al.
Veröffentlicht: (2025)
von: Liu, Fangxin, et al.
Veröffentlicht: (2025)
Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels
von: Rath, Plawan Kumar, et al.
Veröffentlicht: (2026)
von: Rath, Plawan Kumar, et al.
Veröffentlicht: (2026)
Layer-Wise Quantization: A Pragmatic and Effective Method for Quantizing LLMs Beyond Integer Bit-Levels
von: Dumitru, Razvan-Gabriel, et al.
Veröffentlicht: (2024)
von: Dumitru, Razvan-Gabriel, et al.
Veröffentlicht: (2024)
A Multi-Encoder Frozen-Decoder Approach for Fine-Tuning Large Language Models
von: Dhole, Kaustubh D.
Veröffentlicht: (2025)
von: Dhole, Kaustubh D.
Veröffentlicht: (2025)
Preventing Safety Drift in Large Language Models via Coupled Weight and Activation Constraints
von: Peng, Songping, et al.
Veröffentlicht: (2026)
von: Peng, Songping, et al.
Veröffentlicht: (2026)
Multi-Turn Interactions for Text-to-SQL with Large Language Models
von: Xiong, Guanming, et al.
Veröffentlicht: (2024)
von: Xiong, Guanming, et al.
Veröffentlicht: (2024)
Text-Based Approaches to Item Difficulty Modeling in Large-Scale Assessments: A Systematic Review
von: Peters, Sydney, et al.
Veröffentlicht: (2025)
von: Peters, Sydney, et al.
Veröffentlicht: (2025)
Exploring Model Invariance with Discrete Search for Ultra-Low-Bit Quantization
von: Wen, Yuqiao, et al.
Veröffentlicht: (2025)
von: Wen, Yuqiao, et al.
Veröffentlicht: (2025)
Leveraging Large Language Models for Accurate Sign Language Translation in Low-Resource Scenarios
von: Bulla, Luana, et al.
Veröffentlicht: (2025)
von: Bulla, Luana, et al.
Veröffentlicht: (2025)
Large Language Model (LLM) Bias Index -- LLMBI
von: Oketunji, Abiodun Finbarrs, et al.
Veröffentlicht: (2023)
von: Oketunji, Abiodun Finbarrs, et al.
Veröffentlicht: (2023)
Raw Text is All you Need: Knowledge-intensive Multi-turn Instruction Tuning for Large Language Model
von: Hou, Xia, et al.
Veröffentlicht: (2024)
von: Hou, Xia, et al.
Veröffentlicht: (2024)
ELMTEX: Fine-Tuning Large Language Models for Structured Clinical Information Extraction. A Case Study on Clinical Reports
von: Guluzade, Aynur, et al.
Veröffentlicht: (2025)
von: Guluzade, Aynur, et al.
Veröffentlicht: (2025)
Pre-trained Language Model with Prompts for Temporal Knowledge Graph Completion
von: Xu, Wenjie, et al.
Veröffentlicht: (2023)
von: Xu, Wenjie, et al.
Veröffentlicht: (2023)
Robustness of Large Language Models to Perturbations in Text
von: Singh, Ayush, et al.
Veröffentlicht: (2024)
von: Singh, Ayush, et al.
Veröffentlicht: (2024)
Efficient Toxicity Detection in Gaming Chats: A Comparative Study of Embeddings, Fine-Tuned Transformers and LLMs
von: Tereshchenko, Yehor, et al.
Veröffentlicht: (2025)
von: Tereshchenko, Yehor, et al.
Veröffentlicht: (2025)
Unifying Uniform and Binary-coding Quantization for Accurate Compression of Large Language Models
von: Park, Seungcheol, et al.
Veröffentlicht: (2025)
von: Park, Seungcheol, et al.
Veröffentlicht: (2025)
On Semantic Loss Fine-Tuning Approach for Preventing Model Collapse in Causal Reasoning
von: Deshmukh, Pratik, et al.
Veröffentlicht: (2026)
von: Deshmukh, Pratik, et al.
Veröffentlicht: (2026)
Quantifying Self-Preservation Bias in Large Language Models
von: Migliarini, Matteo, et al.
Veröffentlicht: (2026)
von: Migliarini, Matteo, et al.
Veröffentlicht: (2026)
Adaptive Focus Memory for Language Models
von: Cruz, Christopher
Veröffentlicht: (2025)
von: Cruz, Christopher
Veröffentlicht: (2025)
Entropy-Based Measurement of Value Drift and Alignment Work in Large Language Models
von: Fadli, Samih
Veröffentlicht: (2025)
von: Fadli, Samih
Veröffentlicht: (2025)
Towards Alignment-Centric Paradigm: A Survey of Instruction Tuning in Large Language Models
von: Han, Xudong, et al.
Veröffentlicht: (2025)
von: Han, Xudong, et al.
Veröffentlicht: (2025)
Beyond Prefixes: Graph-as-Memory Cross-Attention for Knowledge Graph Completion with Large Language Models
von: Liu, Ruitong, et al.
Veröffentlicht: (2025)
von: Liu, Ruitong, et al.
Veröffentlicht: (2025)
Large Language Models as Oracles for Ontology Alignment
von: Lushnei, Sviatoslav, et al.
Veröffentlicht: (2025)
von: Lushnei, Sviatoslav, et al.
Veröffentlicht: (2025)
mEdIT: Multilingual Text Editing via Instruction Tuning
von: Raheja, Vipul, et al.
Veröffentlicht: (2024)
von: Raheja, Vipul, et al.
Veröffentlicht: (2024)
RAudit: A Blind Auditing Protocol for Large Language Model Reasoning
von: Chang, Edward Y., et al.
Veröffentlicht: (2026)
von: Chang, Edward Y., et al.
Veröffentlicht: (2026)
Unlocking the Wisdom of Large Language Models: An Introduction to The Path to Artificial General Intelligence
von: Chang, Edward Y.
Veröffentlicht: (2024)
von: Chang, Edward Y.
Veröffentlicht: (2024)
On the Effectiveness of LLM-Specific Fine-Tuning for Detecting AI-Generated Text
von: Gromadzki, Michał, et al.
Veröffentlicht: (2026)
von: Gromadzki, Michał, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
Executing Arithmetic: Fine-Tuning Large Language Models as Turing Machines
von: Lai, Junyu, et al.
Veröffentlicht: (2024) -
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners
von: Gao, Yifei, et al.
Veröffentlicht: (2024) -
Frequency Matters: Fast Model-Agnostic Data Curation for Pruning and Quantization
von: Monaco, Francesco Pio, et al.
Veröffentlicht: (2026) -
QUAD: Quantization and Parameter-Efficient Tuning of LLM with Activation Decomposition
von: Hu, Yuxuan, et al.
Veröffentlicht: (2025) -
A Performance Evaluation of a Quantized Large Language Model on Various Smartphones
von: Çöplü, Tolga, et al.
Veröffentlicht: (2023)