Salvato in:
| Autori principali: | Feng, Ling, Wu, Tianhao, Ren, Xiangrong, Jing, Zhi, Duan, Xuliang |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2023
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2311.13811 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
On student-teacher deviations in distillation: does it pay to disobey?
di: Nagarajan, Vaishnavh, et al.
Pubblicazione: (2023)
di: Nagarajan, Vaishnavh, et al.
Pubblicazione: (2023)
Towards a theory of model distillation
di: Boix-Adsera, Enric
Pubblicazione: (2024)
di: Boix-Adsera, Enric
Pubblicazione: (2024)
Brain-inspired Artificial Intelligence: A Comprehensive Review
di: Ren, Jing, et al.
Pubblicazione: (2024)
di: Ren, Jing, et al.
Pubblicazione: (2024)
DeepLogit: A sequentially constrained explainable deep learning modeling approach for transport policy analysis
di: Oon, Jeremy, et al.
Pubblicazione: (2025)
di: Oon, Jeremy, et al.
Pubblicazione: (2025)
Do as I can, not as I get
di: Zheng, Shangfei, et al.
Pubblicazione: (2023)
di: Zheng, Shangfei, et al.
Pubblicazione: (2023)
Multi-objective hybrid knowledge distillation for efficient deep learning in smart agriculture
di: Hoang, Phi-Hung, et al.
Pubblicazione: (2025)
di: Hoang, Phi-Hung, et al.
Pubblicazione: (2025)
Diverse Feature Learning by Self-distillation and Reset
di: Park, Sejik
Pubblicazione: (2024)
di: Park, Sejik
Pubblicazione: (2024)
Educational impacts of generative artificial intelligence on learning and performance of engineering students in China
di: Fan, Lei, et al.
Pubblicazione: (2025)
di: Fan, Lei, et al.
Pubblicazione: (2025)
Harmonizing Human Insights and AI Precision: Hand in Hand for Advancing Knowledge Graph Task
di: Wang, Shurong, et al.
Pubblicazione: (2024)
di: Wang, Shurong, et al.
Pubblicazione: (2024)
When LLMs get significantly worse: A statistical approach to detect model degradations
di: Kübler, Jonas, et al.
Pubblicazione: (2026)
di: Kübler, Jonas, et al.
Pubblicazione: (2026)
Evaluation of Multilingual Image Captioning: How far can we get with CLIP models?
di: Gomes, Gonçalo, et al.
Pubblicazione: (2025)
di: Gomes, Gonçalo, et al.
Pubblicazione: (2025)
Could ChatGPT get an Engineering Degree? Evaluating Higher Education Vulnerability to AI Assistants
di: Borges, Beatriz, et al.
Pubblicazione: (2024)
di: Borges, Beatriz, et al.
Pubblicazione: (2024)
The Instruction Gap: LLMs get lost in Following Instruction
di: Tripathi, Vishesh, et al.
Pubblicazione: (2025)
di: Tripathi, Vishesh, et al.
Pubblicazione: (2025)
IDLM: Inverse-distilled Diffusion Language Models
di: Li, David, et al.
Pubblicazione: (2026)
di: Li, David, et al.
Pubblicazione: (2026)
Correcting Autonomous Driving Object Detection Misclassifications with Automated Commonsense Reasoning
di: Kimbrell, Keegan, et al.
Pubblicazione: (2026)
di: Kimbrell, Keegan, et al.
Pubblicazione: (2026)
Advancements in Natural Language Processing: Exploring Transformer-Based Architectures for Text Understanding
di: Wu, Tianhao, et al.
Pubblicazione: (2025)
di: Wu, Tianhao, et al.
Pubblicazione: (2025)
Knowledge distillation through geometry-aware representational alignment
di: Bhattarai, Prajjwal, et al.
Pubblicazione: (2025)
di: Bhattarai, Prajjwal, et al.
Pubblicazione: (2025)
FengWu-W2S: A deep learning model for seamless weather-to-subseasonal forecast of global atmosphere
di: Ling, Fenghua, et al.
Pubblicazione: (2024)
di: Ling, Fenghua, et al.
Pubblicazione: (2024)
Knowledge-data fusion dominated vehicle platoon dynamics modeling and analysis: A physics-encoded deep learning approach
di: Lyu, Hao, et al.
Pubblicazione: (2025)
di: Lyu, Hao, et al.
Pubblicazione: (2025)
Toward effective protection against diffusion based mimicry through score distillation
di: Xue, Haotian, et al.
Pubblicazione: (2023)
di: Xue, Haotian, et al.
Pubblicazione: (2023)
A unified foundational framework for knowledge injection and evaluation of Large Language Models in Combustion Science
di: Yang, Zonglin, et al.
Pubblicazione: (2026)
di: Yang, Zonglin, et al.
Pubblicazione: (2026)
Lossless data compression by large models
di: Li, Ziguang, et al.
Pubblicazione: (2024)
di: Li, Ziguang, et al.
Pubblicazione: (2024)
Self-supervised network distillation: an effective approach to exploration in sparse reward environments
di: Pecháč, Matej, et al.
Pubblicazione: (2023)
di: Pecháč, Matej, et al.
Pubblicazione: (2023)
Multi-Aspect Controllable Text Generation with Disentangled Counterfactual Augmentation
di: Liu, Yi, et al.
Pubblicazione: (2024)
di: Liu, Yi, et al.
Pubblicazione: (2024)
RETAIL: Towards Real-world Travel Planning for Large Language Models
di: Deng, Bin, et al.
Pubblicazione: (2025)
di: Deng, Bin, et al.
Pubblicazione: (2025)
What you get is what you see: Decomposing Epistemic Planning using Functional STRIPS
di: Hu, Guang, et al.
Pubblicazione: (2019)
di: Hu, Guang, et al.
Pubblicazione: (2019)
Full-Stack Domain Enhancement for Combustion LLMs: Construction and Optimization
di: Xiao, Quanjia, et al.
Pubblicazione: (2026)
di: Xiao, Quanjia, et al.
Pubblicazione: (2026)
GraspGF: Learning Score-based Grasping Primitive for Human-assisting Dexterous Grasping
di: Wu, Tianhao, et al.
Pubblicazione: (2023)
di: Wu, Tianhao, et al.
Pubblicazione: (2023)
Model Science: getting serious about verification, explanation and control of AI systems
di: Biecek, Przemyslaw, et al.
Pubblicazione: (2025)
di: Biecek, Przemyslaw, et al.
Pubblicazione: (2025)
SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation
di: Termritthikun, Chakkrit, et al.
Pubblicazione: (2024)
di: Termritthikun, Chakkrit, et al.
Pubblicazione: (2024)
LACO: Adaptive Latent Communication for Collaborative Driving
di: Chen, Tianhao, et al.
Pubblicazione: (2026)
di: Chen, Tianhao, et al.
Pubblicazione: (2026)
Trust the uncertain teacher: distilling dark knowledge via calibrated uncertainty
di: Kim, Jeonghyun, et al.
Pubblicazione: (2026)
di: Kim, Jeonghyun, et al.
Pubblicazione: (2026)
ADMEDTAGGER: an annotation framework for distillation of expert knowledge for the Polish medical language
di: Górski, Franciszek, et al.
Pubblicazione: (2025)
di: Górski, Franciszek, et al.
Pubblicazione: (2025)
Quantum automated learning with provable and explainable trainability
di: Ye, Qi, et al.
Pubblicazione: (2025)
di: Ye, Qi, et al.
Pubblicazione: (2025)
Spotlighting Partially Visible Cinematic Language for Video-to-Audio Generation via Self-distillation
di: Huang, Feizhen, et al.
Pubblicazione: (2025)
di: Huang, Feizhen, et al.
Pubblicazione: (2025)
HALO: Half Life-Based Outdated Fact Filtering in Temporal Knowledge Graphs
di: Ding, Feng, et al.
Pubblicazione: (2025)
di: Ding, Feng, et al.
Pubblicazione: (2025)
CogEvo-Edu: Cognitive Evolution Educational Multi-Agent Collaborative System
di: Wu, Yefeng, et al.
Pubblicazione: (2025)
di: Wu, Yefeng, et al.
Pubblicazione: (2025)
Larger models yield better results? Streamlined severity classification of ADHD-related concerns using BERT-based knowledge distillation
di: Karim, Ahmed Akib Jawad, et al.
Pubblicazione: (2024)
di: Karim, Ahmed Akib Jawad, et al.
Pubblicazione: (2024)
SPARE: Self-distillation for PARameter-Efficient Removal
di: Mola, Natnael, et al.
Pubblicazione: (2026)
di: Mola, Natnael, et al.
Pubblicazione: (2026)
Ensemble BERT: A student social network text sentiment classification model based on ensemble learning and BERT architecture
di: Jiang, Kai, et al.
Pubblicazione: (2024)
di: Jiang, Kai, et al.
Pubblicazione: (2024)
Documenti analoghi
-
On student-teacher deviations in distillation: does it pay to disobey?
di: Nagarajan, Vaishnavh, et al.
Pubblicazione: (2023) -
Towards a theory of model distillation
di: Boix-Adsera, Enric
Pubblicazione: (2024) -
Brain-inspired Artificial Intelligence: A Comprehensive Review
di: Ren, Jing, et al.
Pubblicazione: (2024) -
DeepLogit: A sequentially constrained explainable deep learning modeling approach for transport policy analysis
di: Oon, Jeremy, et al.
Pubblicazione: (2025) -
Do as I can, not as I get
di: Zheng, Shangfei, et al.
Pubblicazione: (2023)