Distilling knowledge from Neural Networks to build smaller and faster models

5401 shaares
131 private links

5401 shaares · 131 private links

Filters

Links per page

20 50 100

Distilling knowledge from Neural Networks to build smaller and faster models

This article discusses GPT-2 and BERT models, as well using knowledge distillation to create highly accurate models with fewer parameters than their teachers

AI · machine_learning · neural_networks · article

Fri Nov 15 19:20:21 2019 * · permalink

https://blog.floydhub.com/knowledge-distillation/

Filters

Links per page

20 50 100