Reinforcement Learning as a fine-tuning paradigm

5608 shaares
134 private links

5608 shaares · 134 private links

Filters

Links per page

20 50 100

Reinforcement Learning as a fine-tuning paradigm

Reinforcement Learning (RL) should be better seen as a “fine-tuning” paradigm that can add capabilities to general-purpose pretrained models, rather than a paradigm that can bootstrap intelligence from scratch.

neural_networks · research · post

Thu Jan 13 04:37:43 2022 * · permalink

https://ankeshanand.com/blog/2022/01/08/rl-fine-tuning.html

Filters

Links per page

20 50 100