2016年12月5日、John SchulmanとPieter Abbeelは、当時のフロンティアとの深いRLに関する素晴らしいチュートリアルを@NeurIPSConfで開催しました。 約9年経った今でも、ほとんど変更を加えずに基礎モデルのRLを採用できています。 @johnschulman2 @pabbeel
4.63K