DeepMindがarXiv上で発表した、深層強化学習のモデルを段階的な枝刈りすることでモデルサイズのスケーリングが可能になることを示した「In deep reinforcement learning, a pruned network is a good network」を読んだ際のメモ。 概要 深層強化学習はモデルサイズをスケーリングことは困難だった 段階的に枝刈りすることでスケーリングが可能であることを実証した 枝刈りすることでパフォーマンスも向上する 導入 深層強化学習では訓練中に多数のパラメータが休止状態になる 最近の研究でResNetバックボーンのDQNで段階的な枝刈りで元のパラメータの10%で50%パフォーマンスが向上ことが発見された この論文では、段階的な枝刈りによって、ネットワークのサイズに比例してパフォーマンスが向上することを示す 関連研究 深層強化学習でネットワークを