サクサク読めて、アプリ限定の機能も多数!
"Transformer (言語モデル) の性能はパラメータ数N・データセットサイズD・計算予算Cを変数としたシンプルなべき乗則 (Power Law)1 に従うというものです."
denqueue のブックマーク 2021/01/05 15:47
OpenAIが発見したScaling Lawの秘密 - ディープラーニングブログ"Transformer (言語モデル) の性能はパラメータ数N・データセットサイズD・計算予算Cを変数としたシンプルなべき乗則 (Power Law)1 に従うというものです."2021/01/05 15:47
"Transformer (言語モデル) の性能はパラメータ数N・データセットサイズD・計算予算Cを変数としたシンプルなべき乗則 (Power Law)1 に従うというものです."
このブックマークにはスターがありません。 最初のスターをつけてみよう!
deeplearning.hatenablog.com2021/01/05
OpenAIはGPT-3の次の研究を始めています. 世間がGPT-3のデモに湧き上がる中,OpenAIはScaling Lawに関する2本の論文をひっそりと公開しました. Scaling Lawを一言で説明するなら「Transformerの性能はたった3つ...
228 人がブックマーク・26 件のコメント
\ コメントが サクサク読める アプリです /
"Transformer (言語モデル) の性能はパラメータ数N・データセットサイズD・計算予算Cを変数としたシンプルなべき乗則 (Power Law)1 に従うというものです."
denqueue のブックマーク 2021/01/05 15:47
このブックマークにはスターがありません。
最初のスターをつけてみよう!
OpenAIが発見したScaling Lawの秘密 - ディープラーニングブログ
deeplearning.hatenablog.com2021/01/05
OpenAIはGPT-3の次の研究を始めています. 世間がGPT-3のデモに湧き上がる中,OpenAIはScaling Lawに関する2本の論文をひっそりと公開しました. Scaling Lawを一言で説明するなら「Transformerの性能はたった3つ...
228 人がブックマーク・26 件のコメント
\ コメントが サクサク読める アプリです /