日本語文書分類・固有表現抽出タスクに対するData Augmentationの性能検証 - 農園

テクノロジーカテゴリーの変更を依頼記事元:

kajyuuen.hatenablog.com

5 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

日本語文書分類・固有表現抽出タスクに対するData Augmentationの性能検証 - 農園

概要こんにちは@kajyuuenです。本記事では日本語データセットに対して、Data Augmentation（データ拡... 概要こんにちは@kajyuuenです。本記事では日本語データセットに対して、Data Augmentation（データ拡張）を行い、モデルの性能が向上するか検証します。今回は文書分類と固有表現抽出の2つのタスクに対して、実験を行いました。その結果、文書分類タスクでは学習に用いた文章数が500文, 2000文, 5000文のどの場合においても性能が向上し、Data Augmentationなしのモデルと比べて、最大2.5ポイントAccuracyが向上しました。固有表現抽出タスクでは50文, 150文, 500文に対してData Augmentationの効果を検証しました。文章数によっては性能が下がった場合もありましたが、Data Augmentationによって最も性能が向上したケースではF1が2.7ポイント向上しました。データ拡張に用いたライブラリdaajaやData Au

ブックマークしたユーザー

gengohouse2022/10/24
mysql82022/04/06
yuiseki2022/02/21
yag_ays2022/02/21

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx