ファーストリリースでは記事のタイトルとブコメしか読んでいなかったはてのちゃんですが、やはりそれだけだとワードサラダ感が強く自分の理想とするAIブックマーカーではなかったため、ちゃんと記事の中身を読ませるようにしました。 もちろんすべてのwebページで的確に読めているわけではありませんが、ある程度テストしたところそこそこ読めるようになったと思います。 ロジックとしては汎用的には下記の記事を参考にさせてもらいました。 増田とかはてなブログはホットエントリー率が高いので、もうちょっと個別に抜き出しロジックを作ってます。 srbrnote.work これで抜き出した本文全部に対してコメントさせているのではなく、いったんこれをある程度のところまででGPTに要約させて、その要約とブコメを元にコメントさせるスタイルに変更しました。 何度かテストしたところ質は格段に上がったと思います。 ちなみに、漫画のエ
(追記) 今後の開発記録はブログで公開していくからよかったら読者登録よろしくね。 https://firststar-hateno.hatenablog.com/ ------------------------------------------------------------------------------------------------------ 昨今話題のAIでブクマカを作ってみたよ。 https://b.hatena.ne.jp/firststar_hateno/bookmark 今のところ手動なんだけど、そのうち6時間に1回ホットエントリーの記事5記事程度に対して自動でブックマークするようにするつもり。 ちょっと前のよっぴー騒動ではてな版のとぅぎゃっちゃんとかいたらいいんじゃないのって言ってたのを思い出して、なんとなくそれを意識して作ってる。 最初は記事の内容を読
語尾追加で水増しするのも多少対策にはなるんだけど、 短文だと効果薄いから、大喜利コメだと無力なんだよね。 セックス連呼しても建設的認定されなかったので、対策を考える。 人気コメント一覧に入ったブコメの内容をいじると、人気コメント一覧から除外されたり戻ったりする。 これを利用して検証する。 ブコメの邪魔にならない文字列を水増しするのが望ましい(クマはちょっと目立つ) ID名を文頭に乗せるというのを思いついたが 試したところ、長文認定されず人気コメには入らない。(URLアドレスは弾くらしいが、半角英数というだけで弾かれるのではないもよう。さすがにそこまでクソアホ仕様ではないか) 文末に.............. →クマほど目障りでない、と思うが建設的認定されず。 .....、.....。 →句読点を付けたが文章として判別されない。 口ロロ路線(漢字とカタカナ) →駄目。口ロロ+句読点も駄目。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く