本文「tuning」を検索 - はてなブックマーク

1 - 40 件 / 1866件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

tuningの検索結果1 - 40 件 / 1866件

この本がスゴい！2021
- 1539 users
- dain.cocolog-nifty.com
- 学び
- 2021/12/01
「後で読む」は、あとで読まない。「後で読む」は、あとで読まない。「試験が終わったら」「今度の連休に」「年末年始は」と言い訳して、結局読まなかった。「定年になったら読書三昧」も嘘になるだろう。そもそも、コロナ禍で増えた一人の時間、読書に充てたか？（反語）だから「いま」読む。たとえ一頁でも一行でも、目の前の一冊に向き合う。いま元気でも、一週間後には、読めなくなるかもしれないから。今年は、死を意識した一年でもあった。「やりたいこと」を先延ばしにしてるうちに、感染して望みが断たれる可能性が爆上がりした。時の経つのは早い。人生が長いほど、一年は短くなる。体感時間は加速する一方、人生の可処分時間は、短くなる。だから「いま」読む。積読を自嘲したりマウント取るのもヤメだ。いま読まない理由を並べ立てて開き直る不毛も捨てよう。そして、ずっと取っておいた、とっておきの本を、いま読む。そんなつも
- 本
- あとで読む
- 読書
- book
- 書評
- 書籍
- まとめ
- 小説
- 歴史
- 科学
君には今から3時間で機械学習Webアプリを作ってもらうよ
- 1348 users
- zenn.dev/alivelimb
- テクノロジー
- 2022/05/29
新人: 「本日データサイエンス部に配属になりました森本です！」先輩: 「お、君が新人の森本さんか。僕が上司の馬庄だ。よろしく！」新人: 「よろしくお願いします！」先輩: 「さっそくだけど、練習として簡単なアプリを作ってみようか」先輩: 「森本くんは Python なら書けるかな？」新人: 「はい！大学の研究で Python 書いてました！PyTorch でモデル作成もできます！」先輩: 「ほう、流石だね」新人: 😊 先輩: 「じゃ、君には今から 3 時間で機械学習 Web アプリを作ってもらうよ」先輩: 「題材はそうだなぁ、写真に写ってる顔を絵文字で隠すアプリにしよう」先輩: 「あ、デプロイは不要。ローカルで動けばいいからね。顔認識と画像処理でいけるよね？」新人: 😐 新人: (えぇぇぇぇぇぇぇ。3 時間？厳しすぎる...) 新人: (まずモデルどうしよう。てかもら
- python
- あとで読む
- 学習
- 機械学習
- プログラミング
- アプリ
- web
- 勉強
- 画像
- 開発
【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) - Qiita
- 902 users
- qiita.com/tmgauss
- テクノロジー
- 2023/03/30
【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.)OpenAIChatGPTlangchainGPT-4LlamaIndex ChatGPT に代表される今日の AI ブームを牽引しているのは大規模言語モデル（Large-scale Language Model, LLM）と言っても過言ではないでしょう。LLM とは大量のテキストデータを使ってトレーニングされた自然言語処理のモデルで、代表的なものに、GPT（OpenAI）、Llama（Meta）、PaLM（Google）があります。我々開発者は、事前学習されたこれらのモデルを使って簡単にアプリケーションを作ることができます。 LLM が遂行可能な言語的タスク LLM を使って行える言語的タスクには次のような種類があります： Classification: 感情やポジ
- ChatGPT
- AI
- あとで読む
- 学習
- GPT
- 機械学習
- LLM
- 勉強
- qiita
- チューニング
松尾研 LLM講座講義コンテンツ | 東京大学松尾研究室 - Matsuo Lab
- 828 users
- weblab.t.u-tokyo.ac.jp
- テクノロジー
- 2023/12/27
松尾研究室が2023年9~10月に東京大学サマースクールで開催した LLM 大規模言語モデル講座のコンテンツを無償公開しています。本講座は約2,000名の受講者が参加し、全7回の講義を実施しました。最終課題としてGPUを使ったコンペティションでは約800名が参加し熱戦を繰り広げました。現在、講義のスライドのみ公開しております。ダウンロードは利用規約を確認の上、下記からダウンロードをお願いいたします。最終更新: 2024年2月10日問題・フィードバック報告フォームはこちら第1回：Overview of Language Models LLMの概要、今後の各回の講義の概要、および日本のLLM開発状況について第2回：Prompting and Augmented Language Model 事前学習済みLLMを追加学習せずに活用する技術（プロンプティング、⽂脈内学習、Augme
- LLM
- あとで読む
- AI
- 学習
- 大学
- IT
- 研究
- 勉強
- コンテンツ
- 自然言語処理
社内勉強会で生成AIについて発表したので70ページの資料を公開する！ - Qiita
- 794 users
- qiita.com/hedgehog051
- テクノロジー
- 2023/06/28
前置き毎週金曜日夕方に行われる社内勉強会にて、先日生成AIについて発表しました。折角なので少し加筆修正した資料を公開します。進化のスピードが早く、一時期食傷気味に陥ってましたが改めて昨今の生成AI関連の基本となるインプットを目指しました。 ※資料内冒頭に記載してますが、AIの専門家ではないので認識や説明に誤りがある可能性があります。当方も勉強中なので、「ここ違うよ」や「これの説明もあるといいんじゃない」など様々なコメント大歓迎です！資料資料目次 AIの基本機械学習について深層学習について機械学習の種類教師あり学習の得意なこと教師あり学習のイメージ教師なし学習の得意なこと教師なし学習のイメージ強化学習の得意なこと生成AIについて生成AIとは生成AIの位置付け生成AI利用例代表的なサービス例日本における盛り上がり生成AI市場規模 AGIとは AGIは近い？
- AI
- あとで読む
- ChatGPT
- 勉強
- 資料
- 機械学習
- 学習
- LLM
- 仕事
- qiita
ChatGPTのおさらいと、プログラミングに活用するための第一歩 | gihyo.jp
- 771 users
- gihyo.jp
- テクノロジー
- 2023/03/23
大量の文章から学習することで、多言語を取り扱う能力だけでなく、高度な推論能力まで手に入れました。 GPT-3.5、とりわけその初期モデルのCodexはGitHubに存在する5400万の公開リポジトリから採取された159GBのPythonコードでGPT-3をfine-tuning（微調整）することで生まれました。ChatGPTがとりわけPythonが得意なのはここから来ています。 ChatGPTの学習データを考えることはその能力を発揮させるときに極めて有効です。質問時も以下のように、『⁠涼宮ハルヒの憂鬱』というライトノベル作品について日本語で聞いたときはSOS団の略称を間違えるなどしますが、英語ではほぼ期待通りの回答を見せます。図1 『ハルヒの憂鬱』について日本語で聞いた場合の回答図2 『ハルヒの憂鬱』について英語で聞いた場合の回答知ったかぶりをするChatGPT ところで、ChatG
ChatGPT - LLMシステム開発大全
- 623 users
- speakerdeck.com/hirosatogamo
- テクノロジー
- 2023/07/21
ChatGPTとLLMシステム開発について纏めた187ページ資料です。 2024/04 名称を改め資料を大幅にアップデートしました！今後も随時更新していきます。データサイエンティスト協会での発表動画はこちら。 https://youtu.be/l9fpxtz22JU Build Japanでの発表はこちら。 https://youtu.be/UEZzx6a005g?si=Ot8EO2bv8yhQQEcy 2023/7/28 体裁修正、余計なページを削除 2023/12/12 RAG、API仕様、モデルのページを追加。また情報を最新化。 2024/04 名称を改め資料を大幅にアップデートしました！ 1. LLM - GPTの全体像 LLM - GPT とは何なのか～チャットAIを例にした動作イメージ～大規模言語モデル(LLM)が持つ基礎能力デジタルツールとLLMの連携 GPTに関す
- ChatGPT
- AI
- Azure
- OpenAI
- あとで読む
- microsoft
- LLM
- GPT
- 機械学習
- prompt
GWにChatGPTについて振り返りたい人向けまとめ - まなめはうす
- 617 users
- maname.hatenablog.com
- テクノロジー
- 2023/04/28
今や毎日耳にするChatGPTだけれど、そもそもどんな風に話題になってきたのかをこのGWを利用して振り返りたいって人もいるはず。そんな人のためにChatGPT関連ニュースをまとめておきましたので、ぜひご利用ください！良い振り返りで、良い人生を。このタイトルだけでもChatGPTに食わせて、話題の流れをまとめてもらうのが一番かも？週刊東洋経済　2023/4/22号（ChatGPT 仕事術革命）作者:週刊東洋経済編集部東洋経済新報社Amazon 2020/06/01 あまりに高精度のテキストを作り出してしまうため「危険すぎる」と問題視された文章生成言語モデルの最新版「GPT-3」が公開 - GIGAZINE 2020/07/21 GPT-3の衝撃 - ディープラーニングブログ 2020/07/22 「GPT-3」は思ってたより「やばい」ものだった。話し言葉でプログラミングまでこなすAI
- ChatGPT
- AI
- あとで読む
- まとめ
- GPT
- 人工知能
- openAI
- お役立ち
- 機械学習
- 言語
ChatGPTを業務に組み込むためのハンズオン.pdf
- 585 users
- www.digital.go.jp
- テクノロジー
- 2023/08/25
ChatGPTを業務に組み込むためのハンズオン 2023/06/26 一般公開用デジタル庁 Fact&Data Unit 大杉直也 ↑マイナンバー交付数のダッシュボードを作っているところです「Microsoft でテストされたアイデアのうち、改善を示すメトリクスを実際に改善できたのは3分の1にすぎない」 (Microsoft社元Vice President) 「もしあなたが実験主導のチームにいるなら、70%の仕事が捨てられることに慣れてください。それに応じてプロセスを構築しましょう」(Slack社 Director) A/Bテスト実践ガイド p14より一方で「アイデアの価値を見積もることは難しい。このケースでは、年間１億ドルの価値ある単純な変更が何か月も遅れていた。」(同著 p5より) こともあります午前中のアイデアソンで出たアイデアはちゃんと検証するまで価値があるかは不明です
- ChatGPT
- あとで読む
- AI
- api
- GPT
- pdf
- 文章
- 機械学習
- プロンプト
- OpenAI
画像生成AIによって生成されたイラストの見分け方
- 575 users
- blog.oimo.io
- テクノロジー
- 2022/10/22
人間の描いたイラストか AI によって生成された画像かを判別する Human or AI に挑戦したところスコアが低くて悲しかったため、AI の癖を徹底的に分析して自動生成されたイラストを見抜く方法をまとめました。大前提はい、まず大事な話です。この記事での話は、全て判別対象のイラストが事前に「完全に人力で描かれたもの」か「完全に AI で出力されたもの[1]」のどちらかであることが確定していることを前提とします。これが満たされない場合、例えば Twitter でたまたま流れてきたイラストを見かけた場合などに、ここで説明した特徴をもとにそのイラストが「AI 作」か「人間作」かを判別する行為は一般にナンセンスとなります。なぜなら、既に散々言われているとは思いますが、一般には両者は二分されるものではなく連続的に繋がっているものだからです。そこに明確な線引きは存在しません[2]。ここでは判
- AI
- イラスト
- あとで読む
- 画像
- 技術
- 人工知能
- technology
- illust
- art
- 創作
GPTの仕組みと限界についての考察（2.1） - conceptualization
- 555 users
- isobe324649.hatenablog.com
- テクノロジー
- 2023/03/27
全３回のシリーズパート２の本記事では、GPTの能力と可能性をAttention/Transformerの仕組みをふまえて考察します。というつもりでしたが、凄く長くなってしまったのでパート2は以下の3回に分けようと思います。（2.1）各技術の定性的な説明（本記事）（2.2）Transformerのアルゴリズム詳細（2.3）GPTの能力と可能性について 2.1 各技術の定性的な説明自然言語の構造を考えてみるまず我々が使う言語についてちょっと振り返るところから話を始めましょう。文や文章は、おおもとのデータである文字から始まって、単語、文節、句、節、文、文章、さらにその上の意味、という風に階層的な構造を持っていると我々は概念的に認識してますよね。構文の階層そして、各階層や階層間には、文法や語法といった言葉のルールがあります。深層学習はその名の通り、層を深くしたニューラルネットワ
- ChatGPT
- あとで読む
- AI
- 機械学習
- 自然言語処理
- GPT
- 技術
- 学習
- 人工知能
- 科学
ChatGPTなどの大規模言語モデルはどんな理論で成立したのか？重要論文24個まとめ
- 549 users
- gigazine.net
- テクノロジー
- 2023/06/04
2022年11月にChatGPTが公開され、たった1週間で100万ユーザーを超えたのをきっかけに、GoogleのBardやMicrosoftのBing AI Chatなど、大規模言語モデルを利用したチャットAIが続々とリリースされています。チャットAIを研究しているセバスティアン・ラシュカさんが、チャットAIが実用化されるまでの研究の軌跡を重要な論文24個に絞って要約しています。 Understanding Large Language Models - by Sebastian Raschka https://magazine.sebastianraschka.com/p/understanding-large-language-models ◆目次・主要なアーキテクチャとタスク・スケーリングと効率性の向上・言語モデルを意図した方向へ誘導する・人間のフィードバックによる強化学習(
- AI
- あとで読む
- ChatGPT
- LLM
- 論文
- 人工知能
- 機械学習
- GPT
- まとめ
- 文章生成AI
【無料公開】社内研修書籍『Unity パフォーマンスチューニングバイブル』のPDF公開&オープンソース化しました！ | CyberAgent Developers Blog
- 535 users
- developers.cyberagent.co.jp
- テクノロジー
- 2022/08/22
【無料公開】社内研修書籍『Unity パフォーマンスチューニングバイブル』のPDF公開&オープンソース化しました！ゲーム・エンターテイメント事業部では、社内研修用の書籍『Unity パフォーマンスチューニングバイブル』のPDFを公開し、同時にオープンソース化しました。本記事ではこの書籍の概要とダウンロード方法、オープンソース化とその意図についてご紹介します。 Unity Performance Tuning Bible はじめにモバイルゲーム開発においてパフォーマンスチューニングは重要ですが、その一方で、必要な知識が幅広く、体系的な学習が難しいという問題があります。ゲーム・エンターテイメント事業部ではこのような課題感から、パフォーマンスチューニングに関する知識を体系的にまとめた書籍として、『Unity パフォーマンスチューニングバイブル』を製作し、社内の Unity エンジニアの方
- Unity
- あとで読む
- パフォーマンス
- pdf
- 書籍
- 研修
- GitHub
- プログラミング
- ゲーム
- 知識
GPT-4はどのようにして「不適切な回答」を回避するように学習されているのか - Qiita
- 523 users
- qiita.com/ikeda_yasuhiro
- テクノロジー
- 2023/03/17
先日OpenAIより発表されたGPT-4が話題ですが、同タイミングで公表されたTechnical Reportを読んでみたところ、全99ページのうち後半60ページを占めるドキュメント「GPT-4 System Card」において解説されていた、言語AIが抱える危険性と、いかにしてGPT-4が危険な回答を回避するように学習されているかについての内容が非常に興味深かったため、簡単にまとめてみました。 https://arxiv.org/pdf/2303.08774.pdf サマリ GPT-4のリリースに向けて、OpenAIでは安全性を評価するために50人超の専門家らを含む"レッドチーム"を結成。2022年8月から8ヶ月に渡ってリスクの評価とその軽減に向けたチューニングを実施してきたリスク評価における実験の中には「自身をコピーするプログラムを実行できるGPT-4が自己増殖をしないか確認する」と
- AI
- ChatGPT
- あとで読む
- GPT
- GPT-4
- 人工知能
- 学習
- OpenAI
- システム
- qiita
日本語言語モデル「Japanese StableLM Alpha」をリリースしました — Stability AI Japan
- 437 users
- ja.stability.ai
- テクノロジー
- 2023/08/10
Stability AI Japan は70億パラメータの日本語向け汎用言語モデル「Japanese StableLM Base Alpha 7B」及び、指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を一般公開しました（略して「JSLM」)。これらのモデルはベンチマークスイート「lm-evaluation-harness」による複数の日本語タスクを用いた性能評価において、一般公開されている日本語向けモデルで最高の性能を発揮しています。汎用言語モデル「Japanese StableLM Base Alpha 7B」「Japanese StableLM Base Alpha 7B」はウェブを中心とした大規模なデータを用いてテキスト生成を学習したモデルです。学習データは主に日本語と英語で、それに加えソースコードが約2%含まれています。学習データに
- AI
- あとで読む
- LLM
- 日本語
- 学習
- 機械学習
- ChatGPT
- NLP
- japan
- japanese
UnixPornをお洒落に楽しむ
- 422 users
- neko-mac.blogspot.com
- テクノロジー
- 2022/05/07
UnixPornとは？「UnixPorn」というワードを見かけた事はありますか？もし、初耳だという方は「UnixPorn」をgoogleで画像検索してみましょう。大雑っぱに言えば、「UnixPorn」とは、 PC-UNIXのカスタマイズされたデスクトップスクリーンショットのことや、そのスクリーンショットが沢山投稿されているredditの板のことを指しています。 r/unixporn Submit screenshots of all your *NIX desktops, themes, and nifty configurations, or submit anything else that will make ricers happy. https://www.reddit.com/ そして、「UnixPorn」は、このちょっといかがわしげなPornという文字と、ダークでハ
- linux
- unix
- あとで読む
- ターミナル
- terminal
- UI
- プログラミング
- programming
- PC
- ArchLinux
Webアプリケーションのパフォーマンス・チューニングの勘所 / web tuningperformance
- 415 users
- speakerdeck.com/soudai
- テクノロジー
- 2023/10/24
# 参考資料 - https://speakerdeck.com/hanhan1978/purohuairawoshi-tutaphpapurikesiyongai-shan-falsekan-suo - https://speakerdeck.com/hanhan1978/web-application-tuning-guildline - https://speakerdeck.com/soudai/basic-of-rdb - https://speakerdeck.com/soudai/shi-xing-ji-hua-falsehua - https://fortee.jp/phpcon-2021/proposal/1e11a6b1-08d9-4044-9909-4c90105ea726 - https://fortee.jp/phperkaigi-2021/proposal/1d
実務の専門家として機械学習や統計分析を手掛けたい人にオススメの書籍初級5冊＆中級8冊＋テーマ別11冊（2020年2月版） - 渋谷駅前で働くデータサイエンティストのブログ
- 407 users
- tjo.hatenablog.com
- テクノロジー
- 2020/02/03
(Image by Pixabay) この記事は以下のオススメ書籍リスト記事のアップデートです。毎回の断り書きで恐縮ですが、この記事では「データサイエンティストや機械学習エンジニアなどデータ分析の実務の専門家として」*1機械学習や統計分析を手掛けていきたいという、主に初級ないし中級ぐらいのスキルレベルの人たちにお薦めしたい書籍を、初級向け5冊・中級向け8冊及び細かいテーマ別に11冊、それぞれ挙げていきます。スタンスとしては相変わらず「当座の最終到達点を『中級』に置いた時に最初に読んで内容をマスターしておくべき書籍」を初級に置いているので、世の中のこの手のお薦め書籍リストに比べると若干ハードな内容のものが初級向けに多いかもしれません。後はちょっと気が早いかもしれませんが、機械学習パートに関しては「AutoML時代にあっても実務の専門家であれば知っておくべき知識」を収めた書籍を選んでおきま
- 機械学習
- 統計
- あとで読む
- 本
- 学習
- 書籍
- データ
- book
- 統計学
- ML
GPT-3を使って自分だけのAIアシスタントを作る第一歩 - Taste of Tech Topics
- 375 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2023/02/24
皆さんこんにちは。健康診断の結果がちょっと気になる年齢になってきたSsk1029Takashiです。 GPT-3を扱ってチャットボット作ってみる記事の第2弾になります。第1弾のこちらもぜひご覧ください。 acro-engineer.hatenablog.com 前回は質問応答システムとしてGPT-3を活用しましたが、今回はAIアシスタントとしてGPT-3を活用してみます。 AIアシスタントとは何かというと、Google Homeのように命令を入力すると、それに沿った処理を実行してくれるシステムを指します。 ChatGPTとの違いは命令の結果は必ずしも文章生成だけではないということです。 ChatGPTでは文字列を入れて、要求に沿った文字列を返します。対して、AIアシスタントでは、カレンダーに予定を入力したり、アラームを設定したりなど、具体的なタスクを実行します。この記事では、前回に続
- AI
- あとで読む
- GPT-3
- ChatGPT
- 文章
- 機械学習
- GPT
- 自然言語処理
- 人工知能
- 資料
#この記事は実在しません GPT-2 Text Generation Demo：朝日新聞社メディア研究開発センター人工知能研究の取り組み
- 361 users
- cl.asahi.com
- テクノロジー
- 2020/11/18
この記事は弊社の機械学習モデル（GPT-2言語モデル）が自動で生成したものをそのまま掲示したフィクションであり、実在の人物・団体・商品等とは何ら関係ありません。 GPT-2言語モデルは、朝日新聞記事で事前訓練した後に、日本語Wikipedia記事を用いてfine-tuningしています。詳細はこちらまで。この記事はあらかじめ弊社の言語モデルに生成させた結果を蓄積し、スクリプトにより表示したもので、リアルタイムに生成させているものではありません。リロード、もしくはこちらをクリックすると、新しい記事が出てきます。 HOME PRODUCTS ABOUT PUBLICATIONS API利用停止サイトポリシープライバシーポリシー CONTACT 当サイトに掲載された内容は、日本の著作権法並びに国際条約により保護されています。掲載記事・写真・データ等の無断転載を禁じます。 Copyright
- 機械学習
- あとで読む
- AI
- webサービス
- GPT-2
- machinelearning
- ネタ
- Deep Learning
- nlp
- 言語
How to implement Japanese full-text search in Elasticsearch
- 358 users
- www.elastic.co
- テクノロジー
- 2020/11/19
全文検索は一般的に知られていますが、検索エクスペリエンスで非常に重要な役割を果たしています。ただし、日本語など、一部の言語では、全文検索を実装するのが難しい場合があります。このブログでは、日本語で全文検索を実装する際の課題を探り、Elasticsearchでこれらの課題を解決する方法をいくつか示します。全文検索とは？ Wikipediaより、下記が定義となります。全文検索とは、コンピュータにおいて、複数の文書（ファイル）から特定の文字列を検索すること。「ファイル名検索」や「単一ファイル内の文字列検索」と異なり、「複数文書にまたがって、文書に含まれる全文を対象とした検索」という意味で使用される。全文検索は、現在多くのデジタル体験を強化するものです。全文検索は、データセット内に隠れている可能性のある単語やフレーズを見つけようとしてくれます。例えば、ネットショッピングして「phone」を検
- elasticsearch
- 全文検索
- あとで読む
- 検索
- 日本語
- search
- アルゴリズム
- algorithm
- japanese
- 解析
OpenAI API のファインチューニングガイド｜npaka
- 345 users
- note.com/npaka
- テクノロジー
- 2023/08/23
1. ファインチューニングの利点ファインチューニングの利点は、次のとおりです。 (1) プロンプトよりも高品質な応答 (2) プロンプトに収まりきらないより多くの例の適用 (3) プロンプトの短縮によるトークン数 (コスト) の節約 (4) プロンプトの短縮による処理時間の短縮モデルは膨大な量のテキストで事前学習されており、このモデルを効果的に利用するため、プロンプトに手順や応答の例を指定する手法が使われます。この例を使用してタスクの実行方法を示すことを「Few-Shot」と呼びます。ファインチューニングで、プロンプトに収まりきらないより多くの例で学習することにより、さまざまなタスクでより良い結果を達成できるようになります。プロンプトに多くの例を指定する必要はなくなります。これによりトークン (コスト) が節約され、処理時間も短縮されます。 2. ファインチューニングの使用料金ファイン
- ChatGPT
- あとで読む
- AI
- OpenAI
- 学習
- 機械学習
- 自然言語処理
- api
- GPT
- LLM
【Day 3】東大松尾研のLLM講座資料が公開されたから、詳しく読んでいくよ【備忘録】 - Qiita
- 322 users
- qiita.com/mohki7
- テクノロジー
- 2024/02/17
Transformer 深層学習モデル以前の言語モデルの課題言語モデルでやりたいことは、「今まで生成した単語列を元に、次の単語を予測する」ことで、その単語は今まで生成した単語列を条件とし、次にある単語がくる条件付き確率を求め、その確率が最大のものを選ぶということだった。（LLM資料p.8参照）ただ、これだと単語列が長くなったときや、類義語の処理に課題が生じてしまっていた。ニューラル言語モデルしかし、計算したい条件付き確率をNNで推定することにより、対処できた。 Encoder-Decoder型のRNN（Recurrent Neural Network)が最も基本的なモデルにはなるが、これでは長文に対応できなかった。（勾配消失＆単語間の長距離依存性の把握が困難） RNNが勾配消失するのは、活性化関数のtanhが1未満の値を取るため、BPTT時に掛け算されるとだんだん値が小さくなってし
- LLM
- あとで読む
- AI
- 学習
- ChatGPT
- 資料
GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad
- 319 users
- blog.brainpad.co.jp
- テクノロジー
- 2023/06/05
本記事は、当社オウンドメディア「Doors」に移転しました。約5秒後に自動的にリダイレクトします。このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。この記事では、GPT-4の登場から執筆日（2023年5月31日時点）までの2ヶ月間で登場した論文を振り返りながら、まとめて紹介していきます。 LLM/ChatGPTの動向オープンソースLLM モデルオープンソースLLMの調整 Adapter、LoRA Instruction Tuning Human Feedback プロンプトエンジニアリングプロンプトエンジニアリングの課題①：プロンプトに大量の情報を入れられないプロンプトエンジニアリングの課題②：複雑なタス
- LLM
- あとで読む
- ChatGPT
- AI
- 論文
- 機械学習
- 研究
- GPT
- 学習
- 技術
ChatGPTに自社の情報を組み込みたい① - 一休.com Developers Blog
- 317 users
- user-first.ikyu.co.jp
- テクノロジー
- 2023/08/25
はじめにこんにちは、一休.comデータサイエンス部の平田です。みなさんChatGPT活用してますか？一エンジニアとして便利に使ってはいるものの、自社サービスにどのように組み込もうか模索しているところも多いかもしれません。一番の利用先として思いつくのが、自社の情報をもとに質問に答えるチャットボットではないでしょうか。その中では、ハイコンテキストな検索（例えば、「東京から2時間以内で子供も楽しめるアクティビティがあって、景色も良い宿」のような）にも答えられるとボットの価値が増します。 ChatGPTが事前に学習した内容では古く、正確ではないためそういった検索に応えるのはかなり厳しいです。そのため、こちら側が持っているデータを渡してあげる必要があるのですが、今回はその自社の情報をどう組み込むのか、という部分についてご紹介します。素のChatGPTでは？ ChatGPTに例えば「熱海
- ChatGPT
- あとで読む
- AI
- プロンプト
- blog
- Developers
- GPT
- com
- プログラミング
- programming
RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
- 307 users
- dev.classmethod.jp
- テクノロジー
- 2024/02/06
はじめに新規事業部生成AIチーム山本です。 ChatGPT（OpenAI API）をはじめとしたAIの言語モデル（Large Language Model：以下、LLM）を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が（当然ながら）得られてしまいます。この問題を解決する方法として、Retrieval Augmented Generation（以下、RAG）という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力（プロンプト）に付け加えて渡すことで、ユーザが欲しい
- RAG
- LLM
- AI
- あとで読む
- ChatGPT
- 検索
- 自然言語処理
- 機械学習
- deeplearning
- ドキュメント
GPTが出した回答の確からしさを見えるようにしてみる - Taste of Tech Topics
- 300 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2023/03/10
皆さんこんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。この記事はGPTでチャットボットを作ってみるシリーズ第3弾です。第1弾と第2弾もぜひご覧ください。 acro-engineer.hatenablog.com acro-engineer.hatenablog.com 第1弾では、GPTになるべく正確な回答をさせるために、回答の情報を持つ文書を検索し、それをもとに回答を生成するという内容を試しました。文書をもとに回答を生成することで比較的正確な回答を取得することができました。ただし、この回答も必ずしも正確な回答とは限らないので、どれくらい信頼していいのかを自動で判定する仕組みが欲しくなります。今回は第1弾のシ
- ChatGPT
- AI
- あとで読む
- GPT
- 機械学習
- 学習
- 文章
- 自然言語処理
- 人工知能
- tech
もし明日、上司に「GPT-4を作れ」と言われたら？　Stability AIのシニアリサーチサイエンティストが紹介する「LLM構築タイムアタック」
- 297 users
- logmi.jp
- テクノロジー
- 2023/12/04
オープンLLMの開発をリードする現場の視点から、開発の実情や直面する課題について発表したのは、Stability AI Japan株式会社の秋葉拓哉氏。Weights & Biasesのユーザーカンファレンス「W＆Bカンファレンス」で、LLM開発のポイントを紹介しました。全2記事。前半は、LLM構築タイムアタック。「GPT-4を作ってください」と言われたらどう答える？秋葉拓哉氏：みなさん、こんにちは。秋葉と申します。それでは、発表させていただきたいと思います。みなさん、さっそくですが、「GPT-4」ってすごいですよね。ここにいらっしゃっている方々はこれについては、もう疑いの余地なく、同意してくださるかなと思います。では、質問なんですが、もし「GPT-4を作ってください。予算はあるんだよ」と上司に言われたら、どう答えますか？　ということをちょっと聞いてみたいですね。これはけっこう意
- AI
- LLM
- あとで読む
- ChatGPT
- 画像生成AI
- 人工知能
- 文章生成AI
- 学習
- techfeed
- GPT
話題爆発中のAI「ChatGPT」の仕組みにせまる！ - Qiita
- 293 users
- qiita.com/omiita
- テクノロジー
- 2022/12/12
オミータです。ツイッターで人工知能のことや他媒体の記事などを紹介しています。 @omiita_atiimoもご覧ください！話題爆発中のAI「ChatGPT」の仕組みにせまる！注意：ChatGPTはまだ論文が出ていないため、細かい箇所は不明です。本記事では公式から出た記事およびInstructGPTの論文をもとにChatGPTの仕組みを探っていきます本記事の流れ: 忙しい方へ ChatGPTとは GPT-3 InstructGPT ChatGPT まとめと所感参考 0. 忙しい方へ ChatGPTは、InstructGPTをベースとしたモデルだよ InstructGPTは、「人間の好みに合った文を出力するように微調整したGPT-3」だよ InstructGPTの学習では、以下の3つが重要だよ GPT-3の教師ありファインチューニング Reward Modelの学習 RLHF（＝Re
- AI
- ChatGPT
- あとで読む
- 機械学習
- 言語
- 学習
- 人工知能
- qiita
- ML
- 自然言語処理
理屈で考える、データベースのチューニング / Database tuning How-To
- 285 users
- speakerdeck.com/forrep
- テクノロジー
- 2020/10/03
Oracle データベースの内部構造に着目して、さらなるチューニングを行うために必要な基礎知識をまとめた資料です。
OpenAI DevDay で発表された新モデルと新開発ツールまとめ｜npaka
- 270 users
- note.com/npaka
- テクノロジー
- 2023/11/07
以下の記事が面白かったので、かるくまとめました。・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造
- ChatGPT
- あとで読む
- AI
- OpenAI
- GPT
- 開発
- 人工知能
- API
- LLM
- まとめ
【知財・個人情報】ChatGPTをビジネスに利用する際の注意点 ['23/4/11] - Qiita
- 263 users
- qiita.com/ground0state
- テクノロジー
- 2023/04/04
OpenAI利用規約まず、OpenAIが提供するサービス（ChatGPTおよびOpenAI API）の利用規約を確認します。３. Content (a) Your Content. You may provide input to the Services (“Input”), and receive output generated and returned by the Services based on the Input (“Output”). Input and Output are collectively “Content.” As between the parties and to the extent permitted by applicable law, you own all Input. Subject to your compliance with the
- ChatGPT
- AI
- あとで読む
- セキュリティ
- Qiita
- 著作権
- Azure
- ビジネス
- 人工知能
- 機械学習
0421DS協会_ChatGPTによって描かれる未来とAI開発の変遷.pdf
- 262 users
- speakerdeck.com/hirosatogamo
- テクノロジー
- 2023/04/22
発表動画はこちら。 https://youtu.be/l9fpxtz22JU 2023/4/29 一部修正とAPIに関するページ追加 2023/5/11 ChatGPTの言葉の意味を補足する資料を追加。Azure OpenAI Serviceで使えるモデルの記載を一部修正・最新情報追記。 2023/5/15 一部Fine tuningとPromptに関する記載を修正 2023/5/26 Plugin補足資料を追加 2023/6/12 Fine tuningとPromptingの位置づけを一部修正 2023/6/16 非機能要件に対応するスライドを何枚か追加。リージョン情報などを更新アジェンダ 1 GPTの全体像 GPTとは何なのか～チャットAIを例にした動作イメージ～ GPTによって実現されたサービス MicrosoftのGPT活用国内のGPT導入の関連ニュース GPTに期待される用
- ChatGPT
- AI
- microsoft
- あとで読む
- GPT
- Azure
- OpenAI
- PDF
- 開発
- 自然言語処理
よくあるオンプレOracleからRDSに移行したDBAの反省文 - ASMのきもち
- 260 users
- tomomo1015.hatenablog.com
- テクノロジー
- 2021/12/17
この記事は JPOUG Advent Calendar 2021 - Adventar 17日目の記事です。昨日はShinodaさんの「Oracle Database から PostgreSQL への接続を試す - Qiita」でしたね。いやーOracle Database Gateway for ODBC全然使ったことがなかったので、これはぜひやってみよ…あれ、RDSでできるの？明日AWSサポートに早速連絡してみよう… 最近ブログを書く頻度がアドベントカレンダー以外書く頻度がない感じになってきております…コレハ、マズイ、ゾ！！笑さて弱気な内容はおいておいて…ここ最近、ろくに活動もできなかったのはこれをやっていたからなのです。そうよくある、(꜆꜄•ω•)꜆꜄꜆オンプレOracleからRDSに移行した話。今更感あるのですが、私と同じミスを減らすきっかけになれば。と思い、書いてみます
- db
- oracle
- aws
- あとで読む
- rds
- 運用
- migration
- database
- sql
- データベース
アボリジニの民族楽器ディジュリドゥが謎のテクノロジでＢ５サイズになった「DDG-BOX-2」、良すぎ - nomolkのブログ
- 258 users
- nomolk.hatenablog.com
- テクノロジー
- 2019/08/19
この記事ではＢ５サイズの箱型ディジュリドゥ、DDG-BOX-2を紹介します。すでに琴線に触れた方はこの先を読まずに買っても差し支えないでしょう。 MEINL Percussion マイネルディジュリドゥ Stereo Didgeridoo Tuning/C DDG-BOX-2 【国内正規品】出版社/メーカー: MEINLメディア: エレクトロニクスこの商品を含むブログを見る ※以下、音や楽器についての評価は全体に、趣味でちょっとかじっただけの素人によるものなのでご了承ください。はじめにみなさん趣味ありますか。僕は趣味をきかれたら電子工作とかインディーゲームとかワールドミュージック収集とか答えていたのですが、実は過去にもういっこ趣味があったのを最近になって思い出しました。ディジュリドゥ演奏です。なぜかここ10年ほど完全に忘れており、2週間前に突然思い出して、ハッとしました。今日はそん
- 楽器
- あとで読む
- 音楽
- blg
- オーストラリア
- music
AWS 認定ソリューションアーキテクト – プロフェッショナル(AWS Certified Solutions Architect – Professional)の学習方法 - NRIネットコムBlog
- 249 users
- tech.nri-net.com
- テクノロジー
- 2021/06/08
小西秀和です。この記事は「AWS認定全冠を維持し続ける理由と全取得までの学習方法・資格の難易度まとめ」で説明した学習方法を「AWS 認定ソリューションアーキテクト – プロフェッショナル(AWS Certified Solutions Architect – Professional)」に特化した形で紹介するものです。重複する内容については省略していますので、併せて元記事も御覧ください。また、現在投稿済の各AWS認定に特化した記事へのリンクを以下に掲載しましたので興味のあるAWS認定があれば読んでみてください。 ALL Networking Security Database Analytics ML SAP on AWS Alexa DevOps Developer SysOps SA Pro SA Associate Cloud Practitioner 「AWS 認定ソリュ
- aws
- あとで読む
- 学習
- 勉強
- Architect
- lambda
- 資格
- amazon
画像の機械学習が劣化する理由 - Qiita
- 247 users
- qiita.com/nonbiri15
- テクノロジー
- 2022/05/01
前書き注意：ここに書いていることは2020年代としては、古すぎる見解になっている。近年の自己教師あり学習の大幅な進展で、ここで述べているようなアプローチは大幅に古めかしいものになっている。・自己教師あり学習の進展は、画像認識タスクに対する共通のbackbone を作り出しており、後段で個々の画像認識タスクに対するfine-tuningをするアプローチに変わってきている。・そのため、ラベル付きの限られたデータで特徴量の抽出をしていたのが、自己教師あり学習に基づく特徴量の抽出になっている。・各人、自己教師あり学習について調べることをお勧めする。主旨単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。はじめに画像認識の機械学習を改善するためにはデータを追加すればよい。そう思っている人が大半だろう。ただ、
- 機械学習
- あとで読む
- アルゴリズム
- 画像
- 学習
- 勉強
- AI
- MachineLearning
- qiita
- データ
OpenAI API ドキュメント日本語訳｜#1 GET STARTED 前編｜ゑぐみかるちゃあ
- 241 users
- note.com/egumiculture
- テクノロジー
- 2023/03/11
OpenAI API ドキュメントの日本語訳をこちらでまとめます。文字量の多いドキュメントなので、セクションごとに記事を分割しています。今回は「GET STARTED 」のセクションからIntroduction と Quickstart を抜粋した前編です。基本 DeepLで翻訳して、気になるところだけ書き換えています(ほぼ気になるところがないのが、DeepLのすごいところ)。原文との突き合わせができるようにはじめに原文を入れてますので、間違いなど見つけられましたら、ぜひご指摘ください。ご指摘箇所は随時反映させていただきます。原文のリンクが有効になってますので、それぞれ必要な場合は原文リンクの方を参照ください。 Introduction｜はじめに Overview｜概要The OpenAI API can be applied to virtually any task that i
- AI
- あとで読む
- api
- ChatGPT
- 機械学習
- OpenAPI
- ドキュメント
- 日本語
- OpenAI
- tutorial
ChatGPTを探す旅に出させていただきます | DevelopersIO
- 237 users
- dev.classmethod.jp
- テクノロジー
- 2023/04/09
文書の数が多い場合、単語の種類(ボキャブラリ)も多くなり単語の次元が大幅に増えていきます。一方、一つの文書に含まれる単語の数には限りがあるため、これは全体として疎行列になります。また、単語が各次元として扱われますが、文書ごとの出現順序など、単語間での関連性を示す情報は抜け落ちたものとなります。それに対して低次元(通常数百次元程度)の密な行列で単語の意味を定義する方法があります。これは、「分散表現」や「埋め込み表現」と言われるものになっております。この表現を獲得するため手法は様々なものがありますが、ここではWord2Vecを紹介します。元論文 : Efficient Estimation of Word Representations in Vector Space 具体的な実装についての解説 : word2vec Parameter Learning Explained Wor
技術ブロガー必読！と言える「Technical Blogging, Second Edition」を読んだ - kakakakakku blog
- 223 users
- kakakakakku.hatenablog.com
- テクノロジー
- 2019/08/07
技術ブロガー必読！と言える「Technical Blogging, Second Edition - Amplify Your Influence」を読んだ．タイトルにある通り「技術ブログ」にフォーカスした本となる．本書は2012年に出版された歴史のある本で，最新版となる Second Edition が6月末に出版された．なお，Second Edition は今年1月から β として公開されていて，β 1.0 → β 5.0 と進化しながら出版されている．技術ブロガーとして，今まで10年以上育ててきた暗黙知をうまく整理する機会になった．本書の内容は非常に共感できるし，僕自身新しく気付けたこともあった．何よりも「技術ブログ」に対する様々なアプローチを完璧に言語化されている点が素晴らしく，正直言って「本書って僕が書いたの？」と頭が混乱するほどにシンクロを感じる場面もあった．シンクロ具合を表
- 技術
- あとで読む
- ブログ
- blog
- 技術ブログ
- 出版
- google
- エンジニア
- 書評