[B! search] shion214のブックマーク

shion214 id:shion214

searchに関するshion214のブックマーク (100)

社内文書検索&QAシステムの RAG ではないところ - Algomatic Tech Blog
こんにちは。NEO(x) 機械学習エンジニアの宮脇（@catshun_）です。 RAG システムの開発、いざ業務に統合するとなると結構大変ですよね。構築してみたがユーザ数が伸びず、、なんてことはよくあると思います。実際こんな記事も話題になりましたね。本記事では、コラムとして RAG システムの設計で考慮したい点を自戒を込めて記述したいと思います。誤っている記述等もあると思いますが、本記事を読んだ方の議論のネタになってくれれば幸いです。また Retrieval-based LM の技術的な話は、以下で触れておりますので併せてご覧ください。 RAG とは RAG (Retrieval-Augmented Generation) とは、社内文書・長期記憶に該当する対話履歴・API 仕様書などの外部知識資源を、言語モデルが扱えるよう入力系列に挿入する手法です。もともと Lewis+'
shion214 2024/05/31
検索

AI

あとで読む

blog

search
リンク
Dify で RAG を試す｜npaka
1. RAG「RAG」(Retrieval Augmented Generation) は、最新の外部知識の習得とハルシネーションの軽減という、LLMの2つの主要課題に対処するためのフレームワークです。開発者はこの技術を利用して、AI搭載のカスタマーボット、企業知識ベース、AI検索エンジンなどをコスト効率よく構築できます。これらのシステムは、自然言語入力を通じて、さまざまな形態の組織化された知識と相互作用します。下図では、ユーザーが「アメリカの大統領は誰ですか？」と尋ねると、システムは回答のためにLLMに質問を直接渡しません。代わりに、ユーザーの質問について、知識ベース (Wikipediaなど) でベクトル検索を実施します。意味的な類似性マッチングを通じて関連するコンテンツを見つけ (たとえば、「バイデンは現在の第46代アメリカ合衆国大統領です...」)、LLMに発見した知識とともにユ
shion214 2024/05/07
検索

button

ボタン

設定

search
リンク
Amazon Kendra と Amazon Bedrock で構成した RAG システムに対する Advanced RAG 手法の精度寄与検証 | Amazon Web Services
Amazon Web Services ブログ Amazon Kendra と Amazon Bedrock で構成した RAG システムに対する Advanced RAG 手法の精度寄与検証 By Kazuki Motohashi, Ph.D., Partner Solutions Architect, AI/ML – AWS Japan By Kazuhito Go, Sr. AI/ML Specialist Solutions Architect – AWS Japan By Kenjiro Kondo, TELCO Solutions Architect – AWS Japan 生成 AI は会話、ストーリー、画像、動画、音楽などの新しいコンテンツやアイデアを作成できる AI の一種です。生成 AI によりアプリケーションが再発明され、新しいカスタマーエクスペリエンスが提供されます
shion214 2024/05/02
amazon

検索

web

AI

search
リンク
基本概念から理解するAzure AI Search - Azure OpenAI Serviceとの連携まで - 電通総研テックブログ
こんにちは。XI 本部AI トランスフォーメーションセンター所属の山田です。先日、部内の勉強会でAzure AI Searchについて紹介したので、テックブログでもその内容を紹介したいと思います。 Azure AI Searchとは？ Azure AI Searchに保存されるデータに関する用語と概念 Azure AI Searchのスケーラビリティに関する用語と概念 Azure AI Searchでサポートされる検索の仕組み全文検索について Azure AI Searchのアナライザーベクトル検索についてベクトルの近傍検索アルゴリズムハイブリッド検索検索インデックスのスキーマ設計検索インデックスにドキュメントを追加する方法 Pushモデル Pushモデルを利用する場合のアーキテクチャの例 Pullモデル Pullモデルを利用する場合のアーキテクチャの例インデクサーの計算リソ
shion214 2024/04/28
AI

search

検索

microsoft

service
リンク
検索ボリュームではなく、「検索ジャーニー」でコンテンツを考える方法 - ブログ - 株式会社JADE
こんにちは！JADEの垣本です。最近一気読みしたマンガは『ダンジョン飯』、今いちばん続きが気になるマンガは『忍者と極道』です。前回の記事「私がSEOのコンテンツプランニングで大切にしていること」では、「コンテンツを作るときに考えるべきことは？」という話を書きました。今回は、その手前の段階である「そもそもどんなコンテンツが必要？」という点を掘り下げたいと思います。特に「検索クエリってどうやって洗い出すの？」「検索クエリをピックアップしてみたけど、優先順位の付け方が分からない……」という悩みをお持ちの方へ。私なりの回答をご提案します。 ※前回の記事に引き続き、当記事におけるコンテンツは、自然検索流入を増やすことをKPIとしたものを念頭に置いています。よくある質問「月5本の記事を作りたいのですが、何から着手すべきですか？」よくある質問への答え「検索ジャーニーから考えましょう」実践：し
shion214 2024/04/18
あとで読む

検索

ブログ

search

seo
リンク
RAGの性能を高める「Self-RAG」を3分で理解する
本記事では、よく聞く「Self-RAG」についてざっくり理解します。軽めの記事です。はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、RAGの新手法として昨年発表された「Self-RAG」の論文[1]について、日本語で簡単にまとめたものです。この論文は「CRAG」[2]など、最近出ている別のRAGアーキテクチャにも影響を与えているので、理解する価値がありそうです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー RAGの性能を高めるための新しい手法です。ワシントン大学などの研究者によって2023年10月に提案されました。Self-RAGという手法を使うメリットは、回答品質を上げられること、ハルシネーション（幻覚）を減らせるこ
shion214 2024/04/10
検索

あとで読む

ChatGPT

タスク

search
リンク
Azure OpenAI ServiceによるRAG実装ガイドを公開しました | SIOS Tech. Lab
みなさん、こんにちは。サイオステクノロジー武井です。今回は、Azure OpenAI ServiceによるRAG実装ガイドを公開しましたので、ご紹介させてください。 ※ このブログでのご紹介ととも以下のイベントでもガイドに関する詳細なご説明や、ガイドにはないデモなどを実施しますので、ぜひご参加ください。 Azure OpenAI ServiceによるRAG実装ガイドを公開しました https://tech-lab.connpass.com/event/315703 Azure OpenAI ServiceによるRAG実装ガイドとは？以下のURLで公開しております。執筆しているうちに100ページ超の壮大なものとなってしまいました。 https://dev.noriyukitakei.jp/docs/aoai-rag-dev-guide.pdf 本ガイドの目的は、「シンプル」「強力」「すぐ動
shion214 2024/04/09
service

検索

search

AI

データ
リンク
AI検索「Perplexity」がかなり便利だったので紹介します (1/5)
「ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。そもそもChatGPTの心臓部である大規模言語モデル（LLM）は、膨大な知識を元にテキストを「生成」する仕組みだ。逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚（ハルシネーション）を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp
shion214 2024/04/06
AI

検索

便利

ChatGPT

search
リンク
似た文書をベクトル検索で探し出したい ~SentenceTransformersとFaissで効率的にベクトル検索~
はじめにこの記事では、ベクトル検索で似た文書を検索するコードを解説します。具体的には、Sentence Transf ormersライブラリを用いてベクトル化、Faissという近似最近傍探索ライブラリを用いて高速な検索を行います。用語説明ベクトル検索 ... 文書の検索にベクトルを使用する方法。例えば、文書に映画に関する内容が 10 %、音楽が 2 %、俳優が30%含まれていた時、シンプルにそれを表すと [0.1, 0.02, 0.3]というベクトルを作ることができる。Googleの説明が詳しい。 Sentence Transf ormers ... ベクトル検索に必要なベクトル化を行うためのライブラリ Faiss ... ベクトル同士の類似度を高速に検索してくれるライブラリ。以下のHakkyさんのページが詳しい。コード入力：検索したい文字のリスト、検索される文字のリスト出力：どの
shion214 2024/03/18
検索

search

ベクトル検索
リンク
サクラエディタでよく使う正規表現たち【備忘録】 - Qiita
よくお世話になっている正規表現ですが、毎日使うものでもないので、なかなか覚えることができず。。。使う度に検索するものもあるので、自分のための正規表現備忘録を作成することにしました。データ整理などに使っているだけなので、偏りがあるかもしれません。全角文字だけ
shion214 2024/03/17
エディタ

search

検索

データ

editor

正規表現
リンク
Hexoで構築したサイトに検索機能を実装したい
Hexoで構築したサイトに検索機能を実装したいThu, 15 Nov 2018 10:10:04 GMTHexo サイト静的サイトジェネレーターという要望は普通にあると思ってまして、ツイッタとかでたまにhexoで検索すると、どうやって実装しようとしているのか迷っている人とかがいるので、自分の知ってる範囲でいくつか方法を紹介します。また、下記の方法の一部はHexo以外の静的サイトジェネレータでも可能です。 Googleカスタム検索一番手っ取り早いです。ただし、控えめに言って見た目がダサいので、見た目にこだわる人には向かないです。 Algoliaを使う Algoliaという全文検索サービスがあります。これを利用することで静的サイトジェネレータで生成したサイトでも検索機能を付与することが可能です。以前書いたのですがVue.jsのサイトも今のところHexoで構築させており、検索はAlgoli
shion214 2024/03/10
検索

data

search

サイト

あとで読む

まとめ
リンク
AWSの生成AIで社内文書検索！ Bedrockのナレッジベースで簡単にRAGアプリを作ってみよう - Qiita
この記事について AWSコミュニティ最大級のイベント「JAWS DAYS 2024」内のワークショップにて実施したハンズオンコンテンツとなります。イベントでは口頭で説明しながら実施しますが、この記事さえ読めば誰でも体験できるように作っていますので、当日イベントにお越しになれない方もぜひご活用ください。（スムーズにいけば30分程度で完了します）本ハンズオンの実施にあたり、多少の課金（数十円〜数百円以内）が発生することをご了承ください。実施後には忘れず不要なリソースの削除をお願いします。なお、Bedrockのモデル呼び出し料金はAmazon製のTitanシリーズを除き、マーケットプレイス扱いとなるためAWSクレジット（クーポン）の適用範囲外となります。 ※事前にAWSアカウントの作成をお願いします。クレジットカード情報が必要です。ログイン用のEメールアドレスとパスワードをお忘れなく！ 0
shion214 2024/03/04
検索

あとで読む

AI

アプリ

search
リンク
RAG構築のためのAzure OpenAI Serviceリファレンスアーキテクチャ詳解 | SIOS Tech. Lab
◆ Live配信スケジュール ◆ サイオステクノロジーでは、Microsoft MVPの武井による「わかりみの深いシリーズ」など、定期的なLive配信を行っています。 ⇒ 詳細スケジュールはこちらから ⇒ 見逃してしまった方はYoutubeチャンネルをご覧ください【4/18開催】VSCode Dev Containersで楽々開発環境構築祭り〜Python/Reactなどなど〜 Visual Studio Codeの拡張機能であるDev Containersを使ってReactとかPythonとかSpring Bootとかの開発環境をラクチンで構築する方法を紹介するイベントです。 https://tech-lab.connpass.com/event/311864/ こんにちは、サイオステクノロジー武井です。今回は、「RAG構築のためのAzure OpenAI Serviceリファレンスア
shion214 2024/02/24
service

検索

search

AI

pdf
リンク
RAGの性能を改善するための8つの戦略 | Fintan
近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル（Large Language Model：LLM）の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ
shion214 2024/02/10
ChatGPT

検索

あとで読む

AI

search
リンク
私のJavaScriptの情報収集法 2024年版
個人的なJavaScriptの情報収集の方法についてまとめてみます。 JSer.infoなどをやっているので、JavaScriptの情報については色々な情報源を見るようにしています。 JSer.infoの範囲の中での情報源については、次の記事でまとめています。 JSer.info 13周年: JavaScriptの情報源を整理する - JSer.info この記事では、少しスコープを広げてJavaScriptの情報収集についてまとめてみます。かなりスコープが広がってしまうので、万人向けの方法ではなく、個人的な情報収集方法としてまとめています。この記事では、膨大な情報の中から見つけるというアプローチをとっているので、人によって向き不向きがあると思います。情報収集の方法情報の元となる情報源はさまざまなサイトや人になると思います。しかし、そのサイトや人ごとに見ていくというのはかなり大変
shion214 2024/02/09
javascript

データベース

search

rss

github
リンク
家の中にあるいろいろなモノを記録し在庫・位置・保証期限などを管理・検索しやすくしてくれる「Homebox」レビュー
家の中に色んな製品があってそのすべてを記録したい、というときに使えるサービスが「Homebox」です。GIGAZINE編集部にはスマートフォンやカメラなど多種多様な製品が100種類以上あり、その製品名やシリアル番号、保管場所、さらには保証期限など製品に関するあらゆる情報を記録しているのですが、それぞれの情報を一目見ただけで把握でき、検索などをスムーズに行えるようなしっくりくる記録方法を見つけられていませんでした。そんなときに発見したのが無料で使えてシリアル番号や保管場所などを製品ごとに記録できるHomebox。このサービスを使って色んな製品を記録・管理してみました。 GitHub - hay-kot/homebox: Homebox is the inventory and organization system built for the Home User https://github
shion214 2024/02/07
検索

アプリ

家

search

あとで読む
リンク
RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
はじめに新規事業部生成AIチーム山本です。 ChatGPT（OpenAI API）をはじめとしたAIの言語モデル（Large Language Model：以下、LLM）を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が（当然ながら）得られてしまいます。この問題を解決する方法として、Retrieval Augmented Generation（以下、RAG）という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力（プロンプト）に付け加えて渡すことで、ユーザが欲しい
shion214 2024/02/07
検索

あとで読む

資料

AI

search

rag
リンク
法律のデータ構造と検索
デジタル庁は、法令標準 XML スキーマに準拠した、現行の法令データをe-Gov法令検索というサイト上で公開しています[1]。今回、この法令XMLをパースするPythonライブラリ ja-law-parser をつくり、法令データの全文検索をしてみました。この記事では、日本の法令とそのデータ構造、法令XMLパーサについて解説し、最後に、それらを使った法令データの全文検索システムを実装する方法をご紹介します。法令検索の実装についても、GitHubリポジトリで公開しています。この記事は、情報検索・検索技術 Advent Calendar 2023の16日目の記事です。法律と法令法律とは法律の制定と公布法律と法令の違い法律の改正法令のデータ構造 e-Govの法令データ法令標準XMLスキーマ法令番号と法令ID 題名本則と附則条・項・号編・章・節・款・目法令XMLパーサ：
shion214 2023/12/19
データ

あとで読む

検索

search

統計
リンク
GPTsでNotion APIを叩くようにしてみたらやばかった
OpenAI の DevDay で発表された、GPTs は、特定のタスクに特化したカスタムモデルを作成できる ChatGPT Plus で利用できる新しい機能です。作った GPTs は、自分だけで使うのはもちろん、友達にシェアしたり。ウェブ上で公開することもできます。この GPTs の機能である Actions を使うと、OpenAPI Schema を元に、外部 API を ChatGPT エージェントが実行するようになります。この機能を使って Notion などの様々なサービスと GPTs を繋げてみたので、そのデモと GPTs のつくりかたを解説します。デモ Notion は、API と呼ばれる開発者が Notion のデータを操作し、外部アプリケーションやサービスと連携するための機能が公開されています。そこで、Notion API の OpenAPI スキーマを書いて検索、デ
shion214 2023/11/15
api

あとで読む

search

page

ChatGPT
リンク
Azure OpenAI Service 「on your data」で独自データを使ったチャットを実現する - Taste of Tech Topics
こんにちは、igaです。先日は台風の影響が出る前に出かけられて、リフレッシュできました。今回は、Azure OpenAIとチャットする際に、独自データを使用してみます。独自データの使用（原文の表記はon your data）は、2023年8月現在パブリックプレビューとして利用できる機能です。 techcommunity.microsoft.com 独自データの使用（以降、on your dataと表記します）により、例えば企業内ドキュメントやFAQをAzure OpenAIに検索させることで、ユーザーからのチャットでの問い合わせに対して企業内ドキュメントやFAQを検索した結果をAzure OpenAIがチャットの応答として返すことができるようになります。今回は、on your dataを利用するまでの流れを試したいと思います。 on your dataのポイント on your d
shion214 2023/08/25
データ

検索

search

service

data
リンク
1 2 3 4 5 次のページ