[B! 機械学習] yuki_2021のブックマーク

自然言語とVision&Language

東京大学大学院の2024年度講義「知能情報論」で使用した資料です． Vision&Language関連の研究について，深層学習初期から大規模モデルにいたるまでを概観しています．なお，資料作成時期は2024年5月下旬であり，内容はその時点で発表されていた研究等に基づいています．

yuki_2021 2024/06/07

リンク

深層強化学習（DQN）で学習するFXトレードエージェントを作ってみた - Qiita

どうも、オリィ研究所の ryo_grid こと神林です。こんにちは。時系列データに対するディープラーニング適用の一例として、深層強化学習（DQN）させたトレードエージェント（まともなパフォーマンスを発揮する）のモデルを作成し、FX自動トレード（のシミュレーション）をするということにトライしてきました。深層強化学習でのFX自動トレード（のシミュレーション）がうまくいかないのでオレオレ手法を考えた - Qiita 【続】深層強化学習でのFX自動トレード（のシミュレーション）がうまくいかないのでオレオレ手法を考えた - Qiita 【成功】深層強化学習でのFX自動トレード（のシミュレーション）がうまくいかないのでオレオレ手法を考えた - Qiita 【LSTM導入版】深層強化学習でのFX自動トレード（のシミュレーション）がうまくいかないのでオレオレ手法を考えた - Qiita このテーマに

yuki_2021 2024/06/06

リンク

最近ローカルLLMがアツいらしい

最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し

yuki_2021 2024/05/21

リンク

【2024年版】WSL2+Ubuntu24.04+Docker＋GPUでつくる機械学習環境

はじめに WSL2（Windows Subsystem for Linux 2）は、Microsoft Windows上でLinuxカーネルを直接実行できるようにする機能です。この記事ではWSL2環境にDockerを導入しGPUを用いた機械学習環境を構築する手順を紹介します。構築イメージは以下の図の通りです。NvidiaGPUを搭載したマシンにWSL2環境を構築します。Dockerを用いてコンテナを用意し、CUDAは各コンテナ内のCUDA Toolkitを用いて利用します。今回開発するPCのスペックは以下の通りです。 Windows 11 Windows version: 22H2 GPU：NVIDIA Geforce RTX 3060 12GB 設定 1. WSL2を有効化デフォルトではWSL2環境が無効化されている可能性があるので、始めに有効化しておきましょう。「コントロール

yuki_2021 2024/05/18

リンク

Snowflakeで感情分析を試してみようとして失敗した話 - Qiita

はじめに最近急激に暑くなってきましたね... この記事を書いている前の週にSnowflake Summit 2023が開催され、DWH×AIがさらに加速するような内容がさまざま発表され、私もすっかりSnowflakeに御熱なわけですが、SnowflakeでAIモデルを動かしてみたいと思い、いろいろ試行錯誤をした内容をまとめておこう！ということで、この記事を書いていこうと思います。初めてのQiitaでの記事投稿でかなり緊張しており、拙い部分が多いと思いますが、Snowflakeの特徴的な部分をお伝えできればと思います！この記事の対象者 Snowflake×AIに興味がある方 Snowflakeで感情分析をやってみたい方 ONNXをSnowflakeで使うにはどうすればいいのかわからない方この記事の内容完成図の確認利用する技術の説明感情分析をSnowflakeで行うための準備や

yuki_2021 2024/04/23

リンク

本当に小さく機械学習プロダクトを始めるには - Qiita

TL;DR マイクロサービス基盤がない、潤沢にエンジニアリソースがない、そんな現場にも機械学習プロジェクトをいい感じにプロダクトに乗せていく今風のやり方について考えたい。そのために現状世の中にある機械学習ツールを俯瞰したい。プロダクトに乗せるとすると、デプロイで終わりではなくて、モデル再学習やモニタリングなども含めて考えたい。はじめに機械学習のサービスは内部のアルゴリズムが複雑であっても、そのサービス自体に求められることが多くなかったり、学習と推論時で必要なリソースが異なったりというところからマイクロサービスアーキテクチャと相性が良いと言われています。実際に機械学習をプロダクトで使うことについて意欲的に取り組んでいる企業、特にWeb系企業では既にマイクロサービスアーキテクチャを採用した基盤があり、その上で効率的に機械学習モデルをデプロイするための方法を検討しています。一方で、そうでな

yuki_2021 2024/04/22

リンク

ベイズ統計でKaggleを解いてみる - Qiita

はじめに概要ベイズ統計を用いてKaggleの1タイタニック問題を解いてみる．分析は以下の手順で行う．データの可視化・理解データの加工・前処理ベイズ統計分析モデルの記述デザイン行列・データリストの作成 Stanファイルの記述 MCMC! 結果の評価実行環境 Mac OS Sonoma 14.1 R version 4.3.1 RStudio version 2023.12.1+402 > R.versions version.string R version 4.3.1 (2023-06-16) > sessionInfo() other attached packages: [1] posterior_1.5.0 cmdstanr_0.6.1 lubridate_1.9.3 forcats_1.0.0 [5] stringr_1.5.0 dplyr_1.1.3 purrr

yuki_2021 2024/04/11

リンク

機械学習による株価予測 - Qiita

こんにちは。私がAidemyでデータ分析講座コースを受講いたしました。今回は学んだスキルを活用して、上場企業を株価予測をしてみました。 ※私の環境: Python3 Chrome Google　Colaboratory Windows　10 目次 1．目的 2. データセット 3. 機械学習モデル 4. 予測モデルの構築と検証 5. 結果 6. 反省 1.目的上場会社の株価データセットを用いて、株価予測するLSTMの機械学習モデルを構築すること。 2.データセット Yahoo Financeである上場企業Lasertec(6920.T)の時列データ 3.機械学習モデル LSTM(Long Short-Term Memory: ニューラルネットワークの一種で、長期的な依存関係を学習することができる特徴ある。 4.予測モデルの構築と検証 4-1. ライブラリのインポート import ker

yuki_2021 2024/03/25

リンク

驚異の1ビットLLMを試す。果たして本当に学習できるのか?｜shi3z

昨日話題になった「Bit Net」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。 Bit Netというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジかよ。 https://arxiv.org/pdf/2402.17764.pdf ということで早速試してみることにした。オフィシャルの実装は公開されていないが、そもそも1ビット(と言っていいのかわからない,-1,0,1の三状態を持つからだ。論文著者はlog2(3)で1.58ビットという主張をしている)量子化のアルゴリズム自体の研究の歴史は古いので、Bit NetによるTransf ormerの野良実装

yuki_2021 2024/02/29

リンク

これから推薦システムを作る方向けの推薦システム入門｜masa_kazama

イントロ「Amazonのこの商品をチェックした人はこの商品もチェックしています」や「YouTubeのあなたへのおすすめ」、「Twitterのおすすめユーザー」などのレコメンド機能は多くのWebサービスに組み込まれております。そのレコメンドによって、ついつい商品をたくさん買ってしまったり、夜遅くまで動画を見てしまった経験はないでしょうか。この記事では、レコメンドシステムの裏側はどのような仕組みになっているのか、そもそもレコメンドとはどういうものなのかを具体例を交えながら俯瞰できればと思います。レコメンドシステムのアルゴリズムの詳細には触れず、ビジネスにおいてどのような形で実装されているかにフォーカスしています。ネット上に公開されているレコメンドに関するスライドや記事、論文のリンクをまとめましたので、アルゴリズムの詳細などはリンク先の記事でご確認ください。対象の読者は、自社のサービスにレコ

yuki_2021 2024/02/28

リンク

Python surprise で作るらくらく「レコメンドエンジン」（その１） – さくっと Surprise でレコメンドエンジンを作ってみよう！

それぞれのアルゴリズムが最適な状況は異なります。以下に、いくつかの主要なアルゴリズムとそれらが最適となる状況について説明します。近傍法 (k-Nearest Neighbors)：評価値の分布が一様でなく、ユーザーやアイテム間に明確な関連性が存在する場合に有効です。 SVD (Singular Value Decomposition)：データセットが大きく、スパース性（欠損値が多い）が高い場合に適しています。 NMF (Non-negative Matrix Factorization)：SVDと同様。元の評価行列の全ての要素が非負（0以上）。 Slope One：スピーディーに妥当な精度の予測を行いたい場合に適しています。 Co-clustering：データセットが明確なクラスタ構造を持っているときに有効です。推薦システム（レコメンドエンジン）を作る流れ取り急ぎ、以下の手順で作っ

yuki_2021 2024/02/28

リンク

オールインワンAI/機械学習プラットフォーム「Dataiku」のSaaS版「Dataiku Cloud」の取り扱いを開始 | NTTデータ先端技術株式会社

NTTデータ先端技術株式会社（本社：東京都中央区、代表取締役社長：藤原遠、以下：NTTデータ先端技術）は2024年2月13日より、オールインワンAI/機械学習プラットフォーム「Dataiku」のSaaS版である「Dataiku Cloud」の取り扱いを開始しました。これまでNTTデータ先端技術は、「Dataiku」のクラウドインストール版、オンプレミスインストール版を提供してきました。今回、新たなラインナップとしてSaaS版の「Dataiku Cloud」の取り扱いを開始し、お客様の初期構築期間をこれまでよりも大幅に短縮し、最新のデータを迅速に活用開始いただけるようになります。AI/機械学習のフルマネージド・AIプラットフォームサービスとして、お客様のAI活用、アナリティクスによる洞察を加速させます。今後は、「Dataiku Cloud」も含めた3つのプランから、お客様のビジネス状況に

yuki_2021 2024/02/14

リンク

ぼくのかんがえたさいきょうの強化学習アルゴリズム（古典強化学習編） - Qiita

この記事は自作している強化学習フレームワークの解説記事です。はじめに今までフレームワークを通じて様々な強化学習アルゴリズムを実装してきました。今回その知識を生かしてオリジナルなアルゴリズムを考えてみたので記事にまとめてみます。このアルゴリズムは以下の状況でかなりの精度を誇ります。マルコフ決定過程なモデル状態が離散で現実的な数行動が離散で現実的な数 ※"現実的な数"というのは数に上限があり、その上限がそれほど大きくない場合を指します基本アイデア基本的なアイデアは探索（Exploration）と活用（Exploitation）の分離です。強化学習では一般的に「探索と活用のトレードオフの問題」1があり、探索を優先すると報酬が少なくなり、活用を優先すると局所解に陥る可能性が高くなる問題があります。私が過去に記事で取り上げた手法では、どれも探索と活用のバランスをとり学習を進めて

yuki_2021 2024/02/13

リンク

RAGの性能を改善するための8つの戦略 | Fintan

近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル（Large Language Model：LLM）の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ

yuki_2021 2024/02/10

リンク

機械学習をPythonで学ぼう！　基礎、できること、ライブラリ

連載目次機械学習は、今や私たちの生活や仕事に不可欠なテクノロジーです。朝起きてスマートフォンでチェックするニュース、それはあなたの関心に基づいて機械学習によって選ばれています。オフィスに到着すると確認する今週の売上予測レポート、これもまた過去のデータを基に機械学習が予測したものです。これだけ便利な機械学習を、自分でも使いこなせたら素晴らしいですよね。それを可能にするのが、この連載の目的です（図1）。

yuki_2021 2024/02/09

リンク

画像AIを調べると必ず出てくる謎のサイト「Hugging Face」ってナニモノ？　正体は急成長中の“ユニコーン”

「Midjourney」や「Stable Diffusion」といった画像生成AIが登場して以降、「自分でも好きな画像を作ってみたい」と思う人も増えているのではないだろうか。実際にそうして調べていると、こんな表現に必ずと言っていいほど行き当たる。「Hugging Face上でお手軽に試せます」「モデルはHugging Faceからダウンロード」「Hugging Faceのライブラリを」──。例えばStable Diffusion（以下、SD）を使いたいなら、SDは英Stability AIが主立って公開しているものだから、同社Webサイトを参照するのが王道だ。するとソースコードや導入方法がまとまったGitHubのページに案内されるのだが、いざ説明を読むとやはりSDの学習済みモデルがHugging Faceというサイト上にあるのが分かる。公式がそう案内しているから怪しくはないのだろうが

yuki_2021 2024/01/25

リンク

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi

yuki_2021 2023/12/11

リンク

AIが「言語生成AIとの対話」で賢くなり続ける自動成長モデル　米Meta含む研究者らが開発

AIが「言語生成AIとの対話」で賢くなり続ける自動成長モデル　米Meta含む研究者らが開発：Innovative Tech 米Metaやカナダのマギル大学などに所属する研究者らは、環境と直接対話せずに大規模言語モデル（LLM）からのフィードバックを用いてAIエージェントを強化学習で訓練する手法を提案した研究報告を発表した。

yuki_2021 2023/11/09

リンク

OpenAIのファインチューニングAPIによる GPT-4 から GPT-3.5 への蒸留を試す｜npaka

OpenAIのファインチューニングAPIによる GPT-4 から GPT-3.5 への蒸留を試したのでまとめました。 1. GPT-4 から GPT-3.5 への蒸留「LlamaIndex」で、OpenAIのファインチューニングAPIによる GPT-4 から GPT-3.5 への蒸留のColabが提供されてたので、それをベースに独自データで試してみました。具体的には、「GPT-4」で学習データを生成し、「GPT-3.5」でファインチューニングすることで、「GPT-3.5」に「GPT-4」相当の知識を習得させます。 We successfully made gpt-3.5-turbo output GPT-4 quality responses in an e2e RAG system 🔥 Stack: automated training dataset creation in @ll

yuki_2021 2023/09/29

リンク

AIを学ぶのに必要な最低限の数学の知識は5つだけ!｜shi3z

最近、「AIを理解したくて代数幾何の教科書を勉強しているんですよ」という人によく会う。五年前くらい前に、note株式会社の加藤社長も「社内で代数幾何学の勉強会を開いてるんですよ」と言っていた。僕はその都度「それは全く遠回りどころか明後日の方向に向かってますよ」と言うのだがなかなか聞き入れてもらえない。確かに、AI、特にディープラーニングに出てくる用語には、ベクトルやテンソルなど、代数幾何学で使う言葉が多い。が、敢えて言おう。代数幾何学とAIはほとんど全く全然何も関係していないと。なぜこのような不幸な誤解が生まれてしまうかの説明は後回しにして、意地悪をしても仕方ないので、AIを理解するために最低限知っておかなければならない用語を5つだけ紹介する。テンソル(スカラー、ベクトル、行列など)おそらく、「テンソル」という言葉が人々を全ての混乱に向かわせている。 Wikipediaの説明は忘

yuki_2021 2023/06/16

リンク

はてなブックマーク

タグ

関連タグで絞り込む (89)

機械学習に関するyuki_2021のブックマーク (180)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス