並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 14 件 / 14件

新着順 人気順

生成AIの検索結果1 - 14 件 / 14件

  • GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」

    kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

      GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」
    • 「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】

      米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。 同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す

        「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
      • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

        昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

          GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
        • GPT-4o の概要|npaka

          以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

            GPT-4o の概要|npaka
          • Googleは対話型AI「Bard」のミスで時価総額1000億ドルが吹き飛ぶ、現実味を帯びる生成AI倒産 【生成AI事件簿】顧客からの問い合わせに誤回答、社内規則や契約書類で重大ミス、大切な場面で失敗して評判失墜など | JBpress (ジェイビープレス)

            生成AIを活用する企業は増える一方だが、それとともに、AIの間違いによって損害を被る企業も増えている。 エア・カナダはチャットボットの誤回答で賠償金を支払うはめに。別の企業は生成AIが作成した解雇合意書に重要な項目が欠落していたため、高額な和解金を支払わなければならなくなった。 企業に求められるのは、生成AIは間違いを犯すという前提に基づいた準備や行動。AIが間違えているかどうか分からない領域では活用すべきではない。 (小林 啓倫:経営コンサルタント) チャットボットで損害を被ったエア・カナダ 企業内でのAI活用が加速している。社員や顧客と自然な言葉でやり取りできる生成AIが登場したことで、AIを応用できる業務が増え、具体的な成果も見えやすくなったためだ。 たとえば、カナダで1855年に設立され、現在では同国で最大の規模を誇るTD銀行(Toronto-Dominion Bank)は、コンタ

              Googleは対話型AI「Bard」のミスで時価総額1000億ドルが吹き飛ぶ、現実味を帯びる生成AI倒産 【生成AI事件簿】顧客からの問い合わせに誤回答、社内規則や契約書類で重大ミス、大切な場面で失敗して評判失墜など | JBpress (ジェイビープレス)
            • NVIDIA主導で日本が「ソブリンAI」先進国に、AI立国に必須とNVIDIAが提唱するソブリンAIとは一体何なのか?

              NVIDIAが2024年5月15日に、経済産業省の助成や国内の主要クラウド企業との協力により、日本の生成AIインフラの構築を推進し、自国のデータを自国のAIで活用する「ソブリンAI」の基盤作りを強化していくこと発表しました。 NVIDIA to Help Elevate Japan’s Sovereign AI Efforts Through Generative AI Infrastructure Build-Out | NVIDIA Blog https://blogs.nvidia.com/blog/japan-sovereign-ai/ NVIDIA、生成AIインフラ構築をとおして日本のソブリンAIの取り組みを支援 | NVIDIAのプレスリリース https://prtimes.jp/main/html/rd/p/000000466.000012662.html NVIDIAは今

                NVIDIA主導で日本が「ソブリンAI」先進国に、AI立国に必須とNVIDIAが提唱するソブリンAIとは一体何なのか?
              • 「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】

                主催の清風明育社は、コンピュータ専門学校「清風情報工科学院」を運営する学校法人。他ににじジャーニーの提供元や大阪府教育委員会などが協賛しているという。また、公式サイトには協力先として日本マイクロソフトの名前を記載している。当初は協賛にワコムも記載していたが、5月13日にネット上で批判の声が大きくなった後、同日中に記載がなくなった。 清風明育社は、コンテスト開催の背景について「(生成AIは)有料利用が前提とされることが多いため、若年層は手が出しにくい」「無料で利用できる高品質な生成AIアートのツールに触れることが、進路選択・職業選択において価値ある体験になる」と説明していた。 一方コンテストに対してはいくつかの批判も。まず「入賞作品の著作権は主催者に帰属する」点については「成果物を奪うつもりか」という批判が見られた。また、協賛社一覧にワコムの名前があったことから、同社に対し「クリエイター向け

                  「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】
                • ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します

                  こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください! Zenzaiの概要 日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。 クローズドソースのシステ

                    ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します
                  • 2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁

                    デジタル庁では、デジタル社会の実現に向けた重点計画(令和4年6月7日閣議決定)を踏まえ、AIの実態と動向を把握し、リスクと必要な対応策を特定したうえで、官民における適切な活用の検討を進めています。 昨今の生成 AIなどの技術革新により、さまざまな利点を得られるようになってきており、政府としても、このような技術の動向を見極めつつ、関係省庁における生成AIの業務利用について、第10回デジタル社会推進会議幹事会・書面開催など議論を重ねてきました。 これまでの議論の経緯も踏まえ、デジタル庁では、2023年12月より生成AIの適切な利活用に向けた技術検証を実施しました。2023年度の検証結果の全体的な内容と、検証で得られた具体的な生成AIへの入力文のサンプル、一部検証に用いたテストケースを公開します。 技術検証の目的今後の政府情報システムへの生成AI利活用に向けて以下のような具体的な知見を得ることを

                      2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁
                    • AIからクリエイターを守るSNS「Oneup」 オタク文化愛が生む、無断学習させない仕組み

                      イラストレーターをはじめとするクリエイターが、SNSやプラットフォームで作品を発表する──今まで当たり前のように行われていたことが、揺らぎはじめている。 生成AI(ジェネレーティブAI)の登場により、インターネット上にアップロードした作品が、権利者に無断(※)で学習データに利用されてしまうケースが頻発。 それに対抗し、SNSではクリエイター側が自分の作品について「無断学習禁止」を宣言したり、過去に投稿した作品をインターネット上から削除したりするなどの動きも増えてきた。 (※)なお現在、日本の著作権法では、AIの学習を目的とした著作物の利用は「その著作物に表現された思想または感情の享受を目的としない」かつ「著作者の利益を不当に害さない」場合、原則として権利者の許諾なく利用できるとされている(KAI-YOU.net調べ) そうした現状を受けて、クリエイターを守る新たなサービス「Oneup」が2

                        AIからクリエイターを守るSNS「Oneup」 オタク文化愛が生む、無断学習させない仕組み
                      • グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供

                        【読売新聞】 【ニューヨーク=小林泰裕】米IT大手グーグルは14日、動画生成AI(人工知能)「Veo(ベオ)」を発表した。1分超の長さの動画を高解像度で生成できる。14日から一部の映画関係者らに提供を開始する。 ベオでは入力した文章

                          グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供
                        • 生成AI「Gemini 1.5 Pro」がついに日本語対応【お詫びと訂正あり】/「Gemini Advanced」や「Google Workspace」のGemini Business/Enterpriseユーザーに提供

                            生成AI「Gemini 1.5 Pro」がついに日本語対応【お詫びと訂正あり】/「Gemini Advanced」や「Google Workspace」のGemini Business/Enterpriseユーザーに提供
                          • GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?

                            GoogleのAI研究部門であるGoogle DeepMindが現地時間の2024年5月14日に、AI生成コンテンツにウォーターマーク(電子透かし)を入れてフェイク画像の拡散を防止するツール「SynthID」を、従来の画像だけでなくテキストと動画にも拡張することを発表しました。 More ways Google is delivering on its responsible AI commitment https://blog.google/technology/ai/google-responsible-ai-commitment-update/ Watermarking AI-generated text and video with SynthID - Google DeepMind https://deepmind.google/discover/blog/watermarkin

                              GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?
                            • オープンAI、新AIモデル「GPT-4o」発表-低価格で高速(Bloomberg) - Yahoo!ニュース

                              (ブルームバーグ): 対話型人工知能(AI)「ChatGPT」を開発した米オープンAIは、GPT-4モデルをアップデートした「GPT-4o(オー、omniの略)」を発表した。スピードアップと低価格を実現したという。 13日のライブ配信イベントで披露された新しい大規模言語モデル(LLM)、GTPー4oは膨大な量のデータをインターネットから取り入れて学習し、リアルタイムでの文字情報や音声、画像の扱いが優れている。数週間内にリリースされる見通し。

                                オープンAI、新AIモデル「GPT-4o」発表-低価格で高速(Bloomberg) - Yahoo!ニュース
                              1