GPTの人気記事 22件 - はてなブックマーク

1 - 22 件 / 22件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

GPTの検索結果1 - 22 件 / 22件

Hello GPT-4o
- 626 users
- openai.com
- テクノロジー
- 2024/05/14
GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, image, and video and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversat
- AI
- ChatGPT
- あとで読む
- OpenAI
- LLM
- GPT
- IT
- english
- Technology
- これはすごい
GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→｢ついにコーダーが恐怖を感じる時が来たか｣
- 357 users
- togetter.com
- テクノロジー
- 2024/05/14
kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません．思いついたことをつぶやきます． kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41
- ChatGPT
- AI
- 人工知能
- あとで読む
- 画像
- togetter
- 文章生成AI
- GPT
- techfeed
- ソフトウェア
「GPT-4o」発表　頭一つ抜けた性能をChatGPT無料版にも展開　音声と視覚を備えて“自然な対話”可能に【追記済】
- 342 users
- www.itmedia.co.jp
- テクノロジー
- 2024/05/14
米OpenAIは5月13日（米国時間）、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す
- AI
- ChatGPT
- あとで読む
- 人工知能
- OpenAI
- LLM
- GPT
- 文章生成AI
- 生成AI
- tech
ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）
- 330 users
- ascii.jp
- テクノロジー
- 2024/05/16
5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。実はこんなとこにある無課金ユーザー向けのモデル選択まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。
- ChatGPT
- AI
- あとで読む
- 人工知能
- OpenAI
- GPT
- ソフトウェア
- 無料
GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記：嘘でした。Gemini 1.5 proもすごいです。
- 300 users
- zenn.dev/acntechjp
- テクノロジー
- 2024/05/14
昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる
- AI
- あとで読む
- OpenAI
- 人工知能
- GPT
- GPT-4
- ChatGPT
- 生成AI
GPT-4o の概要｜npaka
- 269 users
- note.com/npaka
- テクノロジー
- 2024/05/14
以下の記事が面白かったので、簡単にまとめました。・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5
- ChatGPT
- LLM
- AI
- あとで読む
- 人工知能
- GPT
- 文章生成AI
- OpenAI
- 学習
- techfeed
Reader API
- 242 users
- jina.ai
- テクノロジー
- 2024/05/16
Our world-class embeddings for search, RAG, agent systems.
- LLM
- AI
- API
- あとで読む
- RAG
- search
- 便利
- スクレイピング
- markdown
- development
Power Apps & GPT-4oを使って超高速で画像解析アプリを作る！ - Qiita
- 223 users
- qiita.com/DEmodoriGatsuO
- テクノロジー
- 2024/05/19
GPT-4o凄すぎる！！出たときから騒ぎまくっていましたが、GPT-4oの登場で興奮しっぱなしの私です。先日こちらのQiitaの記事を拝読し、「Power Appsでやったらどうなるだろう🧐」という思いが抑えられず、作ってみたら超高速で画像解析アプリが作成できました！あらためて記事を出してくださったことに感謝いたします！まずは初弾！ということでGPT-4oを使って、 Power Appsで画像解析アプリを作成する方法を書いていきます！まずは見た目（Power Apps）から！まずはPower Appsでサクっと画面を作ります！ PowerPoint感覚で作れることが強みですからね！最低限のもので構成しています。画面 ├─ ScreenContainer - スクリーン全体 ├─ HeaderContainer │ └─ Header - ヘッダーコントロール ├─ Bo
- AI
- あとで読む
- ChatGPT
- GPT
- api
- 画像
- アプリ
- qiita
- Apps
大実験！ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
- 142 users
- e869120.hatenablog.com
- テクノロジー
- 2024/05/15
1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。それでは、現代最強の
OpenAIのGPT-4oを日本語OCRとして使ってみる
- 142 users
- zenn.dev/tomioka
- テクノロジー
- 2024/05/14
昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ
- AI
- あとで読む
- ChatGPT
- 日本語
- OCR
- GPT
- 人工知能
- api
この「なんでわかるの？」系の質問は初めてやってみたのだけど、なかなか。こう答えられるのは「本当に賢い」証拠だと言ってもいいと思う。
- 115 users
- togetter.com
- テクノロジー
- 2024/05/15
kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません．思いついたことをつぶやきます． kmizu.github.io
GPT-4oを使って2Dの図面から3DのCADモデルを作る
- 102 users
- zenn.dev/firstautomation
- テクノロジー
- 2024/05/19
はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！先日、 OpenAIからGPT-4oがリリースされました。いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上しているようです。製造業という観点からすると、これは設計図面などに活かせるようになるのでは？と思いました。機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。このような図と文字の複合データにおいて、GPT-4oの進化は有効なのではないかと考えました。 ※画像元URL: http://cad.wp.xdoma
- ChatGPT
- CAD
- あとで読む
- 3d
- GPT
- AI
- 画像
ChatGPT、GoogleドライブやOneDriveとデータ連携可能に
- 47 users
- www.itmedia.co.jp
- テクノロジー
- 2024/05/17
米OpenAIは5月16日（現地時間）、ChatGPTに「Google Drive」「OneDrive」といったクラウドストレージとのデータ連携機能を追加すると発表した。各ストレージから直接ChatGPTにデータをアップロードし、表やグラフを作れるという。 ChatGPTに作らせた表やグラフの編集機能も強化する。例えば表の一部分を指定し、その部分だけに関して質問したり、クリックで色を変えたりできるようになるという。新機能はいずれも、ChatGPTの有料サブスクリプション「ChatGPT Plus」「Team」「Enterprise」のユーザーに対し、今後数週間以内に提供する予定。13日に発表したばかりの新モデル「GPT-4o」で利用可能になるという。 OpenAIは新機能のデモとして、Google Drive内からスプレッドシートを直接ChatGPTにアップロードし、プレゼンテーション用
- AI
- あとで読む
- ChatGPT
- Google
- 人工知能
- techfeed
- Microsoft
- *あとで読む
リリースされたGPT-4oを使って動画のサマリー生成をしてみる！ - Qiita
- 32 users
- qiita.com/sakasegawa
- テクノロジー
- 2024/05/14
概要 GPT-4oが発表されました。 GPT-4oについては以下のツイートによくまとまっています。使用している映像は以下でまとめられています。非常に優秀でAI系のプロダクトがまた何個か死んだと思いますが、それはさておき使っていきましょう。 APIではすでに利用可能になっております。今回は以下のcookbookにある動画要約をgradioに移植します。 https://cookbook.openai.com/examples/gpt4o/introduction_to_gpt4o デモ以下の Huggingface Space を作りました。APIキーと動画を貼り付けて試用することができます。 1分間の動画で0.1ドル / 60秒くらいかかります。API使用料に注意してください。現状のGPT-4o APIの制限動画はそのままアップロードできませんこれは将来的にもできるとされてい
- api
- video
- あとで読む
- 動画
「GPT-4o」発表　人のように音声・画像・テキストで高速応答
- 20 users
- www.watch.impress.co.jp
- テクノロジー
- 2024/05/14
- AI
- 人工知能
- IT
- tech
- 画像
- あとで読む
OpenAI Spring Update v.s. Google I/O 2024｜大野峻典 | Algomatic CEO
- 20 users
- note.com/ono_shunsuke
- テクノロジー
- 2024/05/17
株式会社Algomaticの大野です。今週は、OpenAI、Googleから、大きな発表がありました。今回は、2社の発表を見ながら、要点をまとめ、解説・考察していきたいと思います。（※ なお、社内等で共有しているメモベースで箇条書き的な書き方になっております。読みづらいところがあるかもしれません。） ■ 追記：PIVOTさんでも、解説させていただきました。よければこちらも、御覧ください。 OpenAI Spring Update今回、大きく３つ、発表されました。 ① 最新のフラグシップモデル「GPT-4o」のリリース ② 新モデルの無料解放 ③ デスクトップアプリのリリース最新のフラグシップモデル GPT-4o「GPT-4o」は、今回のOpenAIのリリースの目玉でした。 GPT-4o とはマルチモーダル（多様なデータ形式）の組み合わせでの入出力を可能にしたモデルになっています。テ
OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
- 19 users
- gigazine.net
- テクノロジー
- 2024/05/14
OpenAIが日本時間の2024年5月14日(火)にAIモデル「GPT-4o」を発表しました。GPT-4oは単一のモデルでテキスト、音声、視覚入力を非常に高速に処理可能で、リアルタイムに会話しながら「計算問題を解く」「画像の生成」「周囲の映像から状況を判断」といったタスクを実行可能です。 Hello GPT-4o | OpenAI https://openai.com/index/hello-gpt-4o/ Introducing GPT-4o and more tools to ChatGPT free users | OpenAI https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/ GPT-4oはテキスト、音声、視覚入力を高速処理できるマルチモーダルなAIモデルです。GPT-4oの応答時間は平均320ミリ秒で、
GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
- 17 users
- zenn.dev/mattyamonaca
- テクノロジー
- 2024/05/14
今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。今回は、2024/05/14に発表されたGPT4oについてです。返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか？というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通りこのBBox検出は画像系機械学習モデルの基本的なタスクであり、自動運転の
- あとで読む
オープンAI 最新モデル「GPT-4o」発表音声の反応速度向上 | NHK
- 15 users
- www3.nhk.or.jp
- テクノロジー
- 2024/05/14
生成AIのChatGPTを手がけるアメリカのベンチャー企業「オープンAI」は処理スピードを速めて質問するとすぐに反応し、自然に会話ができる最新モデルを発表しました。IT各社も性能を高めた生成AIを次々と発表しており、開発競争が激しくなっています。「オープンAI」が13日、発表したのは最新モデル「GPT-4o」です。処理スピードを速めて文字と画像、それに音声による認識能力を大幅に向上させました。大きな特徴は音声の反応速度です。これまでのモデルでは反応の遅延がありましたが、このモデルでは質問すると人と同じように自然に会話ができるとしています。発表会では研究チームの担当者が「少し緊張しています。落ち着かせるのを手伝ってもらえますか」と尋ねると生成AIが「深呼吸して、あなたが専門家であることを思い出して下さい」と自然に回答する様子が紹介されました。また、通訳として2人の会話の間に入り英
- 人工知能
- AI
- software
- IT
- あとで読む
新モデルの追加と値下げ、ChatGPTのメモリ機能追加、「Sora」の発表…　『OpenAI GPT-4V／ChatGPT／GPTs 人工知能プログラミング実践入門』著者が語る、OpenAIの技術情報
- 14 users
- logmi.jp
- テクノロジー
- 2024/05/13
『OpenAI GPT-4V／ChatGPT／GPTs 人工知能プログラミング実践入門』著者の布留川氏は、登壇時点までのOpenAIの最新情報と、最新技術情報のキャッチアップ術について話しました。全4回。布留川氏の自己紹介布留川英一氏：それでは始めます。OpenAI本出版記念として、今日は「OpenAI最新技術情報と技術情報キャッチアップ術」について話そうと思います。最初に簡単に自己紹介をします。名前は布留川英一と申します。ハンドルネームはnpakaでやっています。株式会社ゼルペムに所属していますが、基本は個人でやっているようなものです。プログラム歴は40年と言っていますが、1984年の「ファミリーベーシック」みたいなものから始めたので、ちょうど40年ということでキリがいい数字でした。インターネット歴は大学に入った1994年からなので、ちょうど30年です。技術書歴は、最初に書いた
- 学習
- 技術
- AI
- 情報
- プログラミング
- programming
Introducing GPT-4o and more tools to ChatGPT free users
- 7 users
- openai.com
- テクノロジー
- 2024/05/14
In line with our mission, we are focused on advancing AI technology and ensuring it is accessible and beneficial to everyone. Today we are introducing our newest model, GPT-4o, and will be rolling out more intelligence and advanced tools to ChatGPT for free. GPT-4o is our newest flagship model that provides GPT-4-level intelligence but is much faster and improves on its capabilities across text, v
- ChatGPT
OpenAI、「GPT-4o」を発表、2倍速く、50％安く、～テキスト・音声・画像すべてを理解／新しい「ChatGPT」アプリも、Windows版は今年後半リリース予定
- 4 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/05/14
- 画像