[B! ai] fashiのブックマーク

ESET、サイバーセキュリティアシスタント「ESET AI Advisor」を発表／担当者のセキュリティスキル不足、スキルレベルの差を解消

fashi 2024/05/31

リンク

AI作曲サービスは「長さ」の戦いに。Udioが2分10秒の生成に対応、Sunoは全ユーザーに4分生成を開放（CloseBox） | テクノエッジ TechnoEdge

AI作曲サービスは、Sunoが先行し、UdioとSonautoがそれを追いかける図式となっています。そのSunoとUdioが相次いで製品強化を発表しました。まずは、Udio。一度に32秒しか生成できないというUdio最大の弱点が改善されたバージョンを提供開始しました。今度は最大2分10秒の生成が一度で可能となります。 Udioは2分10秒の生成が可能に。ただし今使えるのは月額30ドルProユーザーのみ新バージョン「Udio-130」には、このほかに、プロンプトと歌詞の強度、ハッシュ値、生成をスタートするタイミングなどを調整できる機能も追加されています。 Stable Diffusionに近いパラメータ操作が可能になったわけです。音質パラメータも加わっています。生成をスタートするタイミングはExtendで曲を延長するときに便利でしょう。さて、このUdio-130ですが、サブスクリプション

fashi 2024/05/31

ai

リンク

【西川和久の不定期コラム】初心者も簡単！ついにPCで104BのLLMも動かせるようになった！そして巷を騒がせるマルチモーダルも試した

fashi 2024/05/30

ai

リンク

Googleが間違いだらけのAI検索を手動で修正中との報道、AI検索を回避する個人開発サービスも登場

Googleは、検索結果にAIで生成した概要を表示する「AIによる概要など(AI Overviews)」を2024年5月14日にアメリカで正式リリースしました。このAIオーバービューを巡って「あきらかに間違った情報が表示される」という問題が多数指摘されているのですが、新たにGoogleがAIのおかしな回答を手動で削除している可能性が浮上しました。 Google scrambles to manually remove weird AI answers in search - The Verge https://www.theverge.com/2024/5/24/24164119/google-ai-overview-mistakes-search-race-openai AIオーバービューは検索結果の上部にAIで生成した「検索結果の概要」を表示する機能で、例えば「布地のソファを掃除するに

fashi 2024/05/29

「「Konami code」は「裏技コード」を指す用語」

ai
google

リンク

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に（CloseBox） | テクノエッジ TechnoEdge

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。バージョン3.5のEarly Access版（有料プランユーザーのみに提供）を利用すると、これまでの2分間制限が最長4分まで拡大。延長時間も従来の1分を2分に伸ばしています。これだけの長さがあれば大抵のポピュラー曲はエンディングまでいけます。 4分の曲をUdioで生成しようとすると、8回の命令が必要になります。さらに、生成に要する時間はUdioの方がはるかに長くかかるので、全体としての作業時間には大きな差が生じます。それがSuno 3.5ならば数秒でできてしまうのです。また、Style of Musicのキーワードがサジェストされるようになっていて便利です。文字数制限は相変わらずきついですけど。さらにうれしいのは、日本語歌詞の読み方が、従来は間違いが多かったのが、ほぼ問題な

fashi 2024/05/26

ai

リンク

Google検索の生成AI「AI Overview」、「ピザに接着剤」「犬がNBAでプレイ」などと回答　Redditとの提携の影響か

米Googleが現在Google検索でプレビューとして提供している生成AI「AI Overview」（旧SGE）のおかしな回答が、5月23日ごろからSNSで話題になっている。例えば、「チーズがピザにうまくくっつかない」という検索に対し「無害な接着剤を8分の1カップほど、ピザソースに混ぜる」というアドバイスを表示したという。この他、犬がNBA（米国のプロバスケットリーグ）でプレイしたことがあるという回答の画像のポストや、バットマンは警官だという画像のポストがあった。 Filecoin Foundationで法務顧問を務めるクルト・オプサール氏は自身のポストで、ピザに接着剤という回答のソースは米Redditに11年前に投稿されたジョークのようだと、投稿の画像を添えて指摘した。 Googleは4月、RedditのデータをAIトレーニングで利用可能にする提携拡大を発表した。米OpenAIも同様の

fashi 2024/05/24

うそはうそであると見抜けるAIでないと(掲示板を学習させるのは)難しい

AI

リンク

「PowerToys 0.81」公開、超強力なクリップボード加工ツールを追加／プレーンテキスト貼り付け、Markdown貼り付け、なんでもござれ、AIの力も！

fashi 2024/05/22

リンク

AIが「心の理論」テストで人間超え、この結果は何を意味するか

人工知能(AI)モデルが、人間の感情理解力を測るテストで人間並み、時に上回る成績を収めたことが分かった。ただ、訓練データにそうしたタスクが含まれていた可能性も否定できず、大規模言語モデルが「人のように」考えているわけではない。 by Rhiannon Williams2024.05.22 275 21 人間は複雑な存在だ。私たちのコミュニケーションの方法は多層的であり、心理学者たちは対話から意味や理解を推測する能力を測るためのテストを数多く考案してきた。人工知能（AI）モデルは、こうしたテストでますます優れた結果を出している。ネイチャー・ヒューマン・ビヘイビア（Nature Human Behavior）に5月20日に掲載された新たな研究によると、一部の大規模言語モデル（LLM）は人の心理状態を追跡する能力（いわゆる「心の理論」と呼ばれる）を測るために設計されたタスクを与えられた場合、人

fashi 2024/05/22

正解を学習したら何でもいけるっしょ。そもそもテストというのは大概自分の考えを出力する場ではなく出題者が求めている模範解答を当てるゲームになりがちだ

ai

リンク

GPT-4oに対応した「Copilot」が凄すぎる！ AIが「マインクラフト」の画面を見て会話でアドバイス「Oh no! It's a Zombie！」／【やじうまの杜】

fashi 2024/05/21

ai
chatgpt

リンク

ハイセンス、AIお姉さんがテレビの疑問に答える接客サービス

fashi 2024/05/21

ai

リンク

GeminiがYouTube動画を一瞬で要約してくれるようになった（しかも無料） | ライフハッカー・ジャパン

YouTubeにアップされている何十億もの動画のうち、あなたが一生に目にするのはごく一部でしょう。重要なポイントだけを知りたいのに、そこにたどり着くまでにたくさんのことに目を通さなければならない動画もあります。それは無駄な時間です。もし、視聴する動画の重要な情報を要約することで、視聴時間を短縮できるとしたらどうでしょう？幸いなことに、GoogleのAIチャットボットであるGeminiには、YouTubeの拡張機能が組み込まれており、デフォルトで有効になっています。

fashi 2024/05/21

公開リンクとダークモードの設定しかない

ai
google

リンク

最近ローカルLLMがアツいらしい

最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し

fashi 2024/05/20

ai
読み物

リンク

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能 | テクノエッジ TechnoEdge

Googleは5月14日～15日（現地時間）、年次開発者会議イベント Google I/Oを開催しました。スマートフォンのPixel 8aはイベント直前に発表されていたこともあり、AI一色だったGoogle I/Oですが、一般ユーザーに身近に感じられそうなのが、有料サービス Gemini Advancedに加わった多数のアップデートでしょう。 Google One AI Premium加入者が利用できるGemini Advancedについて、高性能な Gemini 1.5 Proの解禁など、新機能を発表しています。 Gemini 1.5 Proが利用可能にまず大きなところでは、最新のAIモデル「Gemini 1.5 Pro」が、日本語を含む35以上の言語・150か国以上において、Gemini Advancedで利用可能となります。 Gemini 1.5 Pro自体は2月に発表されており、開

fashi 2024/05/18

AI
google

リンク

パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現

fashi 2024/05/15

リンク

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」？ | テクノエッジ TechnoEdge

問題の部分は、動画開始後1分を過ぎたあたり。レトロなフィルムカメラを手に持つ青年が、「なんでレバーが最後まで動かないの？」と質問したところ、GoogleのAIは即座にいくつかの回答を提示し、最後に最も最適と思われる答えを強調表示しました。ところが、その強調された答えは「裏蓋を開けて、そっとフィルムを取り出す」というものでした。もし、フィルムカメラ世代の人々やカメラ好きな人々がこの答えを示されたなら、きっと慌てることでしょう。 (▲画像：「裏蓋を開けてそっとフィルムを取り出す」回答をハイライト。) 手巻き式のカメラでフィルム巻き上げレバーが途中で止まるようになったら、それはいま使っているフィルムカートリッジの撮影可能枚数が終了したことを意味します。そうなった場合は、カメラ内にあるフィルムをカートリッジ内に完全に巻き戻してから取り出し、現像にまわすというのが正しい手順です。ところがGoo

fashi 2024/05/15

ai

リンク

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

fashi 2024/05/13

「RTX A6000（GDDR6 48GB）搭載PCでやっと動作しました」何はなくともVRAM

ai

リンク

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援アトラシアンは、同社製品およびGoogleドライブやGitHubなどサードパーティのサービスを横断してAIが情報を学習し、統合的な検索やチャットによる回答を実現することでユーザーを支援してくれる新しいAIサービス「Atlassian Rovo」を発表しました。 AI breaks down yet another barrier! Today at Team '24 we announced Atlassian Rovo – a new product that unleashes a company’s knowledge so teams can make better decisions faster.

fashi 2024/05/13

ai

リンク

結局ChatGPTとGemini、Claudeのどれを使えばいい? 色々比較した

fashi 2024/05/09

ai
chatgpt

リンク

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集 | テクノエッジ TechnoEdge

こうした動きと並行して、OpenAIは一部の映像クリエイターにSoraを試用してもらい、その作品を積極的に公開しています。中でも僕が注目したのは、「パンクロック・ピクサー」の異名を持つshy kidsというカナダの映像プロダクションが制作した「Air Head」です。これは頭が黄色い風船で出来ている主人公が、自転車に乗ったり、サボテンだらけの通路を歩いたり、風に飛ばされた頭を胴体が追いかけるといった内容の、アイデアに満ちていてAI生成動画の可能性を示す1分21秒の小品でした。ところが、4月半ばにfx guideというオンラインメディアがshy kidsを取材して、Soraの実際の使用感を語った”Actually Using SORA”という記事を掲載したのです。それによると、Soraも他の動画生成AIと同じく、どのような映像が生成されるかはスロットマシン（昨今の日本風にいえば、ガチャ）の

fashi 2024/05/07

ai

リンク

AI性能を重視したIntel第14世代SoC「Core Ultra」に搭載されたNPUの性能とは？

Intelが2023年12月に正式発表した第14世代CoreプラットフォームのノートPC向けプロセッサ「Core Ultra」は、2023年9月に発表されたMeteor Lakeアーキテクチャがベースになっています。そんなCore UltraにはAI処理に特化したニューラルプロセッシングユニット(NPU)が搭載されており、このNPUについて海外メディアのChips and Cheeseが解説しています。 Intel Meteor Lake’s NPU – Chips and Cheese https://chipsandcheese.com/2024/04/22/intel-meteor-lakes-npu/ Core Ultraに搭載されたNPUは「NPU 3720」と呼ばれています。そんなNPU 3720には2つのニューラルコンピューティングエンジン(NCE)タイルが搭載されており、こ

fashi 2024/05/06

「NPUでStable Diffusionを実行するのは、フラストレーションがたまります」 iGPUより遅いんだ…

リンク

はてなブックマーク

タグ

関連タグで絞り込む (42)

aiに関するfashiのブックマーク (272)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス