並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 1262件

新着順 人気順

音声合成の検索結果161 - 200 件 / 1262件

  • 音声合成の強みは「永遠に残せること」、エンジニア気質の声優・小岩井ことり氏が分析

    音声合成技術の進化が目覚ましい。しかし、それを支えているのは声優などによる良質な収録音声だ。声をなりわいとする声優にとって、音声合成技術の普及は「仕事が奪われる」リスク要因でもある。 その音声合成技術を、現場の声優はどう見ているのか。音声合成ソフトウエア「ガイノイドTALK」や歌声合成ソフトウエア「VOCALOID」、声質変換ソフトウエア「リアチェンvoice」などに声を提供し、自身でも音声合成技術を活用しているピアレスガーベラ所属声優の小岩井ことり氏に聞いた。同氏は作詞や作曲なども手掛ける。(聞き手は東 将大、高野 敦=日経 xTECH) 音声合成技術の利点は何だとお考えでしょうか。 ピアレスガーベラ所属。TVアニメ「のんのんびより」宮内れんげ、「THE IDOLM@STER ミリオンライブ!」天空橋朋花などの声を担当する一方、TBSラジオで毎日流れるジングルの作詞作曲編曲を務めるなど作

      音声合成の強みは「永遠に残せること」、エンジニア気質の声優・小岩井ことり氏が分析
    • 「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか? NTT社会情報研究所が調査

      現代の音声合成技術は特定の人物の声を基にして、その人と非常に似た合成音声を生成する能力を持つ。このような実在の人物の声の合成は、なりすましや詐欺などの不適切な使用が問題視されていることに加え、声の再現や公開がその人物の人格的利益や名誉感情に影響を与える可能性もある。また声優や歌手のように、自らの声を職業活動に利用する人々にとっては、無許可での声の再現や使用によって経済的損失を被る恐れがある。 この研究の焦点は、特定の人物の音声データから学習させたモデルを用いて、任意のテキストをその人物の声で読み上げる合成音声技術にある。日本ではこの問題に関する具体的な法的争訟例はまだ存在しないとされるが、研究では架空の事例を設定し、この技術が引き起こしうる問題点を探究する。以下がその事例になる。(音声合成AIの利用場面における法的課題―「声」に権利はあるのか―より引用)。 声優Xは、所属するタレント事務所

        「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか? NTT社会情報研究所が調査
      • 商用可・無料のAI音声読み上げツール「VOICEVOX」、他アプリへの組み込みも可能なコアライブラリも公開/プロジェクトの保存、キャラの立ち絵、設定画面を追加するなど使い勝手も向上

          商用可・無料のAI音声読み上げツール「VOICEVOX」、他アプリへの組み込みも可能なコアライブラリも公開/プロジェクトの保存、キャラの立ち絵、設定画面を追加するなど使い勝手も向上
        • 商用可・無料のAI音声読み上げツール「VOICEVOX」にMac版が登場 ~最新プレビュー版【18:00追記】/ユーザーインターフェイス・機能も熟成。同梱のキャラクターは総勢5人に

            商用可・無料のAI音声読み上げツール「VOICEVOX」にMac版が登場 ~最新プレビュー版【18:00追記】/ユーザーインターフェイス・機能も熟成。同梱のキャラクターは総勢5人に
          • 25年前の名作SFアニメ「lain」がAIに 世界観に浸りながら主人公「玲音」とチャット

            アニメグッズなどの企画販売を手掛けるAnique(東京都千代田区)は9月5日、1998年放送のSFアニメ「serial experiments lain」がモチーフの対話型AIサービス「AI lain」の提供を始めた。6カ月の期間限定。チャット画面から文章を送るとヒロインの「玲音」(れいん)が文字と音声で返答する。開発には作品原案プロデューサーの上田耕行さんも参加した。 serial experiments lainはネットワーク端末「NAVI」が普及した世界で、主人公の岩倉玲音が事件に巻き込まれていくという内容のSFサスペンス作品。AI lainは米OpenAIの「ChatGPT」をベースに、作品内での会話内容を学習。世界観に沿った話し方をする。会話を続けると「親密度」が上昇し、話し方や画面に表示する玲音の映像が変化する。 音声合成機能もあり、生成した文章を玲音の声で読み上げる。合成エン

              25年前の名作SFアニメ「lain」がAIに 世界観に浸りながら主人公「玲音」とチャット
            • 喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション

              5月17日、ドワンゴがSeiren Voice(セイレンボイス)という、これまでにない新たなAI音声合成システムの販売を開始しました。これは、従来のTTS(テキスト to スピーチ)と呼ばれる文字を入力して音声合成とは異なり、人が喋った声を入力し、その発音の仕方、イントネーションやスピード、間の取り方などを、トレースするかのようにターゲットのキャラクタの声に置き換え、非常に高品位な音声合成を実現する、というものです。 今回、その第一弾製品として、「結月ゆかり」、「琴葉 茜・葵」が、それぞれ19,800円(税込)でダウンロード販売の形でスタート。Windows10/11用となっていますが、動作させるにはNVIDIAのある程度のスペックを持ったGPUを搭載していることが必須となっています。そのため、体験版もリリースされており、これを使うことで実際に自分のPC環境で動作させることが可能なのかチェ

                喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション
              • KAWAI、無料で楽譜を編集できる「スコアメーカーZERO エディター」を公開/歌声合成機能も搭載!

                  KAWAI、無料で楽譜を編集できる「スコアメーカーZERO エディター」を公開/歌声合成機能も搭載!
                • WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始|DTMステーション

                  CeVIO Creative StudioやCeVIO AIなどのエンジン部分を開発してきた株式会社テクノスピーチが2月24日、新たな歌声合成ソフト、「CeVIO Pro (仮)」(チェビオプロ)を発表するとともに、正式版リリースへの準備段階としてα版の無償配布を開始しました。このCeVIO Pro (仮)は、WindowsだけでなくMacでも動作するソフトであり、スタンドアロンで動作するとともに、WindowsおよびMacのVSTiのプラグインとしても動作するものとなっています。 またCeVIO Pro (仮)にはソングエディタともに、デフォルトボイスライブラリとして女性シンガーである「知声」(読み:ちせい、英語表記:Chis-A)が付属。ここで合成された歌声の波形データは個人/法人、商用/非商用を問わず、原則、無料で利用することが可能となっています。実際どんなものなのか、試してみた一方

                    WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始|DTMステーション
                  • 京都大学の教授が担当するAI講座「単なる人工知能・深層学習講座ではない」:今すぐ見られる無料ウェビナー10選 | Ledge.ai

                    株式会社レッジが開催中のAI・人工知能オンライン見本市「Ledge.ai EXPO 2021 秋」では、エヌビディア合同会社や株式会社日本HP、京大オリジナル株式会社などの無料ウェビナーを視聴できます。 本稿では、現在配信中の無料ウェビナーをご紹介します。Ledge.ai EXPO 2021 秋の開催日は2021年9月24日(金)まで。視聴期限はウェビナーにより異なります。気になる人は今すぐチェックしてください! わずか5分で電話対応を自動化、電話窓口改善のヒント モビルスが提供するAI技術を取り入れたボイスボット「MOBI VOICE」は、わずか5分で電話対応を自動化できます。ウォーターサーバーで知られる株式会社マイアクアの導入事例では、入電数を90%削減し、電話対応の50%を完全に自動化しました。 モビルス株式会社による無料ウェビナー「諦めてませんか?電話対応窓口の業務効率化 ~AI技

                      京都大学の教授が担当するAI講座「単なる人工知能・深層学習講座ではない」:今すぐ見られる無料ウェビナー10選 | Ledge.ai
                    • 「Gatebox」初代モデル、20年3月にサービス終了 初音ミク召喚不可能に

                      LINE傘下のGateboxは12月10日、“俺の嫁召喚装置”「Gatebox」の初代モデル(GTBX-1)のサービスを、2020年3月31日に終了すると発表した。キャラクターの投影や音声会話などができなくなる。ユーザーは10月発売の量産モデル(GTBX-100)と無償交換できるが、キャラとの会話内容などは引き継げない。 Gateboxは、円筒形の装置内に投影される3Dキャラ「逢妻ヒカリ」とコミュニケーションができるマシン。人感センサーで「マスター」(ユーザー)の動きを認識し、朝になると起こしたり、夜に帰宅すると出迎えたりしてくれる。 同社は2016年12月、初代モデルの予約販売をスタート。29万8000円(税別)と高額ながら、約1カ月間で300台を売り上げた。当初は逢妻ヒカリのみ召喚可能だったが、18年3月からはVOCALOIDキャラクターの初音ミクの召喚も可能になった。 この初代モデル

                        「Gatebox」初代モデル、20年3月にサービス終了 初音ミク召喚不可能に
                      • 高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表

                        スマートフォンやスマートスピーカー、銀行ATM、券売機など、あらゆる場面で合成音声が使われるようになって久しい。近年では特に機械学習技術を活用した音声合成システムの製品化やサービス化が進んでいる。 音声合成の研究開発や製品化を行う際には、学習素材として大量の音声が必要だ。しかし学習に適した上質な音声ファイルはネット上にもあまりない。いまだに素材を集めにくい状態にある。 これまでは研究開発用の素材を得るため「音素バランス文」と呼ばれる台本を用意し、それをアナウンサーや声優などに読み上げてもらい、まとまったデータを取得していた。 「しかし、これまでの音素バランス文には『使用料』『ライセンス』『台本の読みにくさ』3つのハードルがありました」 そう話すのは明治大学で音声合成の研究をしている小口純矢さんだ。音声合成ソフトの販売を手掛けるSSS(仙台市)と小口さんが所属する明治大学、九州工業大学は6月

                          高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表
                        • 達人出版会

                          探検! Python Flask Robert Picard, 濱野 司(訳) BareMetalで遊ぶ Raspberry Pi 西永俊文 なるほどUnixプロセス ― Rubyで学ぶUnixの基礎 Jesse Storimer, 島田浩二(翻訳), 角谷信太郎(翻訳) 知る、読む、使う! オープンソースライセンス 可知豊 きつねさんでもわかるLLVM 柏木餅子, 風薬 R/RStudioでやさしく学ぶプログラミングとデータ分析 掌田津耶乃 データサイエンティストのための特徴量エンジニアリング Soledad Galli(著), 松田晃一(訳) 実践力をアップする Pythonによるアルゴリズムの教科書 クジラ飛行机 スッキリわかるサーブレット&JSP入門 第4版 国本 大悟(著), 株式会社フレアリンク(監修) 徹底攻略 基本情報技術者教科書 令和6年度 株式会社わくわくスタディワール

                            達人出版会
                          • 著作権法第37条を使わない視覚障害者等向け読書支援サービス「YourEyes(ユアアイズ)」の衝撃【追記有】 | HON.jp News Blog

                            《この記事は約 7 分で読めます(1分で600字計算)》 株式会社ポニーキャニオンは11月26日、視覚障害者や学習障害者(ディスクレシア)向けの読書支援サービス「YourEyes(ユアアイズ)」を来年2月から開始することを発表しました。これはどういうサービスで、著作権の問題をどうクリアしたのでしょうか? YourEyesとは? YourEyesは、本のページをスマホアプリで撮影すると、文章をOCR(光学文字認識)で読み取り、合成音声で読み上げることにより、耳で読書ができるというサービスです。詳しくは、こちらのサービス紹介動画をご覧ください。 利用者はまず、YourEyesポータルサイトでアカウントを登録、スマートフォンにYourEyesアプリをダウンロードします(iOS版のみ / 個人は月額500円、法人・事務所は月額2500円 / Android版対応は現在のところ予定していない)。アプ

                              著作権法第37条を使わない視覚障害者等向け読書支援サービス「YourEyes(ユアアイズ)」の衝撃【追記有】 | HON.jp News Blog
                            • ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?

                              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 スイスのチューリッヒ大学に所属する研究者らが発表した論文「ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks」は、機械学習向け大規模データセットを作成するためのラベル付け作業(アノテーション)において、ChatGPTと人ではどちらがパフォーマンスが良いかを検証した研究報告である。 多くの機械学習モデルでは、学習やテストを行うために高品質なラベル付きデータを必要とする。科学の進歩のため、研究者が特定分野の大規模なラベル付きデータセットを作成して公開する。あとの研究者らは、このデータセット

                                ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?
                              • Amazonのオーディオブック「Audible」が聴き放題に、価格は据え置き 27日から

                                これまでは毎月配布していたコインと引き換えにオーディオブックを入手できたが、聞き放題サービスの開始に伴い、コイン制は終了する。ポッドキャストも引き続き聞き放題である他、新たにストリーミング再生にも対応する。 Audibleの逢阪志麻事業部長は「聴き放題になることでオーディオブックの利用時間は増加すると考えられる。そうすると出版社やクリエイターは今まで以上に作品を届けられる機会が増える。多くの人にとって、良い循環をもたらす」と説明。 「オーディオブックもポッドキャストも楽しめる、唯一無二のオーディオエンターテインメントサービスを目指す」と意気込みを語った。 併せて、「騎士団長殺し」や「海辺のカフカ」など村上春樹さんの書籍10作品のオーディオブックを配信することも発表。村上春樹さんは「これからはおそらく、多様な形式で小説は読まれていく。これまでになかった新しい可能性が生まれるといいと思う」とコ

                                  Amazonのオーディオブック「Audible」が聴き放題に、価格は据え置き 27日から
                                • 商用可・無料のAI音声読み上げツール「VOICEVOX」v0.12はテキストでキャラのスタイル指定が可能に/イントネーションをリセットする機能や全テキストを繋げて書き出す機能も

                                    商用可・無料のAI音声読み上げツール「VOICEVOX」v0.12はテキストでキャラのスタイル指定が可能に/イントネーションをリセットする機能や全テキストを繋げて書き出す機能も
                                  • DeepLearningについて、最近作ったもの、書いたもの、勉強したこと

                                    こんにちは!逆瀬川 ( @gyakuse ) です。 今日は最近作ったもの、書いたもの、勉強したことを備忘録的にまとめていきたいと思います。 なぜ書くのか、なぜ学ぶのか DeepLearningの普及以降、Attention Is All You Need以降、Hugging Faceでの民主化以降、そしてStable DiffusionやChatGPTの登場以降、どんどんAGIへの距離が短くなってきています。未来は想定より大きく変わりそうです。どったんばったん大騒ぎのときはみんなが分かっておくべきことは効率的に共有すべきで、そのために書いています。書くためには論文等を読む必要があります。そしてそのためには基礎からしっかり学ぶことが大事です。次の一歩をみんなで歩んでいくために、学び、書いています。 間違ったことを言うかもしれませんが、それでも誰かのためになれば嬉しいです。あと、個人的にはこ

                                      DeepLearningについて、最近作ったもの、書いたもの、勉強したこと
                                    • 萌えキャラを腐らせたくない 「東北ずん子」運営会社がAI向け学習データを無料公開、その狙いは

                                      東北地方を応援する萌えキャラの運営会社が、キャラの声を生かしたAI研究向け学習データを無料で公開している。直接的な収益にもならず、研究者に使ってもらえるとも限らないのに、なぜそのような取り組みを行っているのか。データを公開した萌えキャラ運営会社SSS(仙台市)の小田恭央CEOに話を聞いた。 萌えキャラ「東北ずん子」の運営会社 SSSは東北応援キャラ「東北ずん子」を運営する企業で、グッズの製作や地域振興イベントなど、ライセンスビジネスを展開している。ヤマハの歌声合成ソフト「VOCALOID」用音源の販売などは行っているが、AIの技術開発を行っているテクノロジー企業というわけではない。「AI向けの学習データを無料公開」といわれると少し唐突にも聞こえる。 同社は2019年11月、研究者向けに「東北きりたん歌唱データベース(DB)」を無料公開した。東北ずん子の関連キャラ「東北きりたん」の歌声を約1

                                        萌えキャラを腐らせたくない 「東北ずん子」運営会社がAI向け学習データを無料公開、その狙いは
                                      • AIがリアルな人の歌声を再現する「VoiSona」正式版が無償公開/追加ボイスライブラリ「さとうささら」の販売は遅延、「鬼龍院翔」「すぅ」の発売決定

                                          AIがリアルな人の歌声を再現する「VoiSona」正式版が無償公開/追加ボイスライブラリ「さとうささら」の販売は遅延、「鬼龍院翔」「すぅ」の発売決定
                                        • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                                          無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                            無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                                          • 無料で誰でも「ずんだもん」の声になれるのだ! AIボイチェン「ParakeetVC」でなりきってみた/現在はアルファ版。全109キャラクター&全機能が無料で使えるのは1月末まで!【やじうまの杜】

                                              無料で誰でも「ずんだもん」の声になれるのだ! AIボイチェン「ParakeetVC」でなりきってみた/現在はアルファ版。全109キャラクター&全機能が無料で使えるのは1月末まで!【やじうまの杜】
                                            • 曲名から自動で楽曲生成「ポンコツ自動作曲ちゃん」が話題 音楽は動画や配信でも利用可

                                              曲名を入力するだけで自動作曲できるWebサイト「ポンコツ自動作曲ちゃん」が話題になっている。作詞や作曲、Web制作などを手掛けるクリエイターのdaniwell(@daniwell_aidn)さんが制作したもので、好きな言葉を入れることで、数秒~数十秒程度の短めの音楽を自動生成する。同じ曲名を入力した場合は、全く同じ曲を生成するという。 生成した音楽は、WAVやMIDIで音源として、もしくはWebMやMP4で動画として保存できる他、SNSなどでシェアも可能。生成した音楽を投稿動画や配信で使いたい場合、「サイトのURLをどこか1カ所(説明文内や動画内など)に記載いただければ大丈夫」(daniwellさん)という。 関連記事 最新AIの描く絵が「ヤバすぎ」「個展開ける」と話題 文章から画像を生成する「DALL・E 2」、米OpenAIが発表 米AI研究企業OpenAIは、文章から画像を生成するA

                                                曲名から自動で楽曲生成「ポンコツ自動作曲ちゃん」が話題 音楽は動画や配信でも利用可
                                              • AIひろゆき、投げ銭で時給1万4273円稼ぐ

                                                AI音声合成サービスを提供するCoeFont(東京都港区)は4月21日、西村博之(ひろゆき)さんをモデルとする「AIひろゆき」にYouTubeで生配信をさせたところ、3時間で4万2820円の“投げ銭”が集まったと発表した。 AIひろゆきは、ひろゆきさんらしいコメントを生成するAIと、ひろゆきさんの声を再現した音声合成AIで構築したもの。コメント生成には大規模言語モデル「GPT-4」を活用。ひろゆきさんがしゃべりそうなことを教えたうえで文章を生成させ、CoeFontの音声合成AIで読み上げる仕組み。 配信は4月13日の午後6時から3時間実施。コメント欄から取得した視聴者の質問に応じてテキストを生成し読み上げた。配信画面には、AI画像生成技術を使って作成したひろゆきさんの画像を使用。読み上げの内容に応じた画像を用意して表示したという。 得た収益はひろゆきさんにも分配した。CoeFontによると

                                                  AIひろゆき、投げ銭で時給1万4273円稼ぐ
                                                • DeNA目線で見る 音声変換の最先端 - Qiita

                                                  (2021年5月13日追記)七声ニーナをリリースしました。DeNAの音声変換をご体験ください。 DeNAのAIシステム部、音声チームの豆谷と申します。私は2020年10月に新卒入社しましたが、2021年の新卒組として記事を書きます。 私は今まで音声合成や距離学習の研究をしてきて、音声変換(voice conversion;VC)については入社後キャッチアップしています。本記事では、DeNAの音声チームが注目する最先端の音声変換技術を紹介し、ユーザの喜びと驚きを生み出したいDeNA視点を交えながら解説します。 想定する読者は、音声変換に興味を持つ方、音声技術を生かして新たなエンタメ作りに挑戦したい方です。特に、 音声変換に関心がある学生がサクッと論文レベルで最先端の音声変換を把握できるようなお得な記事で 読者の「音声変換による新しいエンタメ作りに向けた研究開発の一歩」になる ように努めます。

                                                    DeNA目線で見る 音声変換の最先端 - Qiita
                                                  • 自分の声を人気キャラの声に変換 AIボイスチェンジャーをドワンゴが4月に発売

                                                    Seiren Voiceはユーザーが声を入力すると、キャラクターの音声に変換して出力するボイスチェンジャー。ドワンゴのAI研究部門「Dwango Media Village」が独自開発した声質変換エンジンを採用する。 ボイスチェンジャーにはリアルタイムに変換するものもあるが、Seiren Voiceは非リアルタイムに特定の人物の声に置換するもの。 入力音声を直接出力音声に変換するのではなく、音素や音の高さ、発音タイミングなどの要素に分解した後にキャラクターの音声として再合成する仕組み。ユーザーとキャラクターの声を対応付けた学習させなくていい点が特徴という。 関連記事 ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換 ドワンゴがディープラーニング技術を活用したボイスチェンジャー「Seiren Voice」をWebサイトで無償公開した。自分の声を100人分の声に変換できる。

                                                      自分の声を人気キャラの声に変換 AIボイスチェンジャーをドワンゴが4月に発売
                                                    • 歌声合成はさらに次の時代へ。Synthesizer Vがサンプルベースと人工知能のハイブリッドで大きく進化|DTMステーション

                                                      以前、「VOCALOIDの競合となるのか?中国人天才少年が開発した歌声合成ソフト、Synthesizer Vの破壊力」や「VOCALOIDの対抗馬、Synthesizer Vが無料で使えるWebブラウザ版を公開。2020年、歌声合成はさらに進化する」といった記事で紹介した歌声合成ソフトのSynthesizer Vがメジャーバージョンアップし、7月30日に世界同時発売されます。またこれと同時に、VOICEROIDで人気の「琴葉 茜・葵」のSynthesizer V専用歌声データベース、さらにSakiという新たな日本語の女性ボーカルのデータベースも発売されます。 この新しいSynthesizer Vの最大の特徴は、従来からあるサンプルベースの歌声合成と、最近話題のニューラルネットワークを用いた人工知能による歌声合成の両方を併せ持つハイブリッドエンジンを搭載したこと。これにより、とても自然な人間

                                                        歌声合成はさらに次の時代へ。Synthesizer Vがサンプルベースと人工知能のハイブリッドで大きく進化|DTMステーション
                                                      • 5 年前のおうちハックと今を比較してみた - 凹みTips

                                                        はじめに おうちハック関連の久しぶりの記事です。以前は自前で声や時計、スマホで操作できる家のシステムを作っていたのですが、スマートスピーカの登場以後そのシステムが置き換わっていき、今は完全に Google Home プラットフォーム上に乗っかる形で生活しています。その変遷や考えていること、今行っていることをまとめたくなり、今回記事を書いてみました。 当時の活動 2012 ~ 2015 年辺りまで未来のお部屋というタグでガジェットやサービスを連携させて生活を便利にしよう活動の記事を書いていました。おそらく当時の感じを一番説明できている記事はこちらです: tips.hecomi.com 2014 年当時のシステムとしては、音声認識と音声合成で返答する仕組みを作り、そこに WiFi 経由のガジェット操作、ZigBee 経由のリモコン、iRemocon を使った赤外線による家電操作、IFTTT を

                                                          5 年前のおうちハックと今を比較してみた - 凹みTips
                                                        • 【初音ミク】初期ミクさんと最近ミクさん、結構イメージの違いがあるよねって話「最近のミクさんネギ振ってない」

                                                          リンク Wikipedia 初音ミク 初音ミク(はつねミク、Hatsune Miku)は、クリプトン・フューチャー・メディアが発売しているバーチャル・シンガーソフトウェアとそのキャラクター。「電子の歌姫」の二つ名でも知られる。「ボカロ」という文化・ジャンルを築き、「初音ミク現象」によってネット発の文化・音楽シーンを大きく変化させたことから日本史の教材で「現代のIT技術が生み出した新たな文化の象徴的存在」と評価されている。 クリプトン社製のバーチャルシンガーで「ピアプロキャラクターズ」に分類される。 最初の製品はヤマハの音声合成エンジン「VO 74 users 3

                                                            【初音ミク】初期ミクさんと最近ミクさん、結構イメージの違いがあるよねって話「最近のミクさんネギ振ってない」
                                                          • 歌詞をテキストで流し込むだけで流暢に歌唱。MicrosoftのクラウドAIを駆使したボーカル音源が無償公開

                                                              歌詞をテキストで流し込むだけで流暢に歌唱。MicrosoftのクラウドAIを駆使したボーカル音源が無償公開
                                                            • 無料で使えるAI音声合成サービス「CoeFont STUDIO」商用利用も可 | Ledge.ai

                                                              サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                                無料で使えるAI音声合成サービス「CoeFont STUDIO」商用利用も可 | Ledge.ai
                                                              • 日本俳優連合が“生成AI”に提言 「新たな法律の制定を強く望む」 声の肖像権確立など求める

                                                                俳優・声優の権利保護活動を行う日本俳優連合は6月13日、「生成系AI技術の活用に関する提言」を発表した。著作権法の運用見直しやルール作り、「声の肖像権」の確立などを業界や国に求める。 提言内容は「国内外で活発に意見交換し、EUのAI規制を参考にしたガイドライン策定を行うこと」「著作権法の運用見直しをはかる」「AI生成作品であると明記すること」「AIの表現分野への進出について一定のルールを設けること」「声の肖像権を確立すること」。 日本俳優連合は「新しい技術の進化による人間社会の発展は望ましいこと」とする一方で、「実演家の、表現の模倣・盗用を安易に促し、職域を侵害する恐れがある」と問題視している。 「主体は人間であり、その補助をAIが行うという趣旨のもと、新たなガイドラインや法律の制定を強く望む」(日本俳優連合) 生成AIと俳優・声優を巡っては、実在の女優や女性声優などの画像を生成できる非公

                                                                  日本俳優連合が“生成AI”に提言 「新たな法律の制定を強く望む」 声の肖像権確立など求める
                                                                • 無料のAI音声合成ソフトVOICEVOXに、小岩井ことりさんによるNo.7が3種類の声で登場。でも、このリリースは序章に過ぎない!?|DTMステーション

                                                                  オープンソース・ソフトウェアとして公開されているAI音声合成ソフトであるVOICEVOXに、9月30日、また新たなキャラクタが誕生します。今回、3つのキャラクが同時に誕生するのですが、その一つが声優の小岩井ことり(@koiwai_kotori)さんCVによるNo.7です。昨年、AI歌声合成ソフトとしてフリーウェアのNEUTRINO用にNo.7がリリースされていましたが、今度はしゃべるソフトとしての誕生となります。普通のしゃべり声である「ノーマル」と、アナウンサーが読み上げるようにしゃべる「アナウンス」、そして絵本を読み聞かせるように読む「読み聞かせ」の3種類となっています。 このNo.7のプロジェクトは明治大学の専任准教授、森勢将雅(@m_morise)先生を中心に研究・開発されているもので、小岩井ことりさんもここに積極的に参加しつつ、私・藤本健も関わる形で進めてきました。ここで作られたデ

                                                                    無料のAI音声合成ソフトVOICEVOXに、小岩井ことりさんによるNo.7が3種類の声で登場。でも、このリリースは序章に過ぎない!?|DTMステーション
                                                                  • 人気VTuberのつぶやきをAIによる音声合成で本人の声で再現する「棒読みこち」がすごい

                                                                    ホロライブ所属の人気VTuberであるさくらみこさんの声を参考にAIによる音声合成を行い、さくらみこさん本人のツイートをそのまま読み上げる「棒読みこち」が公開されています。 さくらみこさんの声を参考にして作られた音声合成AI、棒読みみこち、生まれました‼️ みこちのツイートを、たまーに読み上げます‼️#miko_Art pic.twitter.com/QiQUvck4ME— 棒読みこち (@bouyomiko35) 例えば、以下のさくらみこさんのツイート。 ショーシャンクの空に みこが目の前が真っ暗になったら 思い出してまた観よう、と思った そんな名作でした???? 泣いたけど気持ちよくGW楽しんでいけるぜぇ! 必死に生きよう⛏#みこ市長— さくらみこ????SakuraMiko (@sakuramiko35) これを読み上げたものが以下。本人の声でツイートを読み上げています。やや人工的な

                                                                      人気VTuberのつぶやきをAIによる音声合成で本人の声で再現する「棒読みこち」がすごい
                                                                    • マークダウンファイルから日本語音声付き動画を作成できる「Video Puppet」を使ってみた! - paiza times

                                                                      どうも、まさとらん(@0310lan)です! 今回は、単純なマークダウンファイルから動画を生成してダウンロードできるWebサービスをご紹介します! ブログ記事を書くようにテキストデータを動画に変換できるうえ、自然な日本語音声も自動生成してくれます。また、画像や音楽などのメディアも挿入できるので、チュートリアル動画やPR動画などさまざまな作品を作ることができます。 現在はベータ版で全機能を無料で使えるため、動画作成にご興味がある方はぜひ参考にしてみてください。 【 Video Puppet 】 ■「Video Puppet」の使い方 それでは、最初に「Video Puppet」をどのように使うのか詳しく見ていきましょう! トップページにアクセスしたら、画面上部にある【SIGN UP】ボタンから無料のユーザー登録をしておきます。 (※登録しなくても制限付きで利用することは可能です) ユーザー名

                                                                        マークダウンファイルから日本語音声付き動画を作成できる「Video Puppet」を使ってみた! - paiza times
                                                                      • 機械学習を用いたテキスト正規化手法の最新動向 高精度を実現する仕組み

                                                                        2019年9月19日「MACHINE LEARNING Meetup KANSAI #6」が開催されました。関西のIT企業が協力して開催している機械学習エンジニアのためのコミュニティイベント「MACHINE LEARNING Meetup KANSAI」。第6回となる今回は、LINE、オムロン、パナソニックシステムデザインの3社がプレゼンテーションを行いました。「機械学習を用いたテキスト正規化手法の動向」に登壇したLINE株式会社の朴炳宣氏は、LINEにおける音声合成技術の紹介と、近年のテキスト正規化手法の動向を解説しました。 機械学習を用いたテキスト正規化の今 朴炳宣氏(以下、朴):ただいま紹介いただきました、LINE株式会社の朴でございます。大勢の方の前でしゃべることはなかなかないので緊張していますが、よろしくお願いします。 まず自己紹介からですが、私、名前から察していただけるように、

                                                                          機械学習を用いたテキスト正規化手法の最新動向 高精度を実現する仕組み
                                                                        • AI Voice Generator & Text to Speech

                                                                          Rated the best text to speech (TTS) software online. Create premium AI voices for free and generate text-to-speech voiceovers in minutes with our character AI voice generator. Use free text to speech AI to convert text to mp3 in 29 languages with 100+ voices.

                                                                            AI Voice Generator & Text to Speech
                                                                          • 「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがすごいの? 商用可能でMac対応でほぼ人間

                                                                            経歴だけは長いベテラン記者・編集者の松尾(マツ)と、幾つものテック系編集部を渡り歩いてきた山川(ヤマー)が、ネット用語、テクノロジー用語で知らないことをお互い聞きあったり調べたりしながら成長していくコーナー。交代で執筆します。 マツ 来ましたね。音声合成の時代が。 ヤマー 音声合成ソフト、昔から存在していて息が長い領域だと思ってたんですが、ここ最近立て続けに新作が発表されましたね。 1.6万円で商用利用も可 AI読み上げソフト「VOICEPEAK」登場 7音源付属、Win・Mac・Linuxに対応 無料で商用利用可なAI歌声合成ソフト「CeVIO Pro」近日公開へ Win・Mac対応 マツ 「VOICEPEAK」と「CeVIO Pro」、この2つの発表にはいくつかの共通点があるんですね。 ヤマー なるほど、読み上げと歌声の違いはありますが。 マツ 歌声合成と音声合成には共通する技術基盤が

                                                                              「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがすごいの? 商用可能でMac対応でほぼ人間
                                                                            • “互いを罵り合いながら『オーバーウォッチ』をするトランプvsバイデン”のゲーム実況動画が大人気。AIを使った悪ふざけはここまできた - AUTOMATON

                                                                              オンラインゲームをプレイしながら罵り合う米国の歴代大統領たちの動画が、話題になっているようだ。コンテンツクリエイターのVortex氏が音声合成AIを用いて作成した動画は、その滑稽さからTikTokやTwitterで反響を呼んでいる。 TikTokで100万回以上「いいね」されているこの動画は、現米国大統領のバイデン氏と前大統領であるトランプ氏がオンラインマルチプレイヤーゲーム『オーバーウォッチ』をプレイしながら、互いを罵り合うという内容のもの。実際に以下の動画を見てもらったほうが早いだろう。 動画では、ふたりがなにやら口喧嘩をしている。一体何を話しているか見ていこう。動画の冒頭、自チームのボイスチャットに「おぉDORADOか、このマップ好き、懐かしい」と独り言を漏らすバイデン氏。「もしかして、ジョー(バイデン)。またお前がこの俺のチームにいるのか?」とトランプ氏が反応。続けて「GG」「負け

                                                                                “互いを罵り合いながら『オーバーウォッチ』をするトランプvsバイデン”のゲーム実況動画が大人気。AIを使った悪ふざけはここまできた - AUTOMATON
                                                                              • 19歳の学生社長が音声合成サービス開発、3日でユーザー5万人 AIの勉強はWeb授業とインターンで

                                                                                早川さんによれば、すでにCoeFont Studioで作成した音声をプラネタリウムの案内に使ったり、企業の採用VTRに使ったりする例が出てきているという。早川さんはこういった利用方法について「有料にしていなかったら出なかったと思う。(開発する)自分でも想像していなかった」としている。 学生とAI企業の社長、二足のわらじを履く早川さんがどういった背景でCoeFont Studioを立ち上げるに至ったのか、そして今後どのような形でサービスを展開し、収益につなげていくのかを聞いた。 きっかけは友達とのゲーム? 「結構使えるものができてしまった」 そもそも、CoeFont Studioはどういった経緯で生まれたサービスなのか。早川さんはきっかけとなったのは「ゲーム実況」だったと話す。 「もともとゲームが好きで、友人と話しながらよく遊んでいた。昔は『ゲーム実況で世界を獲ろう』と思い、プレイの様子を録

                                                                                  19歳の学生社長が音声合成サービス開発、3日でユーザー5万人 AIの勉強はWeb授業とインターンで
                                                                                • イヤホン配信を支える音のプログラミング〜Accelerate編〜 - Mirrativ Tech Blog

                                                                                  こんにちは。shogo4405です。本エントリーは、iOSエンジニア向けにイヤホン配信を支える音のプログラミング入門 - Mirrativ Tech BlogのiOS実装を紹介したいとおもいます。 本稿では、音声信号処理の実装手法としてAppleが提供するAccelerateフレームワークの利用方法を解説しています。音声の信号処理は、AccelerateのvDSPの関連の関数を利用します。 はじめに Accelerateを導入した背景は、for文での実装では、Mirrativで扱うライブ配信の処理速度に合わず体験的に良くありませんでした。そこで、Accelerateを導入することで処理速度の向上に寄与し満足できる体験になったため採用にいたりました。*1 サンプルデータ せっかくなので自分で音声データを作ってみましょう。sin波によるド・レ・ミ・ファ・ソ・ラ・シ・ドのラ(440hz)の音デー

                                                                                    イヤホン配信を支える音のプログラミング〜Accelerate編〜 - Mirrativ Tech Blog