タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

音声合成に関するkat0usiのブックマーク (3)

  • AI技術により超高精度な歌声合成を実現

    株式会社テクノスピーチ(所在地:名古屋市千種区、代表取締役:大浦 圭一郎、以下 テクノスピーチ)と国立大学法人名古屋工業大学 国際音声言語技術研究所(所在地:名古屋市昭和区、代表:徳田 恵一、以下 名古屋工業大学)は、このたび人間の声質・癖・歌い方をこれまでになく高精度に再現できる歌声合成技術を開発いたしました。 ​ テクノスピーチと名古屋工業大学は共同で音声合成・歌声合成技術の研究・開発に取り組んでおり、これまでに業務用カラオケ機器「JOYSOUND」や音声創作ソフトウェア「CeVIO Creative Studio」等に音声合成・歌声合成技術の導入を進めてきました。研究では、特定の歌唱者の約2時間の歌声データベースに対して、深層学習等のAI技術を適用することにより、歌唱者の声質・癖・歌い方を学習しました。合成の際は、任意の歌詞付き楽譜を入力するだけで高品質な歌声を合成することができま

  • 自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか

    2017年、米Googleや米Amazonなどの「スマートスピーカー」と呼ばれるデバイスの普及が日で始まった。例えば、「ねえGoogle、今日の予定は?」と話しかけると、カレンダーアプリに入力していた予定を流ちょうな日語で読み上げてくれる。中に人がいるわけではない。デバイスが人の声を認識し、応答となる声を合成しているのだ。 このデバイスが音声で応答するために使用しているコアの技術は、「音声認識」と「音声合成」という2つの技術だ。音声認識は人の声の波形を機械で処理し、どんな文であったかを推定する技術音声合成は与えられた文やデータから、人が話す音声を合成する技術だ。 ここに、音声認識で推定した文に対して適切な応答文を出力する「対話制御」という技術が加わり、「人の話を聞いて適切な応答を音声で返す」という一連の動作を実現している。 音声認識・合成ともに、コンピュータを利用した研究は1950年

    自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか
  • Android JaTTS - namespace gimite

    サンプルアプリケーションを試す † Androidの 設定→アプリケーション→提供不明のアプリ にチェック。 以下のQRコードまたはJaTTSDemo-0.0.2.apkからダウンロード。 注意: サーバで音声に変換する方法なので、ネットワークに繋がっていないと使えません。 少し時間がかかります。ネットワークやサーバの状態によりますが、しゃべり始めるまでにだいたい3〜5秒はかかります。 入力内容はすべてサーバに送られます。 サーバが落ちていたりして失敗する場合があります。エラーが出る場合はしばらくしてから再度試してください。 ↑ ライブラリを使う † android-jatts-0.0.2.jar をダウンロードしてAndroidアプリケーションのプロジェクトに追加。 AndroidManufest?.xmlにINTERNETパーミッションを追加。 <manifest> ... <uses

    kat0usi
    kat0usi 2010/08/31
    実行時にIOExeptionが発生するけど今後を期待 id:Gimite /system/bin/chmod がなくて例外出てました。CM6.0(froyo)onHT03Aだと/system/xbin/chmod だからっぽいです。ln -s してうまく動きました!
  • 1