音声処理の人気記事 7件 - はてなブックマーク

1 - 7 件 / 7件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

音声処理の検索結果1 - 7 件 / 7件

「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化
- 953 users
- www.buzzfeed.com
- テクノロジー
- 2019/09/02
Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you. 「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化2月にβ版がリリースされたGoogle製の音声文字変換（Live Transcribe）アプリ。もともと聴覚障害者のために作られたアクセシビリティ機能だが、精度の高さから文字起こしとしても使えるのではないかと話題だ。来日中のプロダクトマネージャー、ブライアン・ケムラー氏に話を聞いた。
3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した（CloseBox） | テクノエッジ TechnoEdge
- 737 users
- www.techno-edge.net
- テクノロジー
- 2023/08/28
わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の本人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば本人に似た声を生成できるのです。
- AI
- あとで読む
- 技術
- 音声合成
- voice
- 機械学習
- 英語
- 音声
- 人工知能
- oss
高性能で無料、誰の声にでもなりきれるAIボイチェン「RVC WebUI」がついに日本語表示に対応（CloseBox） | テクノエッジ TechnoEdge
- 622 users
- www.techno-edge.net
- テクノロジー
- 2023/04/17
オープンソースのAI声質変換（ボイスチェンジャー）ソフトウェア「RVC WebUI」が、日本語での表示に対応しました。 VITSという声質変換技術をベースにしたRVC（Retrieval-based Voice Changer）に、Webユーザーインタフェースを付加したのが「RVC WebUI」です。
- AI
- あとで読む
- 音声合成
- webサービス
- 技術
- 日本語
- ソフトウェア
- 音声
- 音声処理
- 変換
AI歌声合成は、もう人の歌声と区別できないレベルに。東北イタコも追加されたNEUTRINOの新バージョン、0.400が無料でリリース｜DTMステーション
- 608 users
- www.dtmstation.com
- テクノロジー
- 2020/09/18
今年に入り、AI歌声合成の動きが激しく、その進化のすごさ、クオリティーの高さには驚くばかりです。中でも注目すべきは今年2月に彗星のように登場し、フリーウェアとして公開されたNEUTRINO（ニュートリノ）です。これはSHACHI(@SHACHI_NEUTRINO)さんが開発するフリーのソフトであり、これまで東北きりたん、謡子、そしてJSUT（いずれも学術的に公開されている歌声データベースを利用して開発している）の3つの歌声ライブラリが同梱されてました。そこに9月18日、新たに東北イタコが追加されたのです（9月18日現在、公開されている0.400には東北きりたん、東北イタコのみが同梱。それ以外については後日公開される模様です）。先日、「AIきりたんに次ぐ第2のAIシンガー、東北イタコの歌唱データベース制作プロジェクトのクラウドファンディングスタート」という記事でも紹介し、無事にクラウドファ
- AI
- あとで読む
- vocaloid
- 技術
- DTM
- 音楽
- 機械学習
- ボカロ
- これはすごい
- テクノロジー
19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界｜DTMステーション
- 576 users
- www.dtmstation.com
- アニメとゲーム
- 2021/05/07
4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO（コエ・フォント・スタジオ）は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先
- 技術
- あとで読む
- サービス
- webサービス
- ビジネス
- 音声
- DTM
- font
- 会社
- sound
Clubhouse リアルタイム配信の仕組みについて (妄想編)
- 546 users
- zenn.dev/voluntas
- テクノロジー
- 2021/01/30
Cloubhouse はすでに OSS である Janus Gateway に切り替えており Agora は使用していないようですライセンス Creative Commons — 表示 - 非営利 - 改変禁止 4.0 国際 — CC BY-NC-ND 4.0 前提 @suthio_さんがつぶやいていたのがきっかけ https://twitter.com/suthio_/status/1353945619577008128?s=20 招待してくれた @dmnlk さんに感謝 DNS パケット見ただけ他の方の解析は見ていないクライアント側の処理は知らない気が向いたら更新している著者商用 WebRTC SFU 開発者 WebRTC プロトコルスタック実装者 End to End Encryption プロトコルスタック実装者 IRIAM 配信サーバ設計者妄想求人にメディアサーバ
- clubhouse
- WebRTC
- あとで読む
- webサービス
- SNS
- server
- network
- privacy
- サーバ
- architecture
Clubhouse リアルタイム配信の仕組みについて (解説編)
- 535 users
- zenn.dev/voluntas
- テクノロジー
- 2021/02/14
Cloubhouse はすでに OSS である Janus Gateway に切り替えており Agora は使用していないようですライセンス Creative Commons — 表示 - 非営利 - 改変禁止 4.0 国際 — CC BY-NC-ND 4.0 前提ざっくりと雑に解説。どんな技術を使っていてこんな感じだろうという妄想は以下をどうぞ。 Clubhouse リアルタイム配信の仕組みについて (妄想編) 著者商用 WebRTC SFU 開発者 WebRTC プロトコルスタック実装者 End to End Encryption プロトコルスタック実装者 Clubhouse の仕組みはとてもシンプルで配信者が N 人で、それを数千人が聞くという co-streaming と呼ばれる仕組みの一つ。この方式は今までは主に映像ありでパネルディスカッション的な使い方が主だっだ。それを
- clubhouse
- あとで読む
- WebRTC
- webサービス
- ネットワーク
- network
- SNS
- 技術
- 開発
- web