AI

AIボイスチェンジャーを試してみた

#urugus posted on 2023-05-30

名探偵コナンのボイスチェンジャーが現実のものになりました。

蝶ネクタイの男の子

先日、テレビで音声生成 AI で総理の声を再現する映像を見て驚きました。

その技術について興味を持ち、実際に試してみたので共有したいと思います。

どうやってやるか

音声モデルの作成には RVC WebUI というライブラリを使う
- Google Colaboratory 版を利用するのが環境依存がないため便利
- GUI でポチポチ選択して設定しながら進めることができる
リアルタイム変換には VC Cientが使える

必要なもの

学習させる音声データ
- 多いほど精度はあがる
- 合計 5 分ほどのデータで試してみたが、かなり精度が高く驚いた
各種ライブラリ
- RVC WebUi
- CV Client

手順

graph TD

subgraph rvc["RVC WebUI"]
  model["音声モデルを生成する"]
end

subgraph cvc["CV Client"]
  change["モデルを使ってリアルタイム変換する"]
end


model --> cvc

手順詳細は以下が参考になります。

仕組み

「図解】超高性能 AI ボイスチェンジャー「RVC」のしくみ・コツ」という記事を見つけましたが、ふんわりとしか理解できませんでした。

参考にした記事

tags:

ActiveRecord(1) AI(2) blog(1) chat gpt(1) CI(1) clean code(1) DNS(1) 読書会(2) Editor(2) emacs(1) Enum(1) FCM(1) firebase cloud functions(1) firebase hosting(1) Frontend(2) frontend design(2) gcp(1) GitHub(1) github actions(1) GKE(1) GraphQL(5) Jest(1) 集約(1) 開発環境(3) キーボード(1) Kubernetes(1) Neovim(1) Next.js(1) Next14(1) nextjs(1) Obsidian(1) Push通知(1) Rails(8) React(4) react-native(1) react-native-size-matters(1) Rspec(2) shell(1) SQL(2) storybook(1) techblog(2) terraform(1) TypeScript(2) Vim(1) zola(2)