poi’s tech blog

3D多人数同時接続型球体アクション成人向けゲーム開発のためのアイデア、ナレッジ

メモ音声合成

球体ちゃんの声を任意に生成するには？

キーワード：音声分析合成分野限定合成 GAN pix2pix

課題：文章読み上げと叫び声、喘ぎ声ではだいぶ勝手が異なりそう。用意できる学習データが圧倒的に少なそう。

学習した声そっくりの音声が出せるエンジン（指定された英文を読み上げる必要あり）

https://ledge.ai/lyrebired/

自分の声をそのまま好きな人物の声にしたい系記事

http://joisino.hatenablog.com/entry/2017/12/24/000000

https://blog.hiroshiba.jp/became-yuduki-yukari-with-deep-learning-power/

棋譜読みちゃん（分野限定合成）

https://readyfor.jp/projects/Kifuyomi

Jupyterで対話的に使える（かも？）

http://r9y9.github.io/blog/2017/08/16/japanese-dnn-tts/

本家の音声データをサンプリングするにあたって日本の著作権法を考慮する。

https://storialaw.jp/blog/4936

モデル生成においてあくまで情報解析というスタンスであれば著作物の記録や翻案が可能。

なお、「非営利目的の利用」に限定されていない