メモ 音声合成
球体ちゃんの声を任意に生成するには?
キーワード:音声分析合成 分野限定合成 GAN pix2pix
課題:文章読み上げと叫び声、喘ぎ声ではだいぶ勝手が異なりそう。用意できる学習データが圧倒的に少なそう。
学習した声そっくりの音声が出せるエンジン(指定された英文を読み上げる必要あり)
自分の声をそのまま好きな人物の声にしたい系記事
http://joisino.hatenablog.com/entry/2017/12/24/000000
https://blog.hiroshiba.jp/became-yuduki-yukari-with-deep-learning-power/
棋譜読みちゃん(分野限定合成)
https://readyfor.jp/projects/Kifuyomi
Jupyterで対話的に使える(かも?)
http://r9y9.github.io/blog/2017/08/16/japanese-dnn-tts/
本家の音声データをサンプリングするにあたって日本の著作権法を考慮する。
https://storialaw.jp/blog/4936
モデル生成においてあくまで情報解析というスタンスであれば著作物の記録や翻案が可能。
なお、「非営利目的の利用」に限定されていない