Skip to content

Convert the UTAU sound source folder to a configuration compatible with DiffSinger

License

Notifications You must be signed in to change notification settings

c7e715d1b04b17683718fb1e8944cc28/Voicebank2DiffSinger

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

29 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Voicebank2DiffSinger

UTAUの音源ファイルからSOFAとMakeDiffSingerを用いて、学習前のデータセットを生成する

前提要件

  • C++ によるデスクトップ開発 (Visual Studio)
  • CMake
  • Python 3.12未満 (3.10.11にてテスト済み)

使い方 (Windows)

  1. このリポジトリをsubmoduleを含めcloneする
    git clone --recursive
  2. 仮想環境を構築し、入る
    python -m venv .venv
    .venv/scripts/activate
  3. 必要なモジュールをインストールする
    pip install -r requirements.txt
    pip install -r src/SOFA/requirements.txt
    pip install -r src/MakeDiffSinger/acoustic_forced_alignment/requirements.txt
    pip install -r src/MakeDiffSinger/variance-temp-solution/requirements.txt
  4. PyTorchの公式サイトにて、セットアップをする
  5. 日本語のSOFAモデルをダウンロードし、解凍後中にある「japanese-v2.0-45000.ckpt」を「src/cktp」に配置し、同じく「japanese-dictionary.txt」を「src/dictionaries」に配置する
  6. src/main.py の args に音源フォルダを一つ(もしくは複数)渡し起動する
    python src/main.py example/A3 example/A2 example/A4

About

Convert the UTAU sound source folder to a configuration compatible with DiffSinger

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages