fc2ブログ

UTAUの本家新エンジン「doppeltler」が公開されました。

UTAU開発者の飴屋/菖蒲様より、将来のUTAUバージョンアップに先立って、64bit、マルチスレッド対応の新しいUTAU用音声合成エンジン「doppeltler」が1月12日に公開されました。

小生が代理配布している和音マコ連続音音源を使って、UTAU標準のresamplerエンジン、以前より飴屋様にて公開されているfresampエンジンと、音質、およびレンダリング速度の違いについて検証してみました。
※「doppeltler002.zip」のバージョンのdoppeltlerエンジンを使って検証しましたが、現在、飴屋/菖蒲様にてdoppeltlerエンジンのバージョンアップを進めている為、最新のバージョンのdoppeltlerエンジンを使った場合と結果の差異がありますがご了承ください。

1.「doppeltler」エンジンのインストール、使用方法
※UTAUのインストール、使用方法については以下の操作マニュアルをご参照ください。
http://kenchan22.web.fc2.com/i/utaumanualindex.html

①.以下の「doppeltler」エンジン配布サイトにアクセスして、「doppeltler002.zip」「doppeltler006.zip」を
クリックして、「doppeltler」エンジンをダウンロード。
※2020/01/19追記
「doppeltler005.zip」のバージョンまで、出力長が原音の固定範囲以内に収まる場合に正しくレンダリングできない問題があった為、2020/01/19時点での最新版の「doppeltler006.zip」を使用するようにしてください。なお、今後も「doppeltler」エンジンのアップデートが行われる可能性もあります。

http://utau2008.xrea.jp/2020/engine/
※「doppeltler002.zip」に64bit版と32bit版のエンジンが入っています。64bit版エンジンは64bit版のOSのみで使用できますが、32bit版エンジンもあるので、32bit版のOSでも使えます。
※64bit版のwavtool「wavtool64.zip」も配布されていますが、デフォルトの32bit版wavtoolと64bit版doppeltlerエンジンの組み合わせでも動くため、こちらは必ずしも入手する必要はありません。

doppeltlerdownload.png

②.ダウンロードしたzipファイルを解凍して、64bit版OSの場合は「doppeltler64.exe」、32bit版OSの場合は「doppeltler32.exe」を、UTAUのresamplerエンジンやwavtoolが入っている以下のフォルダに入れる。
64bit版OSの場合:「C:\Program Files (x86)\UTAU」
32bit版OSの場合:「C:\Program File\UTAU」
※64bit版OSの場合は32bit版の「doppeltler32.exe」エンジンも使えます。
※「wavtool64.zip」をダウンロードした場合は、解凍後に「wavtool64.exe」を一緒に入れる。

doppeltlerinst01.png

③.UTAUのメニューバーより「プロジェクト(P)」→「プロジェクトのプロパティ(R)」を選択して、「プロジェクトの設定」画面を開く。

doppeltlerinst02.png

④.「プロジェクトの設定」画面にて、「ツール2(resample)」に「doppeltler64.exe」(32bit版エンジンを使いたい場合は「doppeltler32.exe」)を入力して、「OK」ボタンをクリックする。
※wavtool64.exeを使いたい場合は、「ツール1(append)」に「wavtool64.exe」を入力する。
※デフォルトのresamplerエンジンに戻したい場合は「プロジェクトの設定」画面右下の「ツールを初期化」ボタンをクリックして、「ツール2(resample)」が「resampler.exe」に変更されたのを確認して「OK」ボタンをクリックする。
※デフォルトのエンジンを変更する方法については、以下をご参照ください。
http://kenchan22.web.fc2.com/i/utaumanualbasic2/utaubasic2.html#3-3-2

doppeltlerinst03.png


2.doppeltlerエンジンとresamplerエンジン、fresampエンジンの音質の比較

比較対象エンジン
①.resampler.exe(UTAUver0.4.18eに付属のエンジン)
②.fresamp14.exe
※飴屋様のツイートにて配布(https://twitter.com/ameyaP_/status/310071123410821120
③.doppeltler64.exe(「doppeltler002.zip」のバージョンを使用。またwavtool64.exeを併用)

再生時の共通の条件

①.はるまきごはん様作詞作曲の初音ミクオリジナル曲「約束」の最初の1フレーズを和音マコ連続音音源で再生。
初音ミク原曲


和音マコ連続音でカバー(fresamp14エンジン使用)


②.UTAU本体のバージョンは0.4.18eを使用。

③.歌いだしのブレス(息を吸う音)のみ、全てブレシネス100、Flagss設定なしで統一。それ以外の音はgフラグ「g-10」のみ共通で設定。

再生結果について
以下の音声プレーヤーで聴ける音声は、アップできる容量制限の為128kbpsのmp3に変換していますが、エンジンの違いによる音質の違いは分かると思います。

①.resampler.exe(共通設定のみ)







②.fresamp14.exe(共通設定のみ)







③.doppeltler64.exe(共通設定のみ)







3つのエンジンを比較すると、doppeltlerエンジンはブレシネス(息成分)が他の2つのエンジンよりも強く出ていることが分かります。次に、doppeltlerエンジンについて、ブレシネス(BRE)の値とdoppeltlerエンジン独自のフラグである、aフラグ(ノイズ成分の高域強調率)を減らして比較してみます。

①.doppeltler64.exe(BREをデフォルトの50から25に変更)







②.doppeltler64.exe(aフラグをデフォルトのa100からa50に変更)







③.doppeltler64.exe(BREをデフォルトの50から25に変更、およびaフラグをデフォルトのa100からa50に変更)







doppeltlerエンジンはをBERを50から25に減らすと、resamplerエンジンやfreampエンジンよりもノイズが減ってクリアに聴こえるようになります。aフラグをa100からa50に減らした場合は、BER変更時のような明らかな違いは感じられませんが、若干ノイズが減ってクリアに聴こえるように感じました。
また、doppeltlerエンジンの息成分の表現は、他のエンジンよりも綺麗になっているため、ブレス感を出したい音源、楽曲では、BERは25よりも大きくした方が良いと思います。
ちなみに、以下の様に、resamplerエンジンとfreampエンジンのBERを50から25に変更しても大きな違いは感じませんでした。

①.resampler.exe(BREをデフォルトの50から25に変更)







②.fresamp14.exe(BREをデフォルトの50から25に変更)







3.doppeltlerエンジンとresamplerエンジン、fresampエンジンのレンダリング速度の比較

レンダリング時の条件、計測方法

①.以下のスペックのPCを使用
機種名:DAIV-NG5700S2(マウスコンピューターのクリエイター用ノートPC)
OS:Windows 10 Pro 64bit版(バージョン 1809)
※2020/01/19追記
Windows 10を最新のバージョン 1909にアップデートした後も、問題なく使用できることを確認しました。

CPU:Core i7-6700HQ(コア数/スレッド数:4/8、動作周波数:2.6GHz、最大動作周波数:3.5GHz)※1
メモリ:DDR4 16GB
SSD:2.5インチSATA3接続 480GB(OS、アプリ起動用)
HDD:2.5インチSATA2接続 1TB(ファイル保存用)

②.UTAU本体はバージョン0.4.18eをSSDにインストールして、エンジン、ustファイルは全てSSD上に置いて、SSDにキャッシュファイルが作成される状態でレンダリング。

③.メニューバーより「ツール」→「オプション」を選択して、「オプション」画面の「レンダリング」タグにて、「レンダリング時にファイルの存在チェックを行い、なるべく音抜けしないようにする。(遅くなります)」にチェックを入れた状態でレンダリング。

④.はるまきごはん作曲作詞の「約束」のustファイルで、歌詞部分(3分35秒)をすべて選択して、再生ボタンを押した瞬間から最初の音が出るまでの時間を測定。

⑤.それぞれのエンジンについて、メニューバーより「ツール」→「オプション」を選択して、「オプション」画面の「レンダリング」タグにて、「レンダリング時に複数のバッチをする」にチェックが入っていない状態(レンダリングにCPUを1コアのみ使う状態)および、チェックを入れて、右側のプルダウンより「8」を選択して、レンダリングにCPUを8コア使う状態の両方を計測しました。
なお、「レンダリング時に複数のバッチをする」オプションはレジスト特典の為、未レジストの場合は使用できません。
詳細は以下をご参照ください。
http://kenchan22.web.fc2.com/i/utaumanualbasic2/utaubasic2.html#3-4

計測結果

以下の通り、doppeltlerエンジンは、resamplerエンジンを1コアでレンダリングする場合に比べて2倍以上のスピードでレンダリングすることができました。
また、resamplerエンジンを8コアでレンダリングする場合よりは遅いですが、fresamp14.エンジンを8コアでレンダリングする場合よりは若干速い結果となりました。

resample.exe(1コア):2分28秒
resample.exe((8コア):49秒
fresamp14.exe((1コア):6分1秒
fresamp14.exe((8コア):1分21秒
doppeltler64.exe((8コア)(「レンダリング時に複数のバッチをする」にチェックを入れない状態):1分12秒
doppeltler64.exe((8コア)(「レンダリング時に複数のバッチをする」にチェックを入れて、8コアを指定した状態):50秒

※doppeltlerエンジンについては、「レンダリング時に複数のバッチをする」にチェックが入っていない状態でも、デフォルトですべての論理コアを使用する仕様の為、未レジストでもマルチスレッドレンダリングが可能です。ただし、「レンダリング時に複数のバッチをする」オプションの使用の有無により処理方法が異なる為、「レンダリング時に複数のバッチをする」にチェックを入れて、8コアを指定した方が若干速くなるようです。


4.結論

doppeltlerエンジンは、resamplerエンジンやfresampエンジンよりもノイズが少なく、息成分の表現が良くなっていて、かつ、レンダリング速度も容易に向上できる為、どの音源でも是非一度は試した方が良いと思います。個人的には和音マコ連続音音源によく合う為、今後はデフォルトのエンジンとして使っていきたいと思います。
UTAU音源はエンジンとの相性がある為、音源によってはあまり合わない可能性はありますが、くろ洲様もイナリ連続音音源で試されて、良い結果が得られてデフォルトで使いたいと言われていたので、音質を改善できる音源は多いと思います。

くろ洲の歌声合成忘備録
UTAUに新“本家”エンジン「doppeltler」登場 とりあえず一通り試した
https://km4osm.com/doppeltler/
スポンサーサイト



プロフィール

kenchan

Author:kenchan
別名:こっぺぱんP(ニコニコ動画内)
歌声合成ソフトウェア【UTAU】
向けの音源【和音マコ】の
代理配布を行なっています。

カレンダー
12 | 2020/01 | 02
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 -
最新記事
最新トラックバック
最新コメント
月別アーカイブ
リンク
検索フォーム
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
utapiano