FC2ブログ

UTAUの本家新エンジン「doppeltler」が公開されました。

UTAU開発者の飴屋/菖蒲様より、将来のUTAUバージョンアップに先立って、64bit、マルチスレッド対応の新しいUTAU用音声合成エンジン「doppeltler」が1月12日に公開されました。

小生が代理配布している和音マコ連続音音源を使って、UTAU標準のresamplerエンジン、以前より飴屋様にて公開されているfresampエンジンと、音質、およびレンダリング速度の違いについて検証してみました。
※「doppeltler002.zip」のバージョンのdoppeltlerエンジンを使って検証しましたが、現在、飴屋/菖蒲様にてdoppeltlerエンジンのバージョンアップを進めている為、最新のバージョンのdoppeltlerエンジンを使った場合と結果の差異がありますがご了承ください。

1.「doppeltler」エンジンのインストール、使用方法
※UTAUのインストール、使用方法については以下の操作マニュアルをご参照ください。
http://kenchan22.web.fc2.com/i/utaumanualindex.html

①.以下の「doppeltler」エンジン配布サイトにアクセスして、「doppeltler002.zip」「doppeltler006.zip」を
クリックして、「doppeltler」エンジンをダウンロード。
※2020/01/19追記
「doppeltler005.zip」のバージョンまで、出力長が原音の固定範囲以内に収まる場合に正しくレンダリングできない問題があった為、2020/01/19時点での最新版の「doppeltler006.zip」を使用するようにしてください。なお、今後も「doppeltler」エンジンのアップデートが行われる可能性もあります。

http://utau2008.xrea.jp/2020/engine/
※「doppeltler002.zip」に64bit版と32bit版のエンジンが入っています。64bit版エンジンは64bit版のOSのみで使用できますが、32bit版エンジンもあるので、32bit版のOSでも使えます。
※64bit版のwavtool「wavtool64.zip」も配布されていますが、デフォルトの32bit版wavtoolと64bit版doppeltlerエンジンの組み合わせでも動くため、こちらは必ずしも入手する必要はありません。

doppeltlerdownload.png

②.ダウンロードしたzipファイルを解凍して、64bit版OSの場合は「doppeltler64.exe」、32bit版OSの場合は「doppeltler32.exe」を、UTAUのresamplerエンジンやwavtoolが入っている以下のフォルダに入れる。
64bit版OSの場合:「C:\Program Files (x86)\UTAU」
32bit版OSの場合:「C:\Program File\UTAU」
※64bit版OSの場合は32bit版の「doppeltler32.exe」エンジンも使えます。
※「wavtool64.zip」をダウンロードした場合は、解凍後に「wavtool64.exe」を一緒に入れる。

doppeltlerinst01.png

③.UTAUのメニューバーより「プロジェクト(P)」→「プロジェクトのプロパティ(R)」を選択して、「プロジェクトの設定」画面を開く。

doppeltlerinst02.png

④.「プロジェクトの設定」画面にて、「ツール2(resample)」に「doppeltler64.exe」(32bit版エンジンを使いたい場合は「doppeltler32.exe」)を入力して、「OK」ボタンをクリックする。
※wavtool64.exeを使いたい場合は、「ツール1(append)」に「wavtool64.exe」を入力する。
※デフォルトのresamplerエンジンに戻したい場合は「プロジェクトの設定」画面右下の「ツールを初期化」ボタンをクリックして、「ツール2(resample)」が「resampler.exe」に変更されたのを確認して「OK」ボタンをクリックする。
※デフォルトのエンジンを変更する方法については、以下をご参照ください。
http://kenchan22.web.fc2.com/i/utaumanualbasic2/utaubasic2.html#3-3-2

doppeltlerinst03.png


2.doppeltlerエンジンとresamplerエンジン、fresampエンジンの音質の比較

比較対象エンジン
①.resampler.exe(UTAUver0.4.18eに付属のエンジン)
②.fresamp14.exe
※飴屋様のツイートにて配布(https://twitter.com/ameyaP_/status/310071123410821120
③.doppeltler64.exe(「doppeltler002.zip」のバージョンを使用。またwavtool64.exeを併用)

再生時の共通の条件

①.はるまきごはん様作詞作曲の初音ミクオリジナル曲「約束」の最初の1フレーズを和音マコ連続音音源で再生。
初音ミク原曲


和音マコ連続音でカバー(fresamp14エンジン使用)


②.UTAU本体のバージョンは0.4.18eを使用。

③.歌いだしのブレス(息を吸う音)のみ、全てブレシネス100、Flagss設定なしで統一。それ以外の音はgフラグ「g-10」のみ共通で設定。

再生結果について
以下の音声プレーヤーで聴ける音声は、アップできる容量制限の為128kbpsのmp3に変換していますが、エンジンの違いによる音質の違いは分かると思います。

①.resampler.exe(共通設定のみ)







②.fresamp14.exe(共通設定のみ)







③.doppeltler64.exe(共通設定のみ)







3つのエンジンを比較すると、doppeltlerエンジンはブレシネス(息成分)が他の2つのエンジンよりも強く出ていることが分かります。次に、doppeltlerエンジンについて、ブレシネス(BRE)の値とdoppeltlerエンジン独自のフラグである、aフラグ(ノイズ成分の高域強調率)を減らして比較してみます。

①.doppeltler64.exe(BREをデフォルトの50から25に変更)







②.doppeltler64.exe(aフラグをデフォルトのa100からa50に変更)







③.doppeltler64.exe(BREをデフォルトの50から25に変更、およびaフラグをデフォルトのa100からa50に変更)







doppeltlerエンジンはをBERを50から25に減らすと、resamplerエンジンやfreampエンジンよりもノイズが減ってクリアに聴こえるようになります。aフラグをa100からa50に減らした場合は、BER変更時のような明らかな違いは感じられませんが、若干ノイズが減ってクリアに聴こえるように感じました。
また、doppeltlerエンジンの息成分の表現は、他のエンジンよりも綺麗になっているため、ブレス感を出したい音源、楽曲では、BERは25よりも大きくした方が良いと思います。
ちなみに、以下の様に、resamplerエンジンとfreampエンジンのBERを50から25に変更しても大きな違いは感じませんでした。

①.resampler.exe(BREをデフォルトの50から25に変更)







②.fresamp14.exe(BREをデフォルトの50から25に変更)







3.doppeltlerエンジンとresamplerエンジン、fresampエンジンのレンダリング速度の比較

レンダリング時の条件、計測方法

①.以下のスペックのPCを使用
機種名:DAIV-NG5700S2(マウスコンピューターのクリエイター用ノートPC)
OS:Windows 10 Pro 64bit版(バージョン 1809)
※2020/01/19追記
Windows 10を最新のバージョン 1909にアップデートした後も、問題なく使用できることを確認しました。

CPU:Core i7-6700HQ(コア数/スレッド数:4/8、動作周波数:2.6GHz、最大動作周波数:3.5GHz)※1
メモリ:DDR4 16GB
SSD:2.5インチSATA3接続 480GB(OS、アプリ起動用)
HDD:2.5インチSATA2接続 1TB(ファイル保存用)

②.UTAU本体はバージョン0.4.18eをSSDにインストールして、エンジン、ustファイルは全てSSD上に置いて、SSDにキャッシュファイルが作成される状態でレンダリング。

③.メニューバーより「ツール」→「オプション」を選択して、「オプション」画面の「レンダリング」タグにて、「レンダリング時にファイルの存在チェックを行い、なるべく音抜けしないようにする。(遅くなります)」にチェックを入れた状態でレンダリング。

④.はるまきごはん作曲作詞の「約束」のustファイルで、歌詞部分(3分35秒)をすべて選択して、再生ボタンを押した瞬間から最初の音が出るまでの時間を測定。

⑤.それぞれのエンジンについて、メニューバーより「ツール」→「オプション」を選択して、「オプション」画面の「レンダリング」タグにて、「レンダリング時に複数のバッチをする」にチェックが入っていない状態(レンダリングにCPUを1コアのみ使う状態)および、チェックを入れて、右側のプルダウンより「8」を選択して、レンダリングにCPUを8コア使う状態の両方を計測しました。
なお、「レンダリング時に複数のバッチをする」オプションはレジスト特典の為、未レジストの場合は使用できません。
詳細は以下をご参照ください。
http://kenchan22.web.fc2.com/i/utaumanualbasic2/utaubasic2.html#3-4

計測結果

以下の通り、doppeltlerエンジンは、resamplerエンジンを1コアでレンダリングする場合に比べて2倍以上のスピードでレンダリングすることができました。
また、resamplerエンジンを8コアでレンダリングする場合よりは遅いですが、fresamp14.エンジンを8コアでレンダリングする場合よりは若干速い結果となりました。

resample.exe(1コア):2分28秒
resample.exe((8コア):49秒
fresamp14.exe((1コア):6分1秒
fresamp14.exe((8コア):1分21秒
doppeltler64.exe((8コア)(「レンダリング時に複数のバッチをする」にチェックを入れない状態):1分12秒
doppeltler64.exe((8コア)(「レンダリング時に複数のバッチをする」にチェックを入れて、8コアを指定した状態):50秒

※doppeltlerエンジンについては、「レンダリング時に複数のバッチをする」にチェックが入っていない状態でも、デフォルトですべての論理コアを使用する仕様の為、未レジストでもマルチスレッドレンダリングが可能です。ただし、「レンダリング時に複数のバッチをする」オプションの使用の有無により処理方法が異なる為、「レンダリング時に複数のバッチをする」にチェックを入れて、8コアを指定した方が若干速くなるようです。


4.結論

doppeltlerエンジンは、resamplerエンジンやfresampエンジンよりもノイズが少なく、息成分の表現が良くなっていて、かつ、レンダリング速度も容易に向上できる為、どの音源でも是非一度は試した方が良いと思います。個人的には和音マコ連続音音源によく合う為、今後はデフォルトのエンジンとして使っていきたいと思います。
UTAU音源はエンジンとの相性がある為、音源によってはあまり合わない可能性はありますが、くろ洲様もイナリ連続音音源で試されて、良い結果が得られてデフォルトで使いたいと言われていたので、音質を改善できる音源は多いと思います。

くろ洲の歌声合成忘備録
UTAUに新“本家”エンジン「doppeltler」登場 とりあえず一通り試した
https://km4osm.com/doppeltler/
スポンサーサイト



UTAU-SynthのmacOS Catalina対応について

本日10月8日(日本時間)にMacの新しいOS「macOS Catalina」がリリースされました。

2019/11/10追記
11/06に64bitでコンパイルしたバージョン1.0.0b19のUTAU-Synthが公開されました。
UTAU-Synth公式サイト
http://utau-synth.com/
ただし、まだ十分に検証が進んていないので、人柱的な覚悟の上でお使いくださいとの事です。

小生のMacはHigh Sierra‎より新しいmacOSにバージョンアップできない為、取り敢えずHigh Sierra‎のMacにバージョン1.0.0b19をインストールして、64bitアプリとして起動した事と、和音マコ連続音音源の再生が問題なくできた事を確認しています。

残念なお知らせになりますが、Catalinaより、32bitアプリケーションが利用できなくなった為、32bitアプリケーションのUTAU-Synthは利用できなくなります。

UTAU-Synthをご使用の方はアップデートを控えるようにご注意ください。

これから発売されるMacはOSがCatalinaになってしまうので、Macを買い替える予定のある方は、今のうちに古いバージョンのOSが入ったMac整備済製品を探すが、中古のMacを検討した方が良いと思います。

なお、UTAU-Synth開発者より将来的にUTAU-Synthのアップデートを視野に入れているとのツイートがある為、今後64bit版のUTAU-Synthが登場する可能性はありますが、アップデートを行う時期は未定とのことですので、暫くはMojave以前のバージョンのMacが必要になると思います。

https://twitter.com/ameyaP_/status/1081401004623417344

※安定版のUTAU-Synthを使いたい場合は、Appleが32bitアプリケーションをサポートすると宣言しているHigh Sierra以前のバージョンを使用した方が良いと思います。詳細は以下の去年の小生の記事をご参照ください。

UTAU-SynthのmacOS Mojave対応について
http://kenchan22.blog53.fc2.com/blog-date-201809.html

UTAU10周年おめでとうございます!

本日3月6日に、歌声合成ツールUTAUは誕生10周年を迎えました。
本当におめでとうございます!

人力ボーカロイド支援ツールらしきものを作ってみた その1 導入編


UTAUの開発者飴屋/菖蒲様にて、2008年3月6日に上記の動画の説明文にて公開配布が始まっている為、VOVALOID2の初音ミクがソフト発売日の2007年8月31日が誕生日になっていることを踏まえると、UTAUの誕生日は3月6日と考えられます。

ただし、上記の動画の説明文にも記載の通り、「UTAU」というソフトウェア名が登場するのは、下記の後半のUTAU紹介動画が公開された3月15日になります。

ボーカロイド持ってないので作ってみた(人力ボカロ支援ツールその2)


また、開発中のUTAU動画は3月6日以前にもいくつか公開されています。

UTAUのGUI画面の原型は2008年2月5日公開の以下の動画にて初めて紹介されてます。
また、デフォルト音源、つまり 唄音ウタ(デフォ子)の声も2月5日の動画で初めて登場するため、
唄音ウタ(デフォ子)の誕生日は2月5日とも考えられています。
※UTAU配布が開始された3月6日を唄音ウタ(デフォ子)の誕生日と考える事も出来る為、実際は唄音ウタ(デフォ子)の誕生日お祝い動画は2月5日~3月6日の間に公開されるようです。
自作ツールを使ってテキスト読み上げソフトに『片道キャッチボール』を


さらに遡ると、2007年12月2日に「炉利音コム」という50音(UTAU単独音音源のWAVファイルと同等のもの)のWAVファイル集を使って人力ボーカロイドの作品を公開されていますが、これがUTAUの大本の原型と言えなくもないです。
無料(タダ)で初音ミクを手に入れる旅に出た


UTAUは、前述の後半(3月15日公開)の動画で声優釘宮理恵様の50音音声を例に音源の作成・追加使用方法を紹介されていますが、この動画の冒頭で「今回は、ツール名に『人力』とあるように、声素材の加工ツールとしての側面を解説します。というか、このツールの本質はボカロっぽいGUIよりも、むしろこっちにあります。」と言われているように、公開当初から、音源を自作できる歌声合成ツールとして誕生しています。

10年後の現在、使用できるUTAUの音源数は7千、公開が中止されたものや非公開のものを含めると1万を超えると言われてます。
ニコニコ動画の「UTAU音源配布所リンク」で検索すると7千超の動画がヒットしますが、1人の音源製作者が複数のバージョンの音源を作成されている、またはニコニコ動画に音源を公開していない場合も多く、音源数があまりにも多い為、概算数すら見積もるのが難しいのが現状ですが、音源数が多いと言われているVOCALOIDと比較しても、桁違いに音源数が多い事は確かです。

今後は、この膨大なUTAU音源、キャラクターが順次10周年を迎えることになる為、UTAU全体の活動が活発化される事を期待しています。

まずは、4月1日の重音テト10周年(重音テトのUTAU音源の公開は4月6日)が楽しみですが、8月20日には小生が代理配布しています和音マコ音源も10周年を迎える為、10周年に相応しい作品を作りたいと考えていますので、今後もよろしくお願いいたします。

ニコニコ動画のUTAUタグの付いた動画が10万件を超えました!

ニコニコ動画に【UTAU】タグを付けて投稿されたUTAU関連動画が10万件を超えました。

ニコニコUTAU動画10万超え

8月20日午前10時ごろには100,032件になっていましたが、UTAUタグの動画投稿日時が新しい順に並べて確認したところ、昨日の19日に10万件を超えたようです。

UTAU関連の投稿動画は2008年3月6日にUTAU開発者の飴屋/菖蒲様が投稿されたUTAUの公開動画が最初(※)ですが、それから約9年半で10万件を超えたことになり、平均して1年毎に1万件を超える動画が投稿され続けたことになります。

※アプリ名が「UTAU」に決まったのは公開動画投稿後の3月15日になります。(以下の紹介動画の動画説明文参照)
※2008年3月6日以前にも開発中のUTAUの紹介動画は投稿されていますが、当時はUTAUという名称は使われていませんでした。

人力ボーカロイド支援ツールらしきものを作ってみた その1 導入編


ニコニコ動画はカテゴリタグでも【料理】【自然】【旅行】【歴史】など10万件に満たないものもあり、UTAUはニコニコ動画内で相当大きなジャンルに成長したと言えます。

現在もUTAU動画投稿の勢いは衰えていないので、今後もさらなる発展を期待したいと思います。

中・上級者向けUTAU調声本「音楽的調声論」を読んでみました

先日4月29、30日に幕張メッセで開催された「ニコニコ超会議2017」にて「THE VOC@LOiD 超 M@STER37」が例年通り内部開催されていましたが、開催2日目の30日に、みのがしさらん様が執筆された中・上級者向けUTAU調声本「音楽的調声論」を購入することができました。

音楽的調声論

この本は2016年12月4日に開催されたUTAUオンリーイベント「UTAU SQUARE」で頒布されていたものですが、あまりの人気にすぐに完売となってしまい、買いそびれていました。

ネタバレしないように詳細は略しますが、内容と自分の感想は以下のようになります。

第1章 基本的な考え方
UTAUの「調声」について、なぜ調声を行うのか、何のための調声なのかという根本的な問題について、「音楽性」という観点から著者の考えが書かれています。
UTAUだけでなく、VOCALOID等の他の歌声合成ソフトで楽曲を作成する際の調声の考え方にもそのまま通じるものがあるので、
UTAUユーザだけでなく、VOCALOID等のユーザにも是非読んで欲しいと思いました。

第2章 ピッチベンドの形状
様々な感情を歌声で表現する為にはピッチベンドに様々な曲線を描く必要がありますが、ピッチベンドの形状をパターン別にUTAUエディタの画像を交えて解説されています。
具体的にどのような感情表現が必要な時に使うものなのかという事が詳細に書かれているので、これだけでも実践的な調声の力になります。 
VOCALOIDの場合はピッチベンドの操作方法がUTAUと異なる為、UTAUと同様な調声はちょっと難しいかもしれませんが、VOCALOID4のピッチレンダリング機能を使えばかなり近い事は可能だと思います。

第3章 実践
みのがしさらん様が実践例としてbuzzG様作曲のVOCALOID「GUMI」のオリジナル曲「レプリカント」を「波音リツキレ音源」でカバーしたUSTファイルを元に、歌詞に沿って音楽的なテクニックを解説されています。



各パートの感情表現について詳細に分析して書かれている為、高度なテクニックを分かりやすく学ぶことができます。
VOCALOIDの調声にも十分応用できると思います。

18ページと薄い本ですが、内容は非常に濃くてハイレベルなので正にUTAU中・上級者にお勧めの調声指南本です。
また、単なるテクニックだけでなく、調声の根本的な考え方が学べるので、UTAUユーザだけでなく、VOCALOID等のピッチ調声が可能な歌声合成ソフトを使うすべてのユーザーにも是非お勧めしたいと思います。

2017/05/03追記
以下の通販サイト(BOOTH)にて通販が始まりました!
https://minogasi.booth.pm/items/506572
なお手数料がかかるため、通販サイトでの価格設定はイベントでの頒布とは異なりますがご了承くださいとの事です。


また、今年の9月17日に開催予定のUTAUオンリーイベント「君とUTAU日々」で再販される予定との事です。

2017/09/21追記
通販を再開しましたとのことです。これが最後の販売になるとの事ですので、欲しい方はお早めに。
プロフィール

kenchan

Author:kenchan
別名:こっぺぱんP(ニコニコ動画内)
歌声合成ソフトウェア【UTAU】
向けの音源【和音マコ】の
代理配布を行なっています。

カレンダー
05 | 2020/06 | 07
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 - - - -
最新記事
最新トラックバック
最新コメント
月別アーカイブ
リンク
検索フォーム
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
utapiano