情報処理学会創立50周年記念全国大会【CGMの現在と未来】を聴講して感じたこと。

3月10日に、東京大学本郷キャンパスにて「情報処理学会創立50周年記念全国大会」の特別セッションとして「CGMの現在と未来:初音ミク、ニコニコ動画、ピアプロの切り拓いた世界」と題した聴講会が行われました。

聴講会の内容の詳細は、ASCIIjpの榎本 統太氏の記事「情報処理学会 創立50周年記念全国大会に行ってきた:生みの親が東大で語った「ニコニコ動画」と「初音ミク」の全て」にまとめられていますので、そちらを参照して頂けたらと思います。

http://ascii.jp/elem/000/000/505/505688/

自分は、今回の聴講会で特にVOCALOIDの開発リーダである剣持秀紀氏の講演「VOCALOID生みの親が語る
「歌声合成の過去・現在・未来」について、印象を受けたところがありますのでその点を掘り下げて見たいと思います。

剣持氏は最初に1960年代にアメリカ・ベル研究所で始まった歌声合成の歴史を概説した後、「なぜ歌声合成を使うのか?」という問いを提示しました。

そして、人の声と合成音声を「アナログのメトロノームとデジタルのメトロノーム」の違いに例えて説明しました。
デジタルのメトロノームは、アナログのメトロノームにはない、携帯性や、リズムの設定の柔軟性(変則拍子の設定が可能)という特徴があるからこそ、デジタルのメトロノームを使うことには、単にアナログのメトロノームの代用以上の意義があるから普及した事を説明し、歌声合成も人間の歌手の単なる代用以上のものでなければならない事を強調していました

そして剣持氏は、「未来の歌声合成」に必要なものとして「声のバリエーション」「利用場面」「ユーザー層」の3つの要素を拡大していかなければならない事を説明し、具体的には、「スペイン語版」VOCALOIDの開発等の複数言語への対応や、しゃべる音声を合成できる「VOCALOID-flex」の開発を説明されていました。

ここで、UTAUを使っている者の観点から考えると、「UTAUはVOCALOIDの代用以上のものでなければならない」のではないかという思いがあります。

UTAUはピッチシフトの際にノイズが発生してしまうため、VOCALOIDの代用にもならないのではと考える人もいると思います。
将来、UTAUのエンジンがノイズを抑えられるものに進化する事を期待していますが、それとは別に、UTAUにはユーザが独自の音源を作成して使用することができるという、VOCALOIDにはない特徴があります。この点において、UTAUはVOCALOIDの代用以上の役目を果たすものだと考えています。

また、ユーザ独自の音源が作成出来ることにより、現在、500以上の音源がWEB上に公開され、その殆どをユーザが無償で使うことができるので、独自音源を作らずに歌声合成ソフトとして利用する人にとっても「声のバリエーション」の豊富さではVOCALOIDの代用以上の役目を果たしているのではないでしょうか。

また、UTAUは実質フリーのソフトとして使える事は、金銭的にVOCALOIDが買えない人だけではなく、声のバリエーションを増やしたいが、これ以上VOCALOIDを買い足していくのは難しい人にとっても役に立つものではないでしょうか。

先にも申したとおり、UTAUはVOCALOID程複雑な合成技術を使っているわけではないので、VOCALOIDを完全に代用できる品質をUTAUが持つことは難しいと思いますが、それでも、VOCALOIDの声のバリエーションを補うことはできると思います。

一部の雑誌ではUTAUとVOCALOIDを対立させているような書き方もありますが、本来は、UTAUはVOCALOIDを補完するものとして考えて欲しいと思っています。
スポンサーサイト

コメントの投稿

管理者にだけ表示を許可する

プロフィール

kenchan

Author:kenchan
別名:こっぺぱんP(ニコニコ動画内)
歌声合成ソフトウェア【UTAU】
向けの音源【和音マコ】の
代理配布を行なっています。

カレンダー
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
最新記事
最新トラックバック
最新コメント
月別アーカイブ
リンク
検索フォーム
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
utapiano