いまさらですが初音ミク買ったんですよ。ところが家のwin2kでは動かないらしくてまだパッケージ開けてすらいない。週末にアキバでvistaのDSP版でも買おうかと思ったけど時間なかった…。
http://www.vocaloid.com/jp/before_faq.html にあるとおり、初音ミクはヤマハの VOCALOID という技術(というかライブラリ)に膨大な量のサンプリング音声をパッケージにしたもので、ものすごい適当な例えをするならば Zend Engine と php の関係みたいなものです。
で、中身はどうなってるのかというと、以下のPDFを参照。ちゃんと読んでないけど、音声処理でよくでてくるピッチがどうとかそういうかんじで、サンプル音声がなめらかにつながるように変形しましょうって話ぽい。あまり確率モデル云々ってものでもなくて、MeCab の n-best 解から音読できますとかだったらかなり「神キター」だったのにね。
- Interspeech (Eurospeech) 2007
- SMAC2003
- interspeech のほうで引用されてる共同研究先の人が書いたものっぽい
- http://www.iua.upf.es/mtg/publications/SMAC2003-aloscos.pdf
ということで朝の現実逃避でした。