音声合成の先にある「音声生成」に挑む
漫画に登場する「音声合成」は、すでに実用化されている技術です。病気やケガなどで声を失った人のQOL※を高める意図のもと、医療系からはじまったサービスが、ソフトウェアとして市販され、自分の葬儀に元気なころの自分の声であいさつするといった用途などへと広がりを見せています。また、キーボードなどを介さず、話すだけでコンピュータに文章を入力できる「音声認識」も、近年精度が大きく向上し、スマートフォンなどに搭載されています。宇宙兄弟のエピソードでは本人の音声をサンプリングする描写があります。これは、「音声合成」では、そのサンプリングした音声をつぎはぎすることで、任意の文章を読み上げさせるからです。その点、私が取り組んでいる「音声生成」では、物理シミュレーションで好みの音声をつくることをめざしているため、そのようなサンプリングを必要としません。しかし、「音声生成」の研究は、発話時の舌や喉頭の動きを外部から観察できないという問題があり、まだまだ未知の部分が多く残されている分野です。
※QOL:Quality of Lifeの略。生活の質、と訳され、人間らしく満足して生活しているかを評価する概念。
MRIなどの装置を駆使して、
声を出す仕組みをモデル化
※CTやMRI:CT(Computed Tomography:コンピュータ断層撮影法)はX線で画像診断を行う装置。
MRI(Magnetic Resonance Imaging:磁気共鳴画像法)は、強い磁力で生体内の情報を画像にする装置。
※音素列:音素は言語音の最小単位で、母音と子音に分けられる。
飯田先生の研究内容
3D音響によるバーチャルリアリティにより、遠方の音空間(コンサートホール、オリンピック会場、観光名所など)を再現する研究を進めています。ヒトがたった2つの耳で音の方向、距離、拡がりなどを知覚するメカニズムを研究し、それをコンピュータで処理してヘッドホンで再現するシステムも開発しています。