育て達人第040回 坂野 秀樹
楽器への興味から音声合成の研究に 学びのエンジン早めにオンに
理工学部 坂野 秀樹 准教授(音声・音響処理)
見知らぬ土地でハンドルを握りながらカーナビの音声に励まされ、「根気強くナビゲートしてくれているのはどんな女性だろう」と思い巡らした経験はありませんか。なまりや抑揚を感じさせない若い女性の音声は実は合成された人工音声です。感情豊かな、人間に近い「声」の開発に取り組む理工学部情報工学科の坂野秀樹准教授に聞きました。
――音声合成の研究に興味を持ったきっかけはなんですか。
「学ぶことが楽しくなるエンジンは早めにオンに」と語る坂野准教授
もともと音楽好きだったこともあります。中学校、高校時代はJポップスをよく聞きました。楽器にも興味を持ち、ギターやキーボードで作曲したり演奏を楽しんでいました。次第に電子的に作った音を、自分のイメージした納得ある音に近づけていくのが面白いなあと思うようになりました。大学の学部、学科選びでは、他にもあこがれた職業があり迷いましたが、最終的には電気系の学部を選びました。進学した名古屋大学では音声・音響情報処理が専門の板倉文忠先生の指導を受けました。板倉先生が名城大学に移られた後、またご一緒に研究を続けさせていただける機会に恵まれ、音声を信号処理して変換する研究、その中でも音声分析合成に関する研究に取り組んでいます。声の質変換、カーナビ音声の高品質化、感情音声の分析や合成、歌声合成(歌うコンピュータ開発)などです。
――カーナビやATMでは女性の声が親切に案内してくれます。実在する女性でしょうか。
音声は合成されたものです。実在の人間が語ったものをそのまま使っているわけではありません。ベースになっているのはナレーターをお願いした人間の声ですが、蓄積された音声データを、いろんな文章になるように、細かく切り刻んでつなぎ合わせているのです。ナレーターは必ずしも女性でなくてもいいのですが、やさしさを感じさせる女性の声の方が案内サービスには向いているのでしょう。合成音声の質もかなり高くなっていて、実際の人間の声と区別しにくくなってきています。
――合成音声技術の向上は私たちの日常生活にどう役立つのでしょうか。
大学の教育システムでの活用や目の不自由な方への朗読サービスなど、合成音声が役立つ場面はどんどん広がっています。合成音声はアナウンサーに近い標準語はよどみなく話せるようになっていくと思います。しかし、複数の人物が登場したりする詩の朗読のなどではまだまだ人間の代役は無理です。声優とかナレーターの方の仕事を奪うようなことは当分ないと思いますが、補助的には人間に代わって合成音声が使われるケースは増えてくるかもしれません。特定の人間をまねた音声の精度が上がると、オレオレ詐欺みたいに悪用される心配も生じます。合成音声と本人の肉声が区別できるよう、セキュリティ対策も重要になってくると思います。
――研究室には音声研究をしたいという学生たちが集まってくるのですか。
研究室には4年生たちが配属されてきます。私の研究室は、情報工学の中で、音声、音響信号処理の分野に興味を持った学生たち来るわけですが、音に関する勉強というのは、比較的理解しやすいのか、それまで、強い関心がなくても、与えられた課題に「これは面白い」と飛びついてくる学生も結構います。授業では学びや研究の楽しさを理解することができるよう、様々な音響機器を操作してもらう実験や、自分で考えてプログラミングするなど、できるだけ興味を持ちやすい題材を取り入れるよう心がけています。研究上、重要な音声の収録のため防音室も用意されています。ただ、学生の中には、音楽について、やや誤解して入ってくる学生もいます。研究室で扱うのは音楽そのものではなく、コンピュータを使って音を処理するときの理論的な話が中心になります。特にプログラミング理論をマスターしたうえで本格的な音声や電子音楽の学びがスタートします。
――名城大学の学生の印象でお気づきの点はありますか。
ずっと国立大学で過ごし、4年前から名城大学に勤務しています。規模の大きい私立大学ということもあって、多様な学生がいるなあというのが実感です。私が注目しているのは、なにかのきっかけで、眠りから目覚めたように勉強にのめりこんでいく学生たちが結構いることです。良い意味で、“大化け”する学生たちです。研究室に配属になり、自分の専門分野に触れていくことで、学ぶことが本当に面白くなるんだなあという感じがします。ただ、エンジンがかかるのが4年生ですと、卒業までに残された時間はわずかです。学生たちにとって就職活動という、避けては通れない関門があるので難しい面はありますが、できるだけ早い段階でエンジンをオンにしてほしいと思います。
坂野 秀樹(ばんの・ひでき)
愛知県東海市出身。名古屋大学工学部電子情報学科卒、奈良先端科学技術大学院大学情報科学研究科修士課程修了、名古屋大学大学院工学研究科博士課程単位取得退学。2005年4月から名城大学理工学部に勤務。講師を経て現職。専門は音声・音響信号処理。35歳。