開発が進む声の活用。進化する音声合成技術は声紋認証を突破できるのか検証してみた

合成音声と声紋認証

◆音声合成の精度向上、音声認証を突破してしまうリスクはどうなる?

コールトラッキングサービス「コールトラッカー」を提供しているコムスクエアの開発チームの協力のもと音声認証のプロトタイプをお借りして実験を行いました。

本人とみなす閾値(しきいち)を調整できるので、セキュリティの強度を調整することができます。

当然ながら、厳格にすればするほど本人であってもはじかれてしまう可能性がありますし、緩くすれば似ている声色を本人と認識してしまうことになります。

まずは音声合成した音声を正解データにして、認証鍵をかけてみました。

本人の声で文言を読み上げ、開錠できるでしょうか。

開発担当者の推奨設定50%に設定してテストを行ってみました。

NG画面

類似度は35.9%ということで認証を突破することはできませんでした。

では逆に、本人の声を正解データにして認証鍵をかけて合成音声で開錠を試みるとどうでしょうか。

結果は33.27%。本人と断定することはなく最初のテストと同じような類似度となりました。

最後に、本人の声で認証鍵をかけて、本人の声で開錠してみます。

成功画面


結果は71%以上の数値を示し本人と断定されました。

正しく判断されたという結果は得られましたが正直なところ本人であれば90%以上を示すと思っていたので案外低い数値だなという印象を受けました。 

◆開発途上の技術 どんなポテンシャルを秘めているの?

例えば、家の施錠や口座の引き出しなど財産を脅かす可能性がある分野への導入は単体ではハードルが高いような印象があります。

そこで暗証番号と声紋など、組み合わせることでセキュリティーを高めることができます。

そのほかにも予約の本人確認や、端末の本人認証、暗証番号を忘れてしまった時の再設定などはスピーディーに認証を行える方法としてニーズが広がるかもしれません。

また、自動運転の注目も高まっていますが、個人的には「モビリティカー」の共通カギとして「声」が採用される可能性は高いというイメージがあります。

個人の声紋に様々な情報が紐づくことでシームレスに「AIによるショートカット」の恩恵が期待できます。

運転中に音声で指示を出すことができれば両手も塞がりませんし、目的地の地図情報やナビゲーション、経路のサジェスト、運転中でも会話による相談が容易に行えそうです。

「来週は結婚記念日だから、彼女の欲しがっていたアウトドアダウンジャケットをプレゼントしたいんだ」

この時、モビリティカーに搭載されたAIは声の持ち主を特定し、同時に奥様の趣味嗜好を踏まえて在庫のある売り場をピックアップして知らせてくれたら便利ですね。

個人の声紋をキーにしたコマンドで、パーソナライズされた選択肢が瞬時に手に入るとしたらあれこれ考える必要もありません。

また、以前でんとらでも扱ったように特殊詐欺対策として登録のある声紋(家族など)以外は住人に接続しないなどの工夫は社会的にも意義高い仕組みだと思います。

物理的な鍵には紛失の際の開錠に手間がかかります。

紛失リスクの低い生体認証技術は、手軽さゆえ様々なサービスに実装されていくと思いますが、セキュリティーリスクもセットで考えていかねばなりません。

しかしながら、「開けゴマ」のように合言葉で鍵の開け閉めが行える世界は子供にとっても手軽で夢のある世界です。

「声」を鍵にしたサービスが身の回りにあふれ、さらなる便利さが手に入るようになるのはそう遠くない未来かもしれません。

Loading

Writer
ビジネスシーンにおける電話の役割は実に多種多様。 電話にまつわる”あれこれ”をお届けしていきます。