電話だからこそできる最強のビジネスソリューション~テキスト音声合成でこんなに便利に!

Cheerful smiling child at the blackboard.

家庭でパソコンを日常的に使うことが当たり前になり、スマホ全盛時代を迎えてますます便利になる各種インターネットサービスですが、インターネットと電話・音声を融合したサービスもますます進化を遂げています。例えばコールセンターでは、これまでの問い合わせや苦情データ、TwitterやFacebookなどのソーシャルメディアでの製品情報に関するログなどビッグデータを解析し、電話をかけてきたお客様へ最適な自動対応を行っています。

この記事では、こうした進化し続ける電話技術のコア技術の一つである「テキスト音声合成」について解説します。

ビジネスの現場での電話とインターネット活用最前線

日常生活のあらゆるシーンに溶け込むインターネットですが、もちろんインターネットですべて自動的に完結しているわけではありません。ビジネスの現場を見てみると、そこには質の高いビジネスプロセスの確立や顧客満足の向上のために、いろいろな工夫が行われています。

例えば、レストラン、美容院、ホテルなどの予約処理の現場を見てみると、パソコンやスマホなどから予約してくる人も多くはなってきましたが、圧倒的に多いのはいまだに電話です。そして、予約を受ける側では電話をメモしてパソコンで予約確認を行います。

以前のように電話だけという場合に比べて、インターネットからの予約が増えた分、処理する側の手間は2倍に増えているといえるでしょう。そしてこれにともなって作業時間ばかりでなく予約処理ミスやお客様への連絡漏れなどが発生するリスクも増加しています。電話は呼び出しにより注意を喚起してくれますが、パソコンの場合には予約に気が付かなかったなどの、機会損失やクレームを無視していたなどの問題が起きる場合があります。

こうした場面で、パソコンからの予約申し込みを音声化し、電話予約を受付けている電話番号に通知する仕組みがあればすべての予約窓口が一本化できます。そんな便利な仕組みの基礎になるのが「テキスト音声合成」の仕組みなのです。

テキスト音声合成技術の仕組みとは?

テキスト音声合成技術には、大きく分けて「録音編集方式」と「規則合成方式」とがあります。

「録音編集方式」というのはその名の通り、あらかじめ録音しておいた人間の声を場面に応じて編集し、自然な流れのある文章を合成するものです。録音された実際の人間の声を基にしているので、発音やイントネーションなど、人間の肉声と同レベルの完成度に仕上げることが可能です。

「規則合成方式」
規則合成方式では日本語や英語などの自然言語の文法規則に従って、読み上げる文章を自由に合成できます。しゃべるロボットのような仕組みを作れますが、介護などでの活躍が期待される一方、ビジネスの現場では、まだそれほど実用的ではないかもしれません。

テキスト音声合成技術でこんなことも可能になる

例えば、サラリーマンがスマホを使って会社の近くの居酒屋を予約したとします。店はちょうど開店したばかりで店員がWebからの予約を見逃していた。自動返信で予約完了の通知はもらったけど実際に見せに行ってみると満員で入れなかった、または、予約完了のメッセージがいつまでたってもやってこない・・・そんなケースもあるでしょう。

こんな時、インターネットから受けた申込みを予約の電話窓口に自動で転送できたら便利ですよね。ネットは文字で、電話は音声なのにそんなことできるの?という声が出て来そうですが、ここでネットの文字データから必要な音声メッセージを発信してくれる仕組みが「テキスト音声合成技術」なのです。

忙しい時間にこまめにパソコンの管理画面を確認しなくても、いつも予約を受けている電話で、インターネットからの予約を確認することができるようになります。見忘れや見落としが防止できるだけでなく、予約申込いただいたユーザーへ素早く応答することで顧客満足もアップすることまちがいなしです。

まとめ

いかがでしたか?「テキスト音声合成技術」というとなんだか難しそうなテクノロジーの話かな・・・と思ったかも知れませんが、電話を使ったビジネスの現場では、すでに以前から使われている技術なのです。