電話での音声認識サービス競争

文字情報以外にインターフェイスとして使いやすい情報形態は音声であろう。画像情報は出力情報としては分かりやすいが、人間の意志を入力する情報としては使いづらい。米国では、オフィスでスピーチ・レコグニション・ソフトウェア(Speech Recognition Software)を使って文書を作成したり、スマートフォンに届いたメールの内容を音声で読み上げさせたりと、音声を入出力デバイスとして使用するのは日常的である。

電話での応答サービスの場合でも、例えば、クレジットカード会社のコールセンターに電話をした場合、「英語かスペイン語か」、「バランスの確認か、次回の支払金額か、クレジット上限の引き上げか、カスタマー担当者と話したいか」と聞かれ、メニュー番号ではなく、「Balance」などと音声で話すと次のメニューに行くというように、音声入力での応答が当たり前になっている。

そして、今、音声入力での競争が激しいのは、電話番号案内コール市場である。米国では、電話番号での案内サービスは「411」をダイヤルするが、これは1通話当たり1.49ドルから3.49ドルの有料サービスで、総額年間80億ドルほどの市場であると言われている。

ジングル・ネットワークス(Jingle Networks)は、2005年9月に電話番号案内の無料サービスを開始した老舗企業である。利用者が「1-800-Free411」をダイヤルすると、10秒程度の広告を聞くだけで無料で電話番号を入手できる。スカイプ(Skype)からも利用可能だ。また、インターネットからもFree411.comにアクセスすると、同様に無料で電話番号が入手できる。2007年4月までに2億回の利用があり、全米411市場のシェア6%を取るまでに成長している。

電話会社として危機感を募らせたAT&Tは、 2006年12月、ジングル・ネットワークスの競合である「1-800-411-Metro」の運営会社であるインフリー・ディーエー(InFreeDA)を買収して、無料の電話番号案内サービス「1-800-Yellowpages」を始めるとアナウンスした。

そして、2007年4月に、情報の検索の雄であるグーグルもグーグル・ラボ(Google Lab)のサービスとして無料電話番号案内の「Goog-411」を開始した。グーグルの場合には、人力で答えることがなく、音声で話した州や市の名前、社名や業種の情報を認識し、自動応答する。「Text Message」と言えば、ショートメッセージで詳細情報を入手することもできる。

追い打ちをかけるように、2007年5月にマイクロソフトは、急成長中の無料電話案内サービス企業のテルミー(Tellme)を買収した。テルミーの場合には、3通りの検索方法がある。音声とショートメッセージによる検索は、グーグルと同じであるが、更に専用のJavaアプリを携帯電話にダウンロードして検索する方法も用意されている。この場合、都市名や業種名(インド料理レストランなど)を言うと、該当する店のリストが表示され、さらに地図や道順などを表示することができる。

携帯電話の音声関連のインターフェイスは、番号案内だけではない。イギリスのスピンヴォックス(Spinvox)は、音声での留守録の内容をショートメッセージやメールに変換するサービスを提供している。

また、米マサチューセッツのヴリンゴ(Vlingo)が提供するファインド(FIND)と呼ばれるアプリケーションを利用すると、ボタン操作を全くせずに音声情報だけで友人にショートメッセージを送ることができる。

携帯電話がPC代わりになっている日本とは事情が大きく異なるが、このように海外では、携帯電話の音声情報の認識技術の開発とそれを利用したサービス競争が盛んなのである。

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。