究極の検索、パーソナライズド・サーチ

「集合知」(Wisdom of Crowds)とは、自分以外の大衆の知恵を活用するということだが、「あなたの知恵」(Wisdom of Your Crowd)を使って検索、発見することができると標榜する検索サービスがある。米パロアルトにあるコラリティ(collarity)は、ユーザーの行動分析に基づいたパーソナライズド・サーチである。

先進ウェブ・テクノロジーを対象にした人気ブログであるリード・ライト・ウェブ(Read/WriteWeb)が2007年1月に読者投票した結果によると、「グーグルに打ち勝つ可能性の高い検索サービス」は、ハキアやパワーセットのような自然言語検索サービス、チャチャのような人力検索サービスよりも、コラリティのようなパーソナライズな検索サービスであるとした回答が多かった(22%の得票)。

例えば、”execution”という用語で検索する場合、ユーザーが財務に携わっている人であれば、この用語は会社のマネジメントを指すが、ユーザーがプログラマであれば、この用語はアプリケーションソフトウェアの稼働を指すという風に、ユーザーの日常の行動を踏まえた検索結果を示さないと、ユーザーにとっては不満に終わる場合がある。従って、どんなユーザーでも一律に同じ結果を示す検索エンジンよりも、パーソナライズな検索サービスの方が有用である訳だ。

コラリティは、ヤフーの検索エンジンを利用しているが、その検索窓の下には、「パーソナルなレベルでの検索」か、「コミュニティレベルでの検索」か、「グローバルなレベルでの検索」かをゲージで選択することができる。つまり、自分のこれまでの行動を踏まえた検索結果を求めたい場合には、パーソナルなレベルでの検索を選択すればいい。逆に、自分の行動パターンを無視した検索結果を得たい場合には、グローバルなレベルでの検索を選ぶ。

コラリティは、パーソナライズな検索サービスの中でも、行動に基づいたパーソナライズド・サーチ(Behavioral Personalized Search)である。つまり、コラリティは、パートナー関係にあるサイトの中で、ユーザーがどのような興味を持って行動しているかを、ジャバスクリプト(JavaScript)を利用して自動的に追跡している。

他方で、ロリヨ(Rollyo)やスウィキィ(Swicki)というパーソナライズド・サーチは、ユーザーの興味のあるキーワードや分野を予めユーザーが指定、入力する必要があるので、言わばマニュアルベースのパーソナライズド・サーチと言えよう。

ユーザーに特別の負担をかけることなく、いつの間にかユーザーの行動を精緻に分析した上でのオーダーメイドの検索結果を返してくれるコラリティのサービスは、究極の検索サービスになるかもしれない。

広告

まだまだ開発余地のある画像・動画検索

現在よく利用されている検索技術の対象はテキスト(文字情報)である。グーグルのイメージ検索やユーチューブの映像検索は、画像や動画の内容自体を把握して検索しているのではなく、画像や動画に付されているタグ情報やメタデータを検索しているに過ぎない。

IT環境が潤沢になる中で、ネットの大海に画像や動画が溢れている。これらのリッチな情報の中身に踏み込んで検索できる技術が確立されれば、情報の利活用の第二の波が来るかもしれない。今、画像や動画の検索技術の開発競争が本格化しつつある。

2006年11月にローンチしたライク(Like)は、10万枚以上のセレブ達の写真を掲載し、画像検索技術を用いて、セレブの持っているハンドバック、アクセサリー、靴、時計などの持ち物と似た商品をユーザーに勧めるサイトである。勿論、セレブの持ち物情報からだけではなく、紳士用腕時計などの商品情報を選択し、更に色や形を指定して商品を絞り込むこともできる。最終的に選んだ商品をクリックすると、アマゾンなどのショッピング・サイトに飛ぶようになっている。

ライクを運営する米リヤ(Riya)は、元来有していた人間の顔認識の技術を発展させ、似ている画像の検索を可能にする技術(visual signature)を開発している。この技術を使えば、画像を数学的に処理して1万種類の指数が得られ、その指数の相当数が一致すれば、画像が似ていると判断するという。ライクには、ベイ・パートナーズ(Bay Partners)、ブルーラン・ベンチャーズ(BlueRun Ventures)、リープフロッグ・ベンチャーズ(Leapfrog Ventures)などが1950万ドル投資している。現在、ライクの商品売上げ規模は年間1200万ドルであり、毎月のユニークビジター数は約100万に上る。

この画像検索技術は、利用が進むウィジェット内でも活用され始めた。人気の写真ウィジェットを提供するロックユー(RockYou)は、ライクの検索結果をウィジェット内に統合した。これにより、SNSのページを訪問したユーザーが、写真中の友人が着ている服と似た服を買いたくなれば、クリック一つで購入できるようになった。

動画検索では、ブリンクス(Blinkx)の技術が興味深い。2004年に設立されたブリンクスは、今では200以上のメディア企業と提携し、1400万時間分の動画を検索可能な状態に置いている。同社の技術は、他の検索サイトのようにテキスト情報で検索するのではなく、音声認識技術や動画分析ソフトウェアを利用しているという。同社の技術の源泉はケンブリッジ大学での研究であり、以後、1億5千万ドルもの研究開発資金が投入されて、現在の同社の技術は111の特許で保護されている。ブリンクスは、現時点では、世界最大のリッチ・メディア・コンテンツのインデックスとなっている。同社は、2007年5月にロンドンにてIPOを果たした。

画像や動画の検索技術は、まだ未成熟であり、まだまだ開発の余地がある分野である。一刻も早く開発競争の首位に立ったものが、次代の覇者になるかもしれない。

ユーザーに優しい人力検索

検索技術に長けている人は、精度の高い検索結果を得るためにどのようにディレクトリーを辿ればよいか、どんな検査キーワード(クエリー)を入力すればいいか、どんな検索テクニックを使えばよいかを知っているが、普通のユーザーはそうはいかない。では、もっと人間の要求をシステム側が正しく理解できるように、パワーセット(Powerset)のように自然言語で検索したり、ハキア(Hakia)のようにセマンティック(意味解析)な検索をしたりすることができるようになればよいが、実際、本格利用までにはまだまだ時間がかかりそうだ。ならば、人手を使ってユーザーの検索行為を手助けしようという発想が、「人力検索」である。

日本の場合、人力検索の老舗は「はてな」であるが、「マンションの隣人の女性が深夜に洗濯をして困っているが、でもその女性のことを気に入っているので交際を申し込みたいけれど、どうしたらよいか」といった悩み相談や、「どうして本や雑誌は定価販売しかないのか」といった世の中の疑問を問うような質問をし、ユーザーがあれこれ答えるというスタイルになっている。ユーザーが質問し、他のユーザーがそれに答えるという意味では、いわゆるウェブ2.0的性格をもっていると言えようが、通常、グーグルで検索するような事柄の人力検索としては利用されていない。

米インディアナポリスに拠点のあるチャチャ(ChaCha)は、「検索+人力(Search + Brainpower)」を標榜している検索サイトである。チャチャの検索窓にキーワードを入力すると、他の検索エンジンと同様に結果を一覧表示するが、その上段に、「お手伝いが必要ですか?ガイドと一緒に検索しますか?(Need help? Search with a Guide)」と表示される。「Search with Guide」のボタンをクリックすると、画面左側にガイド・セッションの欄が現れ、チャチャのガイドが「Hello. How may I help you?」とチャットで語りかけてくる。自分の探したい事柄をガイドにチャットで伝えれば、次から次へと検索結果に導いてくれる。まさしく「人力検索」である。365日、24時間いつでもガイドと話をすることができる。このガイドはロボットではなく、時給5から10ドルで雇われた本物の人間であり、チャチャはウェブサイト上でガイドになりたい人の申請を受け付けている。現在、3万人ものガイドを抱えているという。

チャチャのビジネスモデルはまだ確立していないように見受けられるが、アマゾン創業者のジェフ・ベゾス(Jeff Bezos)が同社の出資に関わっている。アマゾンは、数年前からアマゾン・メカニカル・ターク(Amazon Mechanical Turk)という、コンピュータが苦手な作業を人力で解決するサービスを展開しており(例えば、会社の倉庫に似合う看板はどれかを選択するような仕事)、人力に早くから注目していた。今後、アマゾン上での商品検索のガイドとして人力導入を検討しているのかは分からないが、その可能性に注目していることは確かだ。

次に、人力検索エンジンを標榜しているマハロ(Mahalo)を紹介したい。マハロは、予め1万ほどの検索キーワード(クエリー)に対応した検索結果ページを人力で作成している。

マハロのトップページには、ファッション、セレブのゴシップ、トラベルなど、多くのユーザーが興味を示そうなディレクトリーが並んでいる。これらのディレクトリーから階層を辿ってもいいし、検索窓にキーワードを入力してもいいが、特長的なのは、検索結果のトップに人力で予め検索した7つの検索結果(The Mahalo Top 7)が表示されることだ。マハロを使えば、グーグルなどの検索エンジンで欲しい結果が得られるまでの時間を節約することができるというのが売りである。また、マハロで検索すると、使えるリンク集が同時に表示され、これらのリンクもグーグルで探すのは容易ではないとしている。マハロは、「情報を探す時間の分だけ、コンテンツを楽しむ時間に充てて欲しい」とユーザーに訴えている。

マハロは、人力で膨大な百科事典のような情報源を予め製作しておき、検索キーワードに対応したコンテンツを表示する。いわば、ウィキペディア(Wikipedia)とグーグルとを統合したようなモデルになっている。マハロは、2008年までに25,000のクエリーに対応したいとしている。

最後に紹介したいのは、人力で検索結果の上位表示を変更するスプローズ(Sproose)である。検索キーワードを入力すると、ユーザーが適切な検索結果であると投票した数の最も多い検索結果ほど、上位に表示される。また、投票した他のユーザーの投票履歴などを見ることもでき、ユーザー間のソーシャルな関係も構築できる。いわば、ディグ(Digg)の特徴を検索サイトに応用した例である。

これから検索サービスを利用するユーザーの裾野は広がるばかり。あまり高度な検索手法に慣れていない多くのユーザー層には、人力検索は欠かせないサービスになりそうである。

姿を現し始めた自然言語検索パワーセット

あらためて言うまでもなく、検索エンジンはインターネット利用には不可欠な存在になった。米調査会社ニールセン・ネットレーティングス(Nielsen Netratings)の2007年7月のデータによれば、米国では、日本と異なりヤフー(Yahoo)(シェア20.1%)ではなく、グーグル(Google)の利用シェア(シェア53.3%)の方が大きい。グーグルが如何に大きな存在かは、時価総額(1,671億ドル)を語らずとも見た目でも分かる。シリコンバレーはマウンテンビュー(Mountain View)にあるグーグル・キャンパスに行くと、シリコン・グラフィックス(SGI)が入居していたビル群ではスペースが足りず、周辺のオフィスビルにも次々とグーグルの看板を付けている。グーグルの創業者であるラリー・ページ(Larry Page)やセルゲイ・ブリン(Sergey Brin)が乗るプライベート・ジェット機は、唯一、シリコンバレーにあるNASA専用の飛行場から離発着が許されている民間機である。また、シリコンバレーだけでなく、世界中の優秀なエンジニアが、その土地を離れずに仕事が出来るよう、ニューヨークや東京など世界中の都市にもオフィスを構築している。日本の若きエンジニア達も就職先にグーグル本社やグーグル・ジャパンを選んでいる。

米国では、この巨大なグーグルに対して、検索エンジンの世界で真っ向から勝負をかけようとしている企業が多数ある。グーグル以外の検索エンジンを解説するブログ「Alt Search Engines」では、毎月、新興検索エンジンのトップ100を紹介している。

これら新興検索エンジンには、いくつかの特徴がある。一つは、自然言語での検索を可能にしたり、人力を活用して検索したりするという、「より人間が使いやすい検索テクノロジー(Better Technology)」を使うもの。二つ目は、検索結果のプレビュー画面を見せたり、クラスターに分けて検索結果を表示したり、視覚化技術を用いて分かりやすくしたりという、「よりよいユーザー・インターフェイス(Better UI)」を使うもの。三つ目は、ブログ、不動産情報、医療情報など特定の情報分野や専門領域の検索を得意とする「垂直型の検索エンジン(Vertical Search)」である。

自然言語検索の有望格は、米パワーセット(Powerset)である。同社は、グーグルのようなキーワード検索の限界を打ち破り、人間にとって自然で直感的な検索ができるエンジンを開発中だ。例えば、グーグルを使って、”book by children”と”book for children”のキーワードで検索した場合、”by”や”for”の前置詞はグーグルでは「ストップ語」という扱いになり無視されてしまい、この2つのキーワードでの検索に違いがなくなってしまう。しかしパワーセットでは構文解析して検索するので、「子供が書いた本」なのか「子供向けの本」なのかを判別して検索結果を表示できるという。同社の技術は、一部は内部で開発されたものであるが、一部はゼロックスのパロアルト研究所(PARC)との間でライセンス契約されたものであると言う。

これまで、パワーセットの検索技術のレベルはヴェールに包まれており、一部のスクリーンショットが提供されていただけであった(“politicians who died in office”と入力すると、その意味を捉えて、事務所で死んだ政治家に関する検索結果が得られる旨、スクリーンショットで提供していた)。
2007年9月にネットテクノロジー系ブログのテッククランチ(TechCrunch)が、有望スタートアップ企業40社を紹介するイベント「テッククランチ40」を開催したが、40社のうちの1社としてパワーセットも登場し、同イベント参加者を優先的に招待するパワーセット・ラボ(Powerset Labs)を開設することを表明した。パワーセット・ラボでは、ウィキペディア(Wikipedia)上のテキスト情報の意味を解析し、構造化された事実をインデックス化するパワーマウス(Powermouse)などの試みについてのユーザーフィードバックを求めるとのことだ。これで、今まで全く非公開であったパワーセットの本当の実力が、徐々に明らかになるであろう。

学校や旅行に、スマートペン

これまでアナログであったデバイスにデジタル処理の機能を与えると、スマートなインターフェイスを持つデバイスに生まれ変わる。そういう面白い取り組みをしているのが、米ライブスクライブ(Livescribe)である。

同社は、2007年1月に成立されたばかりの会社であるが、2007年5月末にウォール・ストリート・ジャーナル紙が主催し米カールスバッドで開催された「D : ALL THINGS DIGITAL(D5)」というイベントで一躍その名が知られるようになった。このイベントで説明に立った同社の創業者兼CEOであるジム・マーグラフ(Jim Marggraff)は、紙とデジタルのギャップ(溝)を埋めるのが目的であると述べつつ、同社のプラットフォームであるスマートペン、ドット・ペーパー、ソフトウェア・アプリケーション、開発ツールを紹介した。

これまでに、ジム・マーグラフは、おもちゃ会社のリープフロッグ(LeapFrog)でフライ・ペントップ・コンピュータ(FLY Pentop Computer)を開発してきた経験を持つ。また、彼は、フライ・ペントップ・コンピュータにもライブスクライブにもデジタルペンの技術を供与しているスウェーデンのアノト(Anoto)のCEOを務めていた。

実際、万年筆ぐらいの太さを持つライブスクライブのスマートペンには、2つのマイク、スピーカー、ピクセルバー(pixel bar)と呼ばれる小さなディスプレイが備わっている。専用のドックを利用することで、PCからデータやソフトウェアの転送もできる。

ライブスクライブが提供しているスマートペンの使用イメージとしては、例えば、大学での授業で教授が板書しながら解説しているときに、このスマートペンを使ってノートに書いておく。授業が終わった後で、ノートに書いたある部分をペンでタップすると、その部分を書いていたときの教授の解説が音声で流れてくる。また、このノートをPCに取り込んで、メールで友人に送ることもでき、授業に出席していない友人も教授の解説が聞ける。

他の使用例としては、外国旅行先でタクシーに乗って、空港に向って欲しいと運転手に伝えたい場合、このスマートペンでノートに「To airport please」と書いて、ペンでタップすれば、その土地の言語に翻訳して「空港に行って下さい」としゃべってくれる。

ライブスクライブは、このスマートペンを、2008年第一四半期までに200ドル以下で提供するという。実際に手に取ってみるのが楽しみである。

次世代の主流インターフェイス?マルチタッチ・スクリーン

アップルのアイフォン(iPhone)やアイポッド・タッチ(iPodtouch)が革新的であった理由の一つが、マルチタッチ・スクリーン(Multi-Touch Screen)のインターフェイスであろう。2本の指でスクリーン上に表示された画像などを互いに斜め方向に広げるようにドラッグすると、画像が指の動きに合わせてスムーズに拡大する。このユーザーの直感に訴えたインターフェイス技術は、独のバルダ(Balda)が供給するマルチタッチ・スクリーン技術が可能にしている。

バルダは、台湾のトレンドオン・タッチ・テクノロジー(TrendON Touch Technology)との間で設立したTPKホールディングスから、インジウムスズ酸化物コーティングのガラス・モジュール(透明な電極材料)の供給を受け、エプソン製パネルに組み込んでいると言われている。米調査会社アイサプライの調査によれば、マルチタッチ・スクリーン・モジュールの価格は27ドルと、8GBのアイフォンの価格の約10.8%を占め、アイフォンの中で最も高価なデバイスである。

マイクロソフトも2007年5月に、30インチのマルチタッチ・スクリーンを利用したテーブル型コンピュータであるマイクロソフト・サーフィス(Microsoft Surface)(コードネーム:Milan)を年内に発売すると発表した。当面は、個人用ではなく、スターウッドホテルのようなホテル、レストラン、カジノ、携帯電話の小売店(Tモバイルのショップ)などに設置することを目標としている。このマルチタッチ・スクリーンは、複数箇所を検知することができる他に、スクリーン上にデジカメを置くとデジカメ内の写真データを自動的にサーフェイスの中に取り込んだり、将来的には、レストランのテーブルになっているサーフェイスの上に皆がクレジットカードを差し出すと、自動的に割り勘の金額がチャージされるようなこともできるという。

このサーフェイスは、2001年にマイクソフトのハードウェア部門のステヴィエ・バシチェ(Stevie Bathiche)と、マイクロソフト・リサーチのアンディ・ウィルソン(Andy Wilson)が、インタラクティブ・テーブルを製作しようというビジョンを描いたことに端を発する。その後、2003年に同社のニュー・コンシューマー・プロダクト・グループ所属のデビッド・カーランダー(David Kurlander)が、ビルゲイツにアイデアを話し、1ヶ月以内にプロトタイプを開発した。以後、同社内で暖められた技術がようやく花開いたのである。

このようなインテリジェントなマルチタッチ・スクリーンによるインターフェイス技術はますます面白くなっている。米タッチテーブル(TouchTable)が開発した大画面タッチスクリーン(45インチ、84インチ)は、地理的な情報をチームで共有して閲覧しながら、例えば、災害時の意思決定をする際に用いるインターフェイスとして既に実用化されている。

米ニューヨーク大学(NYU)クーラント数理科学研究所のジェフ・ハン(Jeff Han)のマルチタッチ・インタラクティブ・エクスペリメンツ(Multi-Touch Interactive Experiments)は、映画マイノリティ・レポートを想起させる。画像の拡大・縮小だけでなく、グーグル・アースの自由自在な操作、視覚的なファイル管理など、直感的な操作だけで驚くべき情報処理ができる。ジェフ・ハンによるマルチタッチ・スクリーン技術は、2006年の先端テクノロジー・イベントであるTED(Technology, Entertainment, Design)でも紹介され、多くの反響を呼んだ。現在、ジェフは、同大からのスピンオフ企業パーセプティブ・ピクセル(Perceptive Pixel)を設立し、技術移転を図ろうとしている。

今後、多くのコンピュータや民生機器にマルチタッチ・スクリーン技術が組み込まれるのが当たり前の時代になるだろう。

民生・産業応用ともに進む3次元加速度センサー

加速度を検知するインターフェイスの実用化例としては、自動車のエアバックへの適用が長い歴史をもっている。加速度センサーは1次元(1軸)から3次元(3軸)方向を検知できるほどに進化しており、今では多くの民生用機器に3次元加速度センサーが応用されている。例えば、携帯電話への3次元加速度センサーの応用例としては、歩数計代わりになるスポーツフォン(Nokia 5500 Sports)や、携帯を傾けることによる待ち受け画面の変化やゲームへの適用などのエンターテイメントフォン(N702iS、D904iなど)がある。また、多くのノートパソコンにも3次元加速度センサーが組み込まれており、落下時にハードディスクのヘッドを自動待避させ、データ損失を防ぐ衝撃保護機能として利用されている。

そして、多くの家庭で3次元加速度センサーが身近になったのは任天堂Wiiリモコン(海外では、Wii RemoteやWiimoteと呼ばれる)であろう。この加速度センサーは、STマイクロエレクトロニクスが開発したMEMS(Micro Electro Mechanical Systems:微小電気機械システム)と呼ばれる半導体技術が利用されている。半導体のチップ内に可動部分があり、外から加わる加速度によって、可動部分のフィンが移動し、非可動部分のフィンとの間隔が変化して、静電容量が変化する。その静電容量の変化を捉え、重力の影響を考慮した上で情報処理することで、Wiiのゲームが楽しめるというカラクリになっている。

このWiiリモコンをゲームだけでなく、産業訓練のインターフェイスとして利用する試みがある。MIT(マサチューセッツ工科大学)のリサーチフェローであり、ワールド・ワイヤード(WorldWired)のCEOであるデビッド・ストーン(David Stone)は、仮想世界セカンドライフの中で産業訓練シミュレーターを構築し、そのインターフェイスとしてWiiリモコンを利用する方法に注目している。

害虫駆除会社のオーキン(Orkin)は、害虫検査や農薬散布の方法を訓練するために、セカンドライフ内に建物や作業工具を作り、Wiiリモコンでアバターを操作し、害虫駆除作業の訓練を行うシミュレータの構築をワールド・ワイヤードに依頼中である。セカンドライフを利用すれば、現実世界で訓練シミュレーターを構築するよりも安上がりだ。

デビッド・ストーンは、他の産業応用例として、手術の訓練用シミュレーションや原子力プラントの操作訓練シミュレーションに、セカンドライフ+Wiiリモコンが利用できると考えている。いずれも現実世界でやろうとすると、安全性やコストの面での障害が大きい。既に、ゲームの世界では、アトラスの「カドゥケウスZ 2つの超執刀」の中でWiiリモコンを使って患部を切除したり、縫合したりするインターフェイスが組み込まれている。産業応用の訓練シミュレータでは、訓練のシナリオ作りが最も重要であり、インターフェイスはあくまで入力用デバイスに過ぎないが、Wiiリモコンは直感的な操作を可能にする人間中心のデバイスであるために、デビッド・ストーンがその可能性に着目しているのである。

そして、来年も任天堂Wiiのデバイスが話題を集めそうだ。2007年7月に米サンタモニカで開催されたE3 Media & Business Summitで、任天堂は、圧力やバランスを認識するWiiバランスボード(Wii Balance Board) を使用した健康ゲームであるWiiフィット(Wii Fit)を2008年前半に発売することをアナウンスした。

このWiiバランスボードの上で、ゲームの指示に従って、サッカーボールをヘディングするために体を傾けたり、フラフープに弾みをつけるためにお尻をふったり、ヨガのポーズを維持するためにバランスをとったり、腕立て伏せをしたりする。Wiiリモコンのときとは異なり、全身を動かして健康管理や筋力トレーニングをすることができる。ゲーム性を持つソフトで毎日健康データを蓄積することで、BMI(ボディ・マス・インデックス(Body Mass Index)、身長に対する体重の割合を基準にした体格指数)やバランス年齢などの数値の経過をグラフ化することもできる。医療から予防へと向かう時代の変化をうまく捉えた商品になるだろう。

ユニークなインターフェイス技術

音声入力インターフェイスの他に、ユニークなインターフェイス技術の取り組みを眺めてみよう。

イギリスのエレクセン(Eleksen)は、PCやiPod操作用のスマート・ファブリック・インターフェイスを提供している。布(ファブリック)自体がインターフェイスになれるということだ。エレクテックス(ElekTex)と呼ばれるタッチセンサー方式の布技術が同社のコア・テクノロジーであり、布に描いてあるボタンを「押す」だけでなく、ドラッグしたり、はじいたりする操作それぞれを区別する。伝導性のある繊維を非伝導性の布で挟む形で5層の布をラミネートしたものであり、指を縦横方向に動かすことに伴う電圧の変化を検知して情報を伝達できる仕掛けである。エレクテックスをジャンバーやジャケット、バッグの素材に使うことで、インタラクティブ・アパレルとして利用したり、携帯端末用の収納バッグ兼キーボードとしての利用などを提案している。

2000年5月に設立したイスラエルのルミオ(Lumio:2006年7月にVKBから社名変更)は、世界で初めてのヴァーチャル・レーザー・キーボードであるVKBの技術を有している。欧州最大のIT系イベントであるCeBitにおいてシーメンス(Siemens)からVKBのプロトタイプが発表されたのが最初であるが、2007年には、米国最大のIT系イベントであるコンシューマー・エレクトロニクス・ショー(CES)において、「ベスト・イノベーション2007」を獲得している。VKBをブルートゥースでPCやPDAなどのハンドヘルド端末に接続すると、レーザー光により仮想的なキーボードがテーブルや机の上に浮かび上がり、その仮想的なキーボードのキーを触ると、センサーが検知して入力作業ができるというテクノロジーである。 キーボードを持ち歩かなくてもよいという利点だけでなく、清潔さが求められる手術室や、水や油を使用する工場などでの活用が期待されている。現在、ルミオは、中国のiTech Dynamic(香港ハチソン・グループのハチソン・ハーバー・リング(Hutchison Harbour Ringが製造)にVKBのライセンスを供与している。

ロボット技術と組み合わせたユニークなインターフェイスの事例としては、米国のヘッドゼアー(Headthere)が提供するジラーフ(Giraffe)と呼ばれるテレプレゼンス・ロボットがある。人間の等身大ほどの大きさのロボットで、上部にはディスプレイがあり、遠隔地にいる人の顔を映し出す。下部の駆動機構でどこにでも移動が可能であり、あたかも遠隔地にいる友人がそこにいるかのような動作を振る舞う。ヘッドゼアーを創設したのは、カーネギーメロン大学でロボット工学を研究したロイ・サンドバーグ(Roy Sandberg)と、スタンフォード大学でコンピュータ・サイエンスを学んだダン・サンドバーグ(Dan Sandberg)の二人である。活用事例として、ビデオ会議、在宅勤務、工場内でのゲストの案内、警備巡回などが紹介されてる。見た目は人間がロボット化したように見えるので、ちょっと奇妙ではある。気になるジラーフの価格は、1800ドルから3000ドルの間で販売が予定されているようだ。

電話での音声認識サービス競争

文字情報以外にインターフェイスとして使いやすい情報形態は音声であろう。画像情報は出力情報としては分かりやすいが、人間の意志を入力する情報としては使いづらい。米国では、オフィスでスピーチ・レコグニション・ソフトウェア(Speech Recognition Software)を使って文書を作成したり、スマートフォンに届いたメールの内容を音声で読み上げさせたりと、音声を入出力デバイスとして使用するのは日常的である。

電話での応答サービスの場合でも、例えば、クレジットカード会社のコールセンターに電話をした場合、「英語かスペイン語か」、「バランスの確認か、次回の支払金額か、クレジット上限の引き上げか、カスタマー担当者と話したいか」と聞かれ、メニュー番号ではなく、「Balance」などと音声で話すと次のメニューに行くというように、音声入力での応答が当たり前になっている。

そして、今、音声入力での競争が激しいのは、電話番号案内コール市場である。米国では、電話番号での案内サービスは「411」をダイヤルするが、これは1通話当たり1.49ドルから3.49ドルの有料サービスで、総額年間80億ドルほどの市場であると言われている。

ジングル・ネットワークス(Jingle Networks)は、2005年9月に電話番号案内の無料サービスを開始した老舗企業である。利用者が「1-800-Free411」をダイヤルすると、10秒程度の広告を聞くだけで無料で電話番号を入手できる。スカイプ(Skype)からも利用可能だ。また、インターネットからもFree411.comにアクセスすると、同様に無料で電話番号が入手できる。2007年4月までに2億回の利用があり、全米411市場のシェア6%を取るまでに成長している。

電話会社として危機感を募らせたAT&Tは、 2006年12月、ジングル・ネットワークスの競合である「1-800-411-Metro」の運営会社であるインフリー・ディーエー(InFreeDA)を買収して、無料の電話番号案内サービス「1-800-Yellowpages」を始めるとアナウンスした。

そして、2007年4月に、情報の検索の雄であるグーグルもグーグル・ラボ(Google Lab)のサービスとして無料電話番号案内の「Goog-411」を開始した。グーグルの場合には、人力で答えることがなく、音声で話した州や市の名前、社名や業種の情報を認識し、自動応答する。「Text Message」と言えば、ショートメッセージで詳細情報を入手することもできる。

追い打ちをかけるように、2007年5月にマイクロソフトは、急成長中の無料電話案内サービス企業のテルミー(Tellme)を買収した。テルミーの場合には、3通りの検索方法がある。音声とショートメッセージによる検索は、グーグルと同じであるが、更に専用のJavaアプリを携帯電話にダウンロードして検索する方法も用意されている。この場合、都市名や業種名(インド料理レストランなど)を言うと、該当する店のリストが表示され、さらに地図や道順などを表示することができる。

携帯電話の音声関連のインターフェイスは、番号案内だけではない。イギリスのスピンヴォックス(Spinvox)は、音声での留守録の内容をショートメッセージやメールに変換するサービスを提供している。

また、米マサチューセッツのヴリンゴ(Vlingo)が提供するファインド(FIND)と呼ばれるアプリケーションを利用すると、ボタン操作を全くせずに音声情報だけで友人にショートメッセージを送ることができる。

携帯電話がPC代わりになっている日本とは事情が大きく異なるが、このように海外では、携帯電話の音声情報の認識技術の開発とそれを利用したサービス競争が盛んなのである。

データ版ユーチューブ

人間の五感とコンピュータとの接点という意味でのインターフェイスには、長い進化の歴史がある。シリコンバレーはマウンテンビュー(Mountain View)のグーグル本社の近くにあるコンピュータ歴史博物館(Computer History Museum)に行くと、木で製作されたマウスなどが展示されており、先人達がインターフェイスの研究開発に取り組んできた苦労が分かる。いずれのインターフェイスも人間の簡単な入力操作で必要な情報をコンピュータに伝え、コンピュータ内で処理された情報を如何に人間に分かりやすい形で出力するかという面で工夫がなされてきた。

そして、IT環境が潤沢になった今では、コンピュータの情報処理量が増えたために、音声や画像などを利用したリッチなインターフェイスが日常的に使用されるようになった。また、各種センサー技術の進展とも相まって、加速度や圧力など力学的な情報もコンピュータ側に伝えることが可能となるなど、人間にとって直感的につかみやすいインターフェイスが開発されている。

このように、インターフェイスは人間とコンピュータとを結ぶ情報仲介者であるというのが基本であるが、最近では、膨大な情報(データ)を視覚化(Visualization)することで、これまで見えなかった情報の持つ意味を新たに人間に気づかせる役目まで果たすことができるようになっている。

2007年1月にIBMのビジュアル・コミュニケーション・ラボ(Visual Communication Lab)が発表したメニー・アイズ(Many Eyes)は、膨大なデータを視覚化し、これまで文字や数字の羅列だけを眺めていただけでは分からなかったパターン(Pattern)を人間に発見させてくれるテクノロジーである。会社の売上げデータからフットボールの試合結果、はたまた構造化されていない電子メールの情報に至るまで、あらゆるデータを視覚化し、また、これらのデータどうしにソーシャルな性格を持たせる機能ももっている。

ユーザーが所有するデータをメニー・アイズのフォームに読み込ませると、16種類の好きなデータチャート(ネットワーク・ダイアグラム(Network Diagram)、トゥリーマップ(Treemap)、バブルチャート(Bubble Chart)、タグ・クラウド(Tag Cloud)など)を選んで、Flashベースでビジュアルに眺めることができる。眺めるだけではなく、出来上がったチャートを違ったデータチャートで見たり、データサブセットの検索や解析も行うことができる。例えば、タグ・クラウドを選択した場合、長文のスピーチ原稿をメニー・アイズに読み込ませると、そのスピーチの中で使用頻度の高い単語が何かをすぐに判別することができる。あるいは、あるイベントの膨大な参加者リストを読み込ませると、参加者にどういう傾向があるが分かるという訳だ。

また、視覚化されたデータをブログに貼り付けたり、タグ付け(Tagging)やレーティングしたりすることにより、これらのデータを介してユーザー間にソーシャルな関係を持たせることができる。例えば、経済学者達がそれぞれ分析データを持ち寄ってメニー・アイズにアップし、タグを介してコミュニケーションを取ることなどが想定されるだろう。その意味で、メニー・アイズは、「データ版ユーチューブ(YouTube)」、「データ版フリッカー(Flickr)」と言い換えることもできる。

メニー・アイズ同様に、「データ版ユーチューブ」と言われているのが、スウィヴェル(Swivel)だ。2007年4月にサンフランシスコで開催されたWeb2.0Expoというイベントで、同社のCEOであるブライアン・マロイ(Brian Mulloy)がスウィヴェルのサービス内容を紹介していた。基本的には、メニー・アイズと同様の機能をもっており、実際に、OECD(経済協力開発機構)からのデータ提供も受けているとPRしていた。スウィヴェルは、アップロードしたチャートに対して、他のユーザーがコメントを付ける機能も備えており、メニー・アイズ同様にソーシャルメディアを意識している。

どちらも、データの視覚化とソーシャライズにより、ユーザーに新たな発見を与えるインターフェイス・テクノロジーである。

« Older entries Newer entries »