学校や旅行に、スマートペン

これまでアナログであったデバイスにデジタル処理の機能を与えると、スマートなインターフェイスを持つデバイスに生まれ変わる。そういう面白い取り組みをしているのが、米ライブスクライブ(Livescribe)である。

同社は、2007年1月に成立されたばかりの会社であるが、2007年5月末にウォール・ストリート・ジャーナル紙が主催し米カールスバッドで開催された「D : ALL THINGS DIGITAL(D5)」というイベントで一躍その名が知られるようになった。このイベントで説明に立った同社の創業者兼CEOであるジム・マーグラフ(Jim Marggraff)は、紙とデジタルのギャップ(溝)を埋めるのが目的であると述べつつ、同社のプラットフォームであるスマートペン、ドット・ペーパー、ソフトウェア・アプリケーション、開発ツールを紹介した。

これまでに、ジム・マーグラフは、おもちゃ会社のリープフロッグ(LeapFrog)でフライ・ペントップ・コンピュータ(FLY Pentop Computer)を開発してきた経験を持つ。また、彼は、フライ・ペントップ・コンピュータにもライブスクライブにもデジタルペンの技術を供与しているスウェーデンのアノト(Anoto)のCEOを務めていた。

実際、万年筆ぐらいの太さを持つライブスクライブのスマートペンには、2つのマイク、スピーカー、ピクセルバー(pixel bar)と呼ばれる小さなディスプレイが備わっている。専用のドックを利用することで、PCからデータやソフトウェアの転送もできる。

ライブスクライブが提供しているスマートペンの使用イメージとしては、例えば、大学での授業で教授が板書しながら解説しているときに、このスマートペンを使ってノートに書いておく。授業が終わった後で、ノートに書いたある部分をペンでタップすると、その部分を書いていたときの教授の解説が音声で流れてくる。また、このノートをPCに取り込んで、メールで友人に送ることもでき、授業に出席していない友人も教授の解説が聞ける。

他の使用例としては、外国旅行先でタクシーに乗って、空港に向って欲しいと運転手に伝えたい場合、このスマートペンでノートに「To airport please」と書いて、ペンでタップすれば、その土地の言語に翻訳して「空港に行って下さい」としゃべってくれる。

ライブスクライブは、このスマートペンを、2008年第一四半期までに200ドル以下で提供するという。実際に手に取ってみるのが楽しみである。

広告

次世代の主流インターフェイス?マルチタッチ・スクリーン

アップルのアイフォン(iPhone)やアイポッド・タッチ(iPodtouch)が革新的であった理由の一つが、マルチタッチ・スクリーン(Multi-Touch Screen)のインターフェイスであろう。2本の指でスクリーン上に表示された画像などを互いに斜め方向に広げるようにドラッグすると、画像が指の動きに合わせてスムーズに拡大する。このユーザーの直感に訴えたインターフェイス技術は、独のバルダ(Balda)が供給するマルチタッチ・スクリーン技術が可能にしている。

バルダは、台湾のトレンドオン・タッチ・テクノロジー(TrendON Touch Technology)との間で設立したTPKホールディングスから、インジウムスズ酸化物コーティングのガラス・モジュール(透明な電極材料)の供給を受け、エプソン製パネルに組み込んでいると言われている。米調査会社アイサプライの調査によれば、マルチタッチ・スクリーン・モジュールの価格は27ドルと、8GBのアイフォンの価格の約10.8%を占め、アイフォンの中で最も高価なデバイスである。

マイクロソフトも2007年5月に、30インチのマルチタッチ・スクリーンを利用したテーブル型コンピュータであるマイクロソフト・サーフィス(Microsoft Surface)(コードネーム:Milan)を年内に発売すると発表した。当面は、個人用ではなく、スターウッドホテルのようなホテル、レストラン、カジノ、携帯電話の小売店(Tモバイルのショップ)などに設置することを目標としている。このマルチタッチ・スクリーンは、複数箇所を検知することができる他に、スクリーン上にデジカメを置くとデジカメ内の写真データを自動的にサーフェイスの中に取り込んだり、将来的には、レストランのテーブルになっているサーフェイスの上に皆がクレジットカードを差し出すと、自動的に割り勘の金額がチャージされるようなこともできるという。

このサーフェイスは、2001年にマイクソフトのハードウェア部門のステヴィエ・バシチェ(Stevie Bathiche)と、マイクロソフト・リサーチのアンディ・ウィルソン(Andy Wilson)が、インタラクティブ・テーブルを製作しようというビジョンを描いたことに端を発する。その後、2003年に同社のニュー・コンシューマー・プロダクト・グループ所属のデビッド・カーランダー(David Kurlander)が、ビルゲイツにアイデアを話し、1ヶ月以内にプロトタイプを開発した。以後、同社内で暖められた技術がようやく花開いたのである。

このようなインテリジェントなマルチタッチ・スクリーンによるインターフェイス技術はますます面白くなっている。米タッチテーブル(TouchTable)が開発した大画面タッチスクリーン(45インチ、84インチ)は、地理的な情報をチームで共有して閲覧しながら、例えば、災害時の意思決定をする際に用いるインターフェイスとして既に実用化されている。

米ニューヨーク大学(NYU)クーラント数理科学研究所のジェフ・ハン(Jeff Han)のマルチタッチ・インタラクティブ・エクスペリメンツ(Multi-Touch Interactive Experiments)は、映画マイノリティ・レポートを想起させる。画像の拡大・縮小だけでなく、グーグル・アースの自由自在な操作、視覚的なファイル管理など、直感的な操作だけで驚くべき情報処理ができる。ジェフ・ハンによるマルチタッチ・スクリーン技術は、2006年の先端テクノロジー・イベントであるTED(Technology, Entertainment, Design)でも紹介され、多くの反響を呼んだ。現在、ジェフは、同大からのスピンオフ企業パーセプティブ・ピクセル(Perceptive Pixel)を設立し、技術移転を図ろうとしている。

今後、多くのコンピュータや民生機器にマルチタッチ・スクリーン技術が組み込まれるのが当たり前の時代になるだろう。

民生・産業応用ともに進む3次元加速度センサー

加速度を検知するインターフェイスの実用化例としては、自動車のエアバックへの適用が長い歴史をもっている。加速度センサーは1次元(1軸)から3次元(3軸)方向を検知できるほどに進化しており、今では多くの民生用機器に3次元加速度センサーが応用されている。例えば、携帯電話への3次元加速度センサーの応用例としては、歩数計代わりになるスポーツフォン(Nokia 5500 Sports)や、携帯を傾けることによる待ち受け画面の変化やゲームへの適用などのエンターテイメントフォン(N702iS、D904iなど)がある。また、多くのノートパソコンにも3次元加速度センサーが組み込まれており、落下時にハードディスクのヘッドを自動待避させ、データ損失を防ぐ衝撃保護機能として利用されている。

そして、多くの家庭で3次元加速度センサーが身近になったのは任天堂Wiiリモコン(海外では、Wii RemoteやWiimoteと呼ばれる)であろう。この加速度センサーは、STマイクロエレクトロニクスが開発したMEMS(Micro Electro Mechanical Systems:微小電気機械システム)と呼ばれる半導体技術が利用されている。半導体のチップ内に可動部分があり、外から加わる加速度によって、可動部分のフィンが移動し、非可動部分のフィンとの間隔が変化して、静電容量が変化する。その静電容量の変化を捉え、重力の影響を考慮した上で情報処理することで、Wiiのゲームが楽しめるというカラクリになっている。

このWiiリモコンをゲームだけでなく、産業訓練のインターフェイスとして利用する試みがある。MIT(マサチューセッツ工科大学)のリサーチフェローであり、ワールド・ワイヤード(WorldWired)のCEOであるデビッド・ストーン(David Stone)は、仮想世界セカンドライフの中で産業訓練シミュレーターを構築し、そのインターフェイスとしてWiiリモコンを利用する方法に注目している。

害虫駆除会社のオーキン(Orkin)は、害虫検査や農薬散布の方法を訓練するために、セカンドライフ内に建物や作業工具を作り、Wiiリモコンでアバターを操作し、害虫駆除作業の訓練を行うシミュレータの構築をワールド・ワイヤードに依頼中である。セカンドライフを利用すれば、現実世界で訓練シミュレーターを構築するよりも安上がりだ。

デビッド・ストーンは、他の産業応用例として、手術の訓練用シミュレーションや原子力プラントの操作訓練シミュレーションに、セカンドライフ+Wiiリモコンが利用できると考えている。いずれも現実世界でやろうとすると、安全性やコストの面での障害が大きい。既に、ゲームの世界では、アトラスの「カドゥケウスZ 2つの超執刀」の中でWiiリモコンを使って患部を切除したり、縫合したりするインターフェイスが組み込まれている。産業応用の訓練シミュレータでは、訓練のシナリオ作りが最も重要であり、インターフェイスはあくまで入力用デバイスに過ぎないが、Wiiリモコンは直感的な操作を可能にする人間中心のデバイスであるために、デビッド・ストーンがその可能性に着目しているのである。

そして、来年も任天堂Wiiのデバイスが話題を集めそうだ。2007年7月に米サンタモニカで開催されたE3 Media & Business Summitで、任天堂は、圧力やバランスを認識するWiiバランスボード(Wii Balance Board) を使用した健康ゲームであるWiiフィット(Wii Fit)を2008年前半に発売することをアナウンスした。

このWiiバランスボードの上で、ゲームの指示に従って、サッカーボールをヘディングするために体を傾けたり、フラフープに弾みをつけるためにお尻をふったり、ヨガのポーズを維持するためにバランスをとったり、腕立て伏せをしたりする。Wiiリモコンのときとは異なり、全身を動かして健康管理や筋力トレーニングをすることができる。ゲーム性を持つソフトで毎日健康データを蓄積することで、BMI(ボディ・マス・インデックス(Body Mass Index)、身長に対する体重の割合を基準にした体格指数)やバランス年齢などの数値の経過をグラフ化することもできる。医療から予防へと向かう時代の変化をうまく捉えた商品になるだろう。

ユニークなインターフェイス技術

音声入力インターフェイスの他に、ユニークなインターフェイス技術の取り組みを眺めてみよう。

イギリスのエレクセン(Eleksen)は、PCやiPod操作用のスマート・ファブリック・インターフェイスを提供している。布(ファブリック)自体がインターフェイスになれるということだ。エレクテックス(ElekTex)と呼ばれるタッチセンサー方式の布技術が同社のコア・テクノロジーであり、布に描いてあるボタンを「押す」だけでなく、ドラッグしたり、はじいたりする操作それぞれを区別する。伝導性のある繊維を非伝導性の布で挟む形で5層の布をラミネートしたものであり、指を縦横方向に動かすことに伴う電圧の変化を検知して情報を伝達できる仕掛けである。エレクテックスをジャンバーやジャケット、バッグの素材に使うことで、インタラクティブ・アパレルとして利用したり、携帯端末用の収納バッグ兼キーボードとしての利用などを提案している。

2000年5月に設立したイスラエルのルミオ(Lumio:2006年7月にVKBから社名変更)は、世界で初めてのヴァーチャル・レーザー・キーボードであるVKBの技術を有している。欧州最大のIT系イベントであるCeBitにおいてシーメンス(Siemens)からVKBのプロトタイプが発表されたのが最初であるが、2007年には、米国最大のIT系イベントであるコンシューマー・エレクトロニクス・ショー(CES)において、「ベスト・イノベーション2007」を獲得している。VKBをブルートゥースでPCやPDAなどのハンドヘルド端末に接続すると、レーザー光により仮想的なキーボードがテーブルや机の上に浮かび上がり、その仮想的なキーボードのキーを触ると、センサーが検知して入力作業ができるというテクノロジーである。 キーボードを持ち歩かなくてもよいという利点だけでなく、清潔さが求められる手術室や、水や油を使用する工場などでの活用が期待されている。現在、ルミオは、中国のiTech Dynamic(香港ハチソン・グループのハチソン・ハーバー・リング(Hutchison Harbour Ringが製造)にVKBのライセンスを供与している。

ロボット技術と組み合わせたユニークなインターフェイスの事例としては、米国のヘッドゼアー(Headthere)が提供するジラーフ(Giraffe)と呼ばれるテレプレゼンス・ロボットがある。人間の等身大ほどの大きさのロボットで、上部にはディスプレイがあり、遠隔地にいる人の顔を映し出す。下部の駆動機構でどこにでも移動が可能であり、あたかも遠隔地にいる友人がそこにいるかのような動作を振る舞う。ヘッドゼアーを創設したのは、カーネギーメロン大学でロボット工学を研究したロイ・サンドバーグ(Roy Sandberg)と、スタンフォード大学でコンピュータ・サイエンスを学んだダン・サンドバーグ(Dan Sandberg)の二人である。活用事例として、ビデオ会議、在宅勤務、工場内でのゲストの案内、警備巡回などが紹介されてる。見た目は人間がロボット化したように見えるので、ちょっと奇妙ではある。気になるジラーフの価格は、1800ドルから3000ドルの間で販売が予定されているようだ。

電話での音声認識サービス競争

文字情報以外にインターフェイスとして使いやすい情報形態は音声であろう。画像情報は出力情報としては分かりやすいが、人間の意志を入力する情報としては使いづらい。米国では、オフィスでスピーチ・レコグニション・ソフトウェア(Speech Recognition Software)を使って文書を作成したり、スマートフォンに届いたメールの内容を音声で読み上げさせたりと、音声を入出力デバイスとして使用するのは日常的である。

電話での応答サービスの場合でも、例えば、クレジットカード会社のコールセンターに電話をした場合、「英語かスペイン語か」、「バランスの確認か、次回の支払金額か、クレジット上限の引き上げか、カスタマー担当者と話したいか」と聞かれ、メニュー番号ではなく、「Balance」などと音声で話すと次のメニューに行くというように、音声入力での応答が当たり前になっている。

そして、今、音声入力での競争が激しいのは、電話番号案内コール市場である。米国では、電話番号での案内サービスは「411」をダイヤルするが、これは1通話当たり1.49ドルから3.49ドルの有料サービスで、総額年間80億ドルほどの市場であると言われている。

ジングル・ネットワークス(Jingle Networks)は、2005年9月に電話番号案内の無料サービスを開始した老舗企業である。利用者が「1-800-Free411」をダイヤルすると、10秒程度の広告を聞くだけで無料で電話番号を入手できる。スカイプ(Skype)からも利用可能だ。また、インターネットからもFree411.comにアクセスすると、同様に無料で電話番号が入手できる。2007年4月までに2億回の利用があり、全米411市場のシェア6%を取るまでに成長している。

電話会社として危機感を募らせたAT&Tは、 2006年12月、ジングル・ネットワークスの競合である「1-800-411-Metro」の運営会社であるインフリー・ディーエー(InFreeDA)を買収して、無料の電話番号案内サービス「1-800-Yellowpages」を始めるとアナウンスした。

そして、2007年4月に、情報の検索の雄であるグーグルもグーグル・ラボ(Google Lab)のサービスとして無料電話番号案内の「Goog-411」を開始した。グーグルの場合には、人力で答えることがなく、音声で話した州や市の名前、社名や業種の情報を認識し、自動応答する。「Text Message」と言えば、ショートメッセージで詳細情報を入手することもできる。

追い打ちをかけるように、2007年5月にマイクロソフトは、急成長中の無料電話案内サービス企業のテルミー(Tellme)を買収した。テルミーの場合には、3通りの検索方法がある。音声とショートメッセージによる検索は、グーグルと同じであるが、更に専用のJavaアプリを携帯電話にダウンロードして検索する方法も用意されている。この場合、都市名や業種名(インド料理レストランなど)を言うと、該当する店のリストが表示され、さらに地図や道順などを表示することができる。

携帯電話の音声関連のインターフェイスは、番号案内だけではない。イギリスのスピンヴォックス(Spinvox)は、音声での留守録の内容をショートメッセージやメールに変換するサービスを提供している。

また、米マサチューセッツのヴリンゴ(Vlingo)が提供するファインド(FIND)と呼ばれるアプリケーションを利用すると、ボタン操作を全くせずに音声情報だけで友人にショートメッセージを送ることができる。

携帯電話がPC代わりになっている日本とは事情が大きく異なるが、このように海外では、携帯電話の音声情報の認識技術の開発とそれを利用したサービス競争が盛んなのである。

データ版ユーチューブ

人間の五感とコンピュータとの接点という意味でのインターフェイスには、長い進化の歴史がある。シリコンバレーはマウンテンビュー(Mountain View)のグーグル本社の近くにあるコンピュータ歴史博物館(Computer History Museum)に行くと、木で製作されたマウスなどが展示されており、先人達がインターフェイスの研究開発に取り組んできた苦労が分かる。いずれのインターフェイスも人間の簡単な入力操作で必要な情報をコンピュータに伝え、コンピュータ内で処理された情報を如何に人間に分かりやすい形で出力するかという面で工夫がなされてきた。

そして、IT環境が潤沢になった今では、コンピュータの情報処理量が増えたために、音声や画像などを利用したリッチなインターフェイスが日常的に使用されるようになった。また、各種センサー技術の進展とも相まって、加速度や圧力など力学的な情報もコンピュータ側に伝えることが可能となるなど、人間にとって直感的につかみやすいインターフェイスが開発されている。

このように、インターフェイスは人間とコンピュータとを結ぶ情報仲介者であるというのが基本であるが、最近では、膨大な情報(データ)を視覚化(Visualization)することで、これまで見えなかった情報の持つ意味を新たに人間に気づかせる役目まで果たすことができるようになっている。

2007年1月にIBMのビジュアル・コミュニケーション・ラボ(Visual Communication Lab)が発表したメニー・アイズ(Many Eyes)は、膨大なデータを視覚化し、これまで文字や数字の羅列だけを眺めていただけでは分からなかったパターン(Pattern)を人間に発見させてくれるテクノロジーである。会社の売上げデータからフットボールの試合結果、はたまた構造化されていない電子メールの情報に至るまで、あらゆるデータを視覚化し、また、これらのデータどうしにソーシャルな性格を持たせる機能ももっている。

ユーザーが所有するデータをメニー・アイズのフォームに読み込ませると、16種類の好きなデータチャート(ネットワーク・ダイアグラム(Network Diagram)、トゥリーマップ(Treemap)、バブルチャート(Bubble Chart)、タグ・クラウド(Tag Cloud)など)を選んで、Flashベースでビジュアルに眺めることができる。眺めるだけではなく、出来上がったチャートを違ったデータチャートで見たり、データサブセットの検索や解析も行うことができる。例えば、タグ・クラウドを選択した場合、長文のスピーチ原稿をメニー・アイズに読み込ませると、そのスピーチの中で使用頻度の高い単語が何かをすぐに判別することができる。あるいは、あるイベントの膨大な参加者リストを読み込ませると、参加者にどういう傾向があるが分かるという訳だ。

また、視覚化されたデータをブログに貼り付けたり、タグ付け(Tagging)やレーティングしたりすることにより、これらのデータを介してユーザー間にソーシャルな関係を持たせることができる。例えば、経済学者達がそれぞれ分析データを持ち寄ってメニー・アイズにアップし、タグを介してコミュニケーションを取ることなどが想定されるだろう。その意味で、メニー・アイズは、「データ版ユーチューブ(YouTube)」、「データ版フリッカー(Flickr)」と言い換えることもできる。

メニー・アイズ同様に、「データ版ユーチューブ」と言われているのが、スウィヴェル(Swivel)だ。2007年4月にサンフランシスコで開催されたWeb2.0Expoというイベントで、同社のCEOであるブライアン・マロイ(Brian Mulloy)がスウィヴェルのサービス内容を紹介していた。基本的には、メニー・アイズと同様の機能をもっており、実際に、OECD(経済協力開発機構)からのデータ提供も受けているとPRしていた。スウィヴェルは、アップロードしたチャートに対して、他のユーザーがコメントを付ける機能も備えており、メニー・アイズ同様にソーシャルメディアを意識している。

どちらも、データの視覚化とソーシャライズにより、ユーザーに新たな発見を与えるインターフェイス・テクノロジーである。