ITエンジニアのための勉強会・イベントレポート情報メディア

スマートスピーカーでAIのミニ ”シンギュラリティ”が起こる
trend

スマートスピーカーでAIのミニ ”シンギュラリティ”が起こる

2018.02.06

 
  • このエントリーをはてなブックマークに追加

スマートスピーカー「Google Home」が日本で発売されましたが、早速使ってみて期待したほど賢くないことにがっかりしている方もいるかもしれません。それはGoogleが意図した不便さです。今は失敗が多くても、大量の会話サンプルに触れられるようになったAIアシスタントの成長ペースが加速し、やがて「ミニ・シンギュラリティが起こる」と、Googleで自然言語認識のプロジェクトを率いるフェルナンド・ペレイラ氏は述べています。(山下洋一)

山下洋一

日本でついにスマートスピーカー発売

米国で新たなスマートデバイス市場として定着したスマートスピーカー。その1つである「Google Home」が日本で発売されました。スマートスピーカーの開拓者であるAmazon「Echo」が米国で発売されたのが2015年ですから、日本では2年遅れの登場になります。その分、使える機能が成熟しているはずですが、使ってみて期待したほど賢くないことにがっかりしている人もいるかもしれません。でも、それはGoogleが意図したものであり、その不便さが人工知能(AI)の飛躍的な成長を実現すると、Googleで自然言語認識のプロジェクトを率いるフェルナンド・ペレイラ氏は述べています。

米国では後発でしたが、日本にはAmazonのEchoよりも先に上陸した「Google Home」

2016年〜2017年は重要な移行期間

シリコンバレーにあるコンピュータ歴史博物館で10月に「The Understanding Computer」と題したペレイラ氏の公開インタビューが行われました。自然言語認識のエキスパートである自身のキャリアを振り返り、Googleで手がける大きなプロジェクトの今後について語るイベントでした。
同氏は、2016年〜2017年をGoogleの自然言語処理技術の「移行(Transition)の時期」と表現していました。言い換えると「開花の時期」です。
Google検索が登場してから19年間で、Google検索は賢く成長しました。たとえば「サンフランシスコ イタリアン レストラン おすすめ」と検索すると、19年前はキーワードを単純に参照して結果を並べるだけでしたが、今はユーザーが美味しい店を探していると考えて、レストランのランキングや評価の高い店の情報を優先して結果に表示します。でも、キーワードを並べて検索していることに変わりはありません。普通に質問するなら「サンフランシスコでおすすめのレストランは?」と聞くはずですよね。次のステップは、利用者が自然な言葉で、会話するように検索できるようにすること。そのためには、言葉を解するだけではなく、より深い”理解力”が必要になります。

Googleで自然言語認識と機会学習のプロジェクトを率いるフェルナンド・ペレイラ氏。

会話のサンプルを収集するスマートスピーカー

私たちは普段の会話において、全て言葉からだけで内容を把握しているのではありません。誰のことを話しているのかとか、誰と誰が関わっているのか、その人たちの関係といった関連する情報も引き出しながら、会話の内容を理解し、会話を広げています。「それはどういうこと?」の「それ」が意味するものは、前の文脈を踏まえたり、質問の背景にある情報を理解していないと分かりません。
単語と文法を詰め込めば、ある程度は言葉を解せるようになりますが、それだけでシステムが自然な会話を続けられるようにはなりません。学習を通じてシステムが自ら「それ」が意味することを考え、答えを出せるようになる必要があります。それによって、システムがユーザーのことを深く理解して手助けできるアシスタントになります。
ペレイラ氏の言う「移行」とは、言語処理システムに言葉を教え込む段階から、言語処理システムが自ら学んでどんどん賢くなっていくフェーズへの移行です。2016年〜2017年に移行が可能になる背景には、ニューラルネットワークによる機械学習技術の成長があります。ただし、移行の実現にはもう1つ必要なものがあります。AIアシスタントを鍛えていくための大量のデータ、会話のサンプルです。今、AIアシスタントは19年前にGoogle検索が登場した時と同じ状態です。とてもシンプルで、できることは限られます。そして、これからユーザーと共に成長していく段階です。

Google検索に「Book me a table at Zuni Cafe for 8 pm for two(Zuni Cafeに、午後8時に2人で予約して)」と入れたら、結果からレストランを予約できるのをご存じでしたか?
すでにGoogle検索において、いくつかのタスクは自然な言葉で頼めるようになっています。そうした自然言語で使える検索機能を使ってもらえたら、少しずつGoogle検索は言葉を理解する力を向上していけます。でも、ほとんどの人が気づいていません。ただ、「Zuni Cafe」とキーワード検索しているのが現状です。それでは、システムの言語力は向上しません。でも、スマートスピーカーであれば、音声インターフェイスに絞り込まれているので、ユーザーはAIアシスタントとの会話に努めます。だから、スマートスピーカーはAIの言語認識の成長においてとても重要なのです。

AIアシスタントが日本語力を身に付ける二年間

「予約して」「空いている?」「開いている?」「午後8時」「8PM」など、ディナーの場所を決める検索でも様々な表現があります。最初は少ないパターンにしか正確に対応できず、Googleアシスタントはすぐに「Sorry、I can’t help with that」と白旗を揚げてしまいます。そうした失敗の後、ユーザーが言い直してうまくタスクを完了できたら、そこからAIアシスタントは理解できなかった表現を学び、少しずつ対応できる幅を広げます。
「ユーザーはそれを失敗と見なすでしょうが、それは移行の一部であり、Googleは改善のチャンスと見なします」とペレイラ氏は指摘していました。

Googleアシスタントが失敗を積み重ねながら自然な言葉を学習し、次第に会話が続くようになっていきます。ただ、その移行が2016年〜2017年に起こるのは米国(US英語)の話です。日本では、AIアシスタントが日本語の会話を本格的に学び始めたばかりです。だから、AIアシスタントが期待したほど賢くなくても、そこで見捨ててはいけません。これからの2年の間に、スマートスピーカーや他のAIアシスタントを使えるデバイスを通じて日本語の会話のデータがどんどん蓄積されていき、AIアシスタントは自然な言葉を理解する力や会話力をとんどん高めていきます。それを見守っていくと、やがて「ミニ・シンギュラリティを迎える」とペレイラ氏は述べていました。

原稿:山下洋一
サブカルチャーとテクノロジーの交差点に軸足を置いて、人や会社、文化、時事問題など幅広く取材しています。シリコンバレーで暮らし始めて10数年。PC産業の街がウェブ・ITの一大拠点に姿を変えるのを目の当たりにしてきました。ダイナミズムと人の面白さに魅了されて、このカリフォルニアの田舎街から離れられずにいます。

スマートスピーカーでAIのミニ ”シンギュラリティ”が起こる

この記事はどうでしたか?

おすすめの記事

キャリアを考える

BACK TO TOP ∧

FOLLOW