チャットボットが導く、次世代教育の可能性
日本ではまだまだな感はありつつも、欧米諸国では数多の企業が顧客との窓口GUIとして取り入れようとしているチャットボット。
様々なケースの使い道が出現しているのにもかかわらず、まだ脚光を浴びていない非常に重要な分野がある。それは"教育"だ。
我々はメッセージングアプリで多種多様なやり取りをする。
とりとめもない雑談をしたり、明日の予定を話し合ったり、何かわからないことを友人に聞いたり。
これはつまり情報を文字情報として送り出し、疑問を質問し、答えを返し、関連するリンクや画像を送ったりと、教育と根本的に同じことをしている。
誰かに教え、教えられるのだ。であれば、教育もチャットボットにすることができるのではないかというわけである。
教育分野の自動化
教育分野でのチャットボットの先駆けとも言えるのがNerdify Botだ。
このボットはいわゆる理系の領域(数学、化学、物理など)の領域についての質問を幅広く受け取り、必要な時には画像やリンク付きで解凍してくれる。
言語処理できなかった問いについては「ふむむそれについては答えるのに時間がかかる待っててくれ!」「ちょっと難しいな、また今度答えるよ」などと人間味あふれる回答をしてくれる。
ここに既存の教育系アプリとの差別化があると開発者のAlexey Pokatilo(Nerdify, Awesome Botsの共同創業者)は語る。
彼がNerdify botを分析してみて気づいたことは、たとえボット側にそれを理解する術がなくとも、一様に利用者がボットに対して感謝の意を表していることだ。
究極的にはコードの集合であるボットを人間のように扱っている、つまりある種の絆が生まれていることになるのだ。
これはオフラインでの教育として非常に大事な要素であるという。
筆者も実際にいじってみたが、なるほどこれはなかなか面白いと思った。開発者が話している通り、現状の教育アプリはどこか味気なく、ゲーミフィケーションを駆使してユーザーが長続きする仕組みがあったとしてもどこか続けようと思えるものはなかった。
ところがこのNerdify botはどこか愛着を沸かせてくるものがある。なんとなく、「このボット頑張って対応してくれてるな」と人間臭さを感じてしまうのだ。
まだまだ市場開拓の段階にあるボット市場だが、これで英語と理系科目を学ぶことができる。
一度試してみてはいかがだろうか?
イーロン・マスクbot誕生
著名人というものはメディアから引っ張りだこであるものだ。
数多のインタビューを受け、それらはさまざまな媒体にて公開される。しかしこう言ったインタビュー記事を見ているとまたこの質問か、と同じようなものであったり至極当たり前のものを聞いているものがなかなか多い。
著名人の側としても辟易しているのではないかと推測する。
と、そう言った同じようなインタビューにはうんざりといった著名人の方たちは、毎度くる質問は自身のボットを制作して任せてしまってはどうだろうか。
爆誕、イーロンマスクボット
同じことを考えたボット開発者が地球の裏側にいた。彼の名はAaron Taylor、
Personify.aiというボット開発プラットフォームのチームに所属している。
彼はイーロンマスクが大好きで仕方がなく、もし世界で一人だけ夕飯に誘うことができるなら誰を置いても彼を選ぶと豪語するほどだという。
どうしても話したい!
でもあんな世界的起業家と話すなんて10分でも無理だ・・・とAaronは半ば諦めていた。しかしその時彼は気づく。こういうことを考える人は他にもたくさんいるにちがいない、ならば彼らのためにマスクをボット化してしまおう、と。
Aaronは様々な媒体にあるマスクの言葉を集め、ボットを完成させた。
筆者も使ってみたが、具体的には以下のような感じのやり取りだった。
シンプルな内容で、トピックはAIの今後や彼の会社について。
ボットのコミュニケーションの形式はボタンで誘導しつつ、マスクと会話をしているかのような体験を得られるものとなっている。
このボットについては、これくらいのシンプルさの方がむしろボットとして割り切っていて、純粋なよさがあるというのが個人的な感想だ。
自然言語処理を通じてコミュニケーションをする技術はまだまだ改善の余地のある分野だ。
りんなやあきこちゃんなど機械学習を通して会話能力を向上させるものなどは入力された短文を理解して単発の返答を返す能力はあるが、コンテクストを理解する能力は残念ながら発展途上だ。
つまり、現段階の技術では、対話エンジンは特定の分野に絞ったものを制作するほうが、幅広い会話にこたえられるものを開発するよりも費用対効果がよいのだろう。
今回、こちらのイーロンマスクボットを触ってみてそれを改めて実感した。そしてAaronも同様のことを述べている。
まだまだ開発改善の余地があると思われるチャットボットの領域だが、色々な取り組みがなされており興味深い分野である。
Mitsukuボットが最も人間らしいAIとして二度目のローブナー賞を受賞!
最も難しいとされる夢の近未来技術の一つに、汎用的で強い人工知能があげられるだろう。
簡単に言えば、Ironmanの J.A.R.V.I.S.やスタートレックのヴィジャーのような、知性と人格を持つプログラムである。
しかしまだまだ技術的な壁が多く残っており、一説では2045年あたりには実現されると囁かれるが、そこに少しでも近づきたいと1950年代から開催され続けている人工知能のコンテストがthe Loebner Prizeだ。
2014年以来イギリスのブレッチェリー公園で開催されているこのイベント、最も人間らしいボットを決めようという趣旨のもと、世界中の開発者が挑んでいるが、実はまだまだ人間の審査員から一本取るには至っていないという。
というのも、少しずつコンテストのルールが変わってきており、その時代のルールで完璧に近いものが出てきそうになるたびに、より高度なルールに帰られているのだ。
コンテストが始まった当初は5分間の自由な会話を2種類のトピックに基づいて行うというものだったが、現在では所要時間が25分にまで伸びているという。
そんなコンテストが今年も行われていたわけだが、今回最優秀に輝いたのは、2013年にもグランプリに輝いていたMitsukuというボットだったという。
いかにも日本のアニメ好きな外国人が制作したというようなこのMitsukuボットだが、現在はPandorabotsという対話性重視のチャットボットを集めたプラットフォームトップページにて触れてみることができる。
彼女は数千の様々な会話パターンを日々受け取り適切な回答を返しているという。
このボットが2013年に最も人間に近いと思われる人工知能に贈る賞を勝ち取った時、iPhoneに搭載されるSiriは14位であったと言えば、彼女の精度の高さが少し伝わるかもしれない。
そして2016年の審査では90%という評価を得て(2位は78%)堂々たる1位を獲得している。
そんなMitsukuボットを実際に触ってみたのだが、率直な感想としては、りんなやシャオアイスといった昨今有名なチャットボットと同程度といった印象だ。1往復のやり取りについては、高精度な返答をすることができる。
このような雑談ボットに関しては、チャットボットの一つの将来像ではあるため、これからも目を離さず動向を追っていきたい。
百度(Baidu)発、簡易な診断を代行してくれるMelody
ふとした時に風邪をひいてしまい、会社を休んでいざ病院に向かったはいいが、とんでもない混雑で、診察までに2時間も待たされてしまった、なんてことはないだろうか?
筆者も久々に訪れた病院で、診察システムが変わっていたりで、簡単な診察にたどり着くまでに相当長い時間を要した経験がある。体調も悪い状態でそんなことは避けたいものだ。
そんな折、2015年に中国検索エンジン開発の大手、百度(Baidu)は医療サービス向けチャットボットの"Melody"と言われるものを開発していた。これは上記のような状況を改善に導くためにデザイン、開発されたチャットボットだ。
こちらのチャットボットは現在、モバイルアプリ上で動作するものとなっているが、BaiduのSilicon Valley Research center、Cheif ScientistのAndrew NgはThe Verg誌に対して、「いずれはFacebook MessengerやWechatのような他社メッセンジャーアプリ上でも利用できるようにしたい」と語っている。
どうやって医療現場を助けるのか?
Melodyの仕事は至ってシンプルで、
-
医者へコンタクトを取る前の一次対応
-
簡単な診察
-
診察の予約
の3つが主となる。
Ng氏は、
「彼女の仕事で最も重要なのは、会話を通して、医者が本来1から見なければならなかった患者に関するあらゆる情報を整理し、簡易な物はより効率的に得ることができる手助けをすることだ。」と語っている。
「医者の役割が変わるわけではない。ただ、情報を彼女自身で集め、それを提案することによって、より良い医療を多くの人に届けられるようにするだけだ。」
彼女の仕組みは、Baidu社が長年投資してきた、Deep Learning技術と自然言語処理技術によって成り立っている。
さらに同社はこれまでのサービスを通した、中国の膨大な市場でのチャネルとそれにまつわるデータを所有しており、AIとしての精度向上に貢献している。
イギリスやアメリカでも、your.mdやbabylon Healthといった、同種のサービスが展開してきている。それらも同じような質問をしたり、患者に同じような結果を届けることはできるが、そう言ったサービスがスムーズに国のインフラ的サービスの一つとして入っていけるかは、また別問題だ。
例えば、導入を考える上での障害の一つとして、
「そこで得られる情報は誰のもので、どこまで公開されるべきなのか」や、
「どんな制限をどこにもうけるべきなのか?」
などがある。
しかし昨今のUberやAirbnbの台頭を見ていると、経済的な事情に押されて、なし崩し的に半ば強制で導入されて行ってしまうかもしれない可能性も拭えない。
BaiduはMelodyだけに限らずあらゆる新しいテクノロジーやそれに付随するサービスが人間の仕事にただ置きかわり、奪ってしまうわけではないことを主張している。
例えば、自動車が出現した時、馬車を扱っていたビジネスは縮小したのかもしれないが、タクシードライバーという新たな仕事を創出した。
しかし、医療の領域においては、なかなか前例のないことで、慎重に進捗を見守らなければならないとも話している。
医療の世界では人材不足が嘆かれて久しい。
日本でも、業務が激務で休む暇がない、であったり、そもそも人手が足りない、といった類のニュースはしばしば耳にする。
そんな状況にメスを入れ、医者/患者双方に対するWIn-Winを創出してくれるのがこのようなボットになるのかもしれない。
メッセンジャーアプリがモバイルゲームのプラットフォームに!?
かつてはゲームボーイ、PSPなどポータブルなゲーム機器が名をはせていたが、近頃ではすっかりスマホゲームに取って代わられた感がある。
そしてそのスマホゲームに新たな変革の形が訪れようとしている。そう、お待ちかね、チャットボット紹介の時間だ。
ドイツのベルリンに拠点を置く、Telegram messengerというサービスで、今年の10/3にゲーミングプラットフォームが公開された。これによって第三者の開発者はTelegram条で起動するアプリを作成することができる。今現在でも、@gamebotと発言することでプレイ可能な30のゲームの一覧を得ることができるようになっているようだ。
なぜチャットボット上でわざわざゲームをしようなどと思うのか、とあなたは考えているかもしれない。
その理由は非常にシンプルで、管理をする必要がないことと、わざわざアプリとしてスマホにそのゲームを落とす必要がないことだ。
スマホを使っていて、いろいろなアプリを使いたくなってしまって気づいたら画面がアイコンでいっぱいになり、煩雑な状態になってしまっていたなんてこともあるかと思うが、今後もうその心配をする必要はない。
ただ@gamebotと発言するだけでスキマ時間にサクッとゲームがプレイできてしまうのだ。
ちなみに、他のメッセンジャーアプリ上でも同様の試みは行われていて、たとえば"kik"というサービスでは文字だけのアドベンチャーゲームだけではなく、いわゆるアクションのようなゲームも存在する。
筆者がプレイしたのは、"Space Adventure"という2D避けゲーだ。
このゲームが普通のアプリのものと一味違うのは、導入の部分で双方向的なコミュニケーションがとれるようになっていて、より高度な没入感を得ることができる部分だ。
このSでは、プレーヤーは宇宙船の中で目覚めるところから始まり、どこに向かうのか、船長とどうコミュニケーションをとるのか。そういった導入を経た後、ユーザーはゲームへと送り出されていくのだ。
お手軽にメッセージアプリでゲームを探して、ちょろっとだけプレイする。そんな未来が近いのではないだろうか。
ボット作成に大事な10のポイント
チャットボットは新しい技術だ。
設計、デザインにあたり、どんなものを作るかという議論は慎重に行わなければならない。弊社においても頻繁に議論されており、果たして本当にチャットの優位性やユーザビリティはあるのか?先方に価値を届けられるのか?しっかりと考え抜かなければならないところである。
弊社もいくつかのチャットボットを制作してきて、なんとなくぼんやりと気を付けなければならないところは見えてきていた。と、そんなところでハッキリといくつかのポイントを提示してくれたのが、BAM mobileだ。
同社はイギリスのウェブコンテンツプロバイダーで、モバイルからPCまで多種多様な製品を世に出している。
そんなBAM mobileがつい先日行った"AI & Messaging Meetup"というイベントがあったのだが、そこではより良いチャットボットを作るための10のポイントが話されていたという。以下で、それらを紹介していきたい。
1.publisherとuserの双方に対しての目的をはっきりと定義する
良いボットを作るための第一歩は、そのボットがそのpublisher(所有者)とuser(利用者)に対してどのような価値を提供するのかまずはっきりさせることである。
publisherの目的は例えば、
・売り上げの向上
・カスタマーサポートの改善
・CRM(customer relationship management) channelの創出
など。
対してuserの方は、
・購買や娯楽における全く新しい体験
・より簡単で便利な情報へのアクセス
などなど。
この双方をまず最初に定義し、一体何のためのボットなのかを制作に携わる者でしっかりすり合わせなければならない。
2.ボットが踏み込む領域の策定
目的が決まったら、あなたのボットがどんなトピックを話すことができるのかを決める。どんな領域の知識を、どれくらいの深さで知っているべきなのか。
例えば、宿泊するための部屋を予約するようなボットである場合、まずいろいろな物件の料金や住所などは知っていて当然だろう。そこに、様々な情報をどこまで付け加えていくかは開発者次第だ。想定した範囲のみをユーザーに届けて終わるのか、はたまたボットの外側まで人が手助けするのか。
3.RailsかNLPか?
ボットの行動様式として、2つの形式があると言われている。
1つ目の、PG言語と間違えそうなRailsと呼ばれる方は、ある程度形式ばった機能を持ち、シンプルで導入しやすい。例えば、このキーワードが発言に入っていれば、だったり、そもそもゲームのようにボタンで発言を固定してしまったりなど。
特性として、ユーザーにある程度そのボットとの対話で進むべき方向性を示してあげることができるという点が挙げられる。
NLP(Natural Language Processing)のほうは、より自然な対話を可能とする手法で、日本語では自然言語処理と呼ばれているものだ。形態素解析をするなどしてより高精度にユーザーの発言を分析、理解することが可能なため、Railsと違ってある程度不足の事態にも対応できる。
チャットボットを制作する時、この2つどちらかに偏っては本当に質の高いボットを作り出すことはできない。
そのボットと対話されるそれぞれのシチュエーションでユーザーとしてどう使いたがるものなのか、考え抜いてどちらかを選択しなければならない。
4.3大要素である、シナリオツリー、キーワードレスポンス、データベースの確認
チャットボット制作の3つの柱となるのがこれらだ。
・シナリオツリー・・・どのような会話の流れをユーザーがたどるのか、ざっくりと流れを描き表したもの。
・キーワードレスポンス・・・そのボットのトピックの中でいくつかの重要な単語があるかと思う。それらの要素に対してどのような返答をするのか。それはボットの中核とも言えるものだ。非常に大事。
・データベース・・・ボットは基本的にいろんな情報を持っていて、そこから最適なものを選び取ってユーザーに届けるわけだが、多種多様なデータベースを持つこと、そして適切なデータを届けるためのロジックだったりアルゴリズムも最適化されている必要がある。
この3大要素をしっかり頭に入れておかなければならない。
5.より詳細なシナリオツリーの作成
おおまかに作ったシナリオツリーを今度は会話レベルで想定し、mind mapping toolなどを使って詳細まで作りこんでみる。
これは弊社でも非常に苦労した分野だ。時間配分は、設計に80%、実際の制作作業10%、確認作業10%といった具合でもいいのではないかというほど、当初設計に時間をかけたほうがいいと考えている。
6.対応するキーワードやフレーズ、それに対する発言のリスト化
どのキーワードがそのボットで核となるのか設定したら、それらに対するボットの返答を作成、リスト化してしまうべきだ。
エクセルファイルなどで一括でそういった問答集を管理し、そこだけ確認すれば一目で修正すべき箇所がわかるという状態を常に保つほうが良い。
7.扱うデータベースの管理
データベースはチャットボットの力の源泉と言っていいほど重要だが、そのデータベースはひとつとは限らない。どのような種類が必要で、それらはどう連携するのか。把握しておかねばならない。
8.ボットを認知してもらう戦略
人々に認知してもらわなければ、ユーザー獲得など夢のまた夢だ。また、ボットを通じて伝えたいことを効果的にユーザーに届けなければならないというミッションもある。商品の広告などだ。
さらに、ボットユーザーへのアプローチは規制がつきものだ。例えば、Facebook Messengerでは最後の対話から24時間以内までしかアプローチしてはいけないという制約がある。こういったルールはプラットフォームで異なるため個々に理解しておかなければならない。
9.実際に世に出してテストしてみる
どんなに作りこんだ成果物とて、世に出してみるまではどうなるかわからない。
エラーを確認し、ユーザーのさらなるニーズを発見し、新たな施策を思いつき、きっと想定されていなかった事が出てくるだろう。そしてそれら一つ一つにあなたは対応していかなければならない。
10.さあローンチだ!
これまでの9つの要素を満たしたなら、きっと世に価値を提供できるボットになっているはず。あとはボットがユーザーの皆さんを楽しませたり、助けたりしてくれることを祈るだけだ。グッドラック!
先駆者Wechatに見る、botプラットフォームの未来
米国を中心にざわついているチャットボットだが、実はその市場を最初に創出したのは、MicrosoftでもFacebookでもない。
それでは誰なのかというと、それは中国の大手IT企業テンセントだ。彼らが開発した Wechatというアプリが最も進んだbotプラットフォームであろうというのが一般的な見解となっている。
中国国内ではものすごい盛り上がりを見せ、近未来的な形を取っているというWechatだが、具体的にはどのようなサービスプラットフォームとなっているのか。
まずWechatの大きな特徴として、公式アカウントの存在がある。
日本のLineなどでもそういったアカウントは見かけるが、ここで違うのは、自然言語での対話を通していろいろな動作が行える、つまりチャットボットが公式アカウントの役割を担っているという点だ。
中国では、「Webサイトを作るくらいなら、チャットボットを作れ」と言われてしまうほど、その存在が便利で必要不可欠なものになっているということなのかもしれない。
その公式アカウントについてもう少し掘り下げてみると、2タイプに分けることができるらしい。
①販促や商品の広告宣伝など、Promotionの分野を担うもの
②実際に消費者の求める行動を実行しサポートする、Serviceの分野を担うもの
ユーザビリティにこだわった末のシンプルさ
自然言語で機械と対話できるというのがチャットボットのそもそもの特徴ではあるが、チャットボットが大きく発展しているWechatでは、その扱いやすさに非常に重きをおいている。
つまり、いくら対話ができるからといって、なんでもかんでも対話形式でやりとりができるのが最適解ではないということだ。
その一例として、短いコマンドを動作のトリガーとしていること、が挙げられる。
例えば、Promotion向けのbotでは、
・"contact"→使用中のスマホに格納されているコンタクト情報を引き出し提示する
・"slide 42"→42番めのスライドを表示してくれる
などなど、コマンドに対応しているものも多い。
Botへの指示内容を、毎回すべてテキストで打つのは場合によっては面倒なものだ。
そこで使用頻度の高いものを扱いやすいコマンドとしてボットが受け取れるようにしてしまおうというのがこの仕様である。
一方、Service向けのbotでは、消費者が比較的細かい要望を持っていることが多いため、様々な情報を盛り込んだ一文を解析して意図を読み取ることができることがbotには求められているという。
これぞ人工知能?!Microsoft発チャットボット"Xiao ice"
それではいわゆる世間一般の人々が考えるような人工知能というものは存在するのか?
それに非常に近いと言えるものの1つが、Microsoft社が開発した"Xiao Ice"だろう。
既に4,000万人が一度はこのボットと対話していて、その精度を裏付ける驚異的な事実として、25%ものユーザーが彼女に"I love you"と発言しているというものがある。
実際はインターネット上の膨大なデータから引用した文章を、ユーザーの発言に返すだけの存在であるにも関わらずである。
ただ業務をこなしてくれるボットだけではなく、こういったエンタメ要素のあるボットも間違いなく需要としてはあるだろう。
まとめ
上記の通り、中国ではWechatが既にチャットボットのエコシステムを作り出すことにほぼ成功している。
非常に先進的な事例ではあるが、昨今の自然言語処理や機械学習の分野での発展を考えれば、この流れは止まらないだろう。
スマホ普及の歴史は我々に、加速度的に発展する未来を教えてくれる。
その中の1要素として、チャットボットが活躍している可能性は極めて高い。Wechatの教えてくれるchatbot至上の未来からはこれからも目が離せないだろう。
TIFFbot-あなたの映画探しをお助け!-
映画というものは星の数ほど存在する。そんな作品たちに対する人々の感性もまたしかりだ。
つまるところ、人々はよほどの映画好きでもない限り、その映画の海の中に眠る自分が本当に好きになるかもしれない作品を知らないまま毎日過ごしているのだ。
と、いつもながら、そんな状況をお助けするボットが存在する。その名も
"TIFFBOT"
だ。
TIFFBOT
まず前提として、TIFF-Toronto International Film Festival-というものを皆さんはご存知だろうか?カナダの一都市であるトロントで毎年行われる映画作品の祭典で、Oscarなどと並んで映画好きの間では有名なものだ。
TIFFbotはその映画祭の間に利用者をお助けするもので、具体的には、その年の映画祭に出展されるものを中心にこちらの趣味嗜好を理解しつつおすすめしてくれる。
もうウィキペディアでにらめっこして自分好みの映画を探す必要もない。なんとも便利な時代になったものだ。
開発したのは、カナダにあるTWG(https://twg.io/)というソフトウェア開発会社だ。
今回実際にこのボットを触ってみた。余談だが海外製のボットを触る度に思うのは、非常にシンプルな設計をされていることが多いことだ。イントロダクションは3行もかからない。すぐ本題にとりかかる。
話がそれてしまったが、このボットを使ってみたところ、"Toni Erdmann"という映画をおすすめされた。
キーコンセプトの画像とともに、簡単なあらすじと、ボット自身が、はしゃいだ子供のような論調でボットなりの見解を述べてくれる。
さらにそれだけでは終わらず、監督インタビューや、キャストについてなど詳しい情報についてもどうかと、ボタン機能で訪ねてくる。なんとも抜け目ない奴だ。
ちょっと時間が空いてしまってやることがない、映画でも見るかと思い立ったら、このTIFFbotのことを思い出してみてはいかがだろうか?
Facebook messengerでその名前を検索することだけが、あなたのお気に入りの映画への切符だ。
メッセージアプリで楽曲探しBot
ふとした瞬間、お店の中だったりにぎやかなクラブの中だったりで、「あ、この曲いいな。なんという名前の曲なんだろう?」と考えたことはないだろうか?
そういった状況の人々を助けるためのサービスはこれまでもあったかと思う。が、このブログの趣旨を考えれば言わずもがな、チャットボットでもそういった類のサービスが存在する。
今回はその中のいくつかの実例を紹介しよう。
ピーチ
ピーチは動画共有サービス"Vine"の創業者である、Dom Hofmannが制作したネイティブメッセージアプリだ。このアプリ上での音楽検索機能のコンセプトは至ってシンプルで、「いいなとおもった楽曲をすぐに友人とシェアできる」だ。
実際の機能の使い方としては、"song"と発言すると、botが起動してスマホのマイクを通して音声データを取得、データベースから検索し、その結果を提示してくれるというもの。
さらにヒットした楽曲がsportifyかapple musicにあればそのリンクまで用意してくれるという優れものだ。
Boom bot
開発はReply.ai。検索した楽曲の歌詞やビデオの情報まで提供してくれる。
試しにYoutube上で流れていた音楽を録音すると、正確に認識することが確認できた。
AudioShot
こちらは2014年設立のAudioShotから提供されているメッセンジャーアプリ。
間違いなくチャットボットプラットフォーム市場を率いると噂される中国のWechatだが、実は2013年にはプラットフォームとして公開していたというから驚きだ。wechat officail accountが楽曲検索サービス機能を持っている。
番外編
この領域では著名なサービスとしてShazamがあげられるだろう。これは録音不要、周囲で流れている音楽を自動で認識してくれるという優れものだ。MAUで1.2億人に達しており、既にIPO準備が囁かれているらしい。「Just Shazam it」という使い方をされるまでに成長している。
ACRCloud
ちなみに、基幹となる音声認識のシステムを構築し、クラウドサ―ビスとして展開する北京の"ACRCloud"についても言及しておきたい。様々な開発者が彼らのシステムを利用し、多岐に渡るメッセージアプリ上にてボットを開発しているため、ユーザーは楽曲検索サービスを気軽に利用することができる。
2015年2月に創立され、現在は本社を北京に構える。音楽コンテンツやTVプログラム、ドラマなどの音声認識クラウドサービスを主事業としている。
contact:contact@acrcloud.com
Siriを超える?「 Viv」
Siriを超えろ
Hey, Siri.
誰もが1度は使用したことがあるiPhoneの1機能。
人の声に正確に反応して、一瞬でユーザーの質問に答えることができるとても優秀な機能である。
ところでSiriは、SRIインターナショナル(以後SRIと表記)という企業からスピンアウトしたベンチャー企業によって開発されている。
SRIとは、スタンフォード大学から地域の経済発展を支援する目的から設置された、非営利組織の研究機関である。
そんなSRIで働くWilliam Mark氏は、
”もしあなたが「定期預金から当座預金に100万円を振り込んで」とお願いしたら、Siriは「振り込み」についてサイト上で検索するだろう。これはSiriに対する批判ではなく、ただSiriは銀行の取引に関して無知なだけだ。”
と言っている。
Siriでは専門的な会話をすることができない。
すべてを少しずつ知っているもの(Siri)ではなく、1つをたくさん知っているものに注力するべきだと、SRIの方針は変化してきた。
例えば銀行の専門的な知識をつけたチャットボット「Kasisto」が作られたのもこのような背景があったのだ。以前弊社ブログで詳しく説明しているので、気になる方はチェックしてみてほしい。
次世代音声認識AI「Viv」
Siriの生みの親である、Dag Kittlaus氏は最近、「Viv」という次世代音声認識AIのデモをニューヨークとウイーンで披露している。
2011年にSiriがこの世に現れてから3年後の2014年にDag氏は仲間3人を率いて「Viv」の作成に取り掛かった。
彼らはSiriでは不可能な、
・複雑な会話の理解
・ユーザーのために何かをする
以上の2つの機能を追加するために尽力していた。
2014年の時点で彼らは「Viv」がどのようなサービスになるか予想している。そのうちの一つの機能が、フライト予約を「Viv」のみを通じて行うことである。
2016年、ニューヨークとウイーンで行われたデモの様子はTechCrunchで紹介されているが、簡単に要約すると、「Viv」ができることをいくつか説明している。
例えば、
「友人に昨夜の飲み代20ドルを返してくれ」と語りかけ、「20ドル送る」をタップするとアプリが勝手に支払えるようになっている。
他にも、
「明後日の午後5時以降、〇〇駅の近くは20度よりも熱くなる?」と語りかければ、Siriのようにただ天気予報を表示するだけではなく、「いいえ、その日の5時以降は20度を超えることはありません」と返す。
このように複雑な会話にも対応しているのだ。
そしてウイーンでは下記の通りフライト予約のデモを披露している。
有言実行して見せたのだ。 Hey, Siriという人がいなくなるのもそう遠い未来ではないかもしれない。