スピーチを分析してデータベースを編集するためのAIスピーチ認識botがトランプ大統領のスピーチのパターンを分析しようとした際に壊れてしまった、とクリエーターが The Los Angeles Timesに伝えました。
Factba.seはスピーチやインタビューから膨大なFacebookの投稿やツイートまでドナルド・トランプが発する全ての単語を追跡することが目的のプロジェクトです。3年前にプロジェクトが始まって以降、1,000時間を超えるビデオを収集し1976年から今までの分で単語10,594,000語を転写しました。この目的のために FactSquaredのCEOであるビル・フリシュリングは転写をするマーガレットというAI botを作りました。
フリシュリングはAI botでトランプの珊瑚海海戦記念スピーチの短いセクションで試してみました。トランプ独特のスタイルを作り上げている構文や癖、節はマーガレットをほぼ瞬時にクラッシュさせてしまったのです。
「それがトランプであるかのように句読点を打つのではなく、英語であるとして句読点を打とうとしていたのです。」とフリシュリングは The Los Angeles Timesに話しました。
この問題を解決するために、マーガレットに英語の文法や構文を学習させず、かわりにトランプのスピーチのパターンを学習させなくてはなりませんでした。このツールは主に分析や話を作り出すのではなく、トランプが話した全てのデータベース編集するために使われますが、このツールを使いトランプの挙動をもっと学ぶことができます。このツールはスピーチだけではなく彼の癖をモニタリングし、彼が話していることとファクトチェックと比較して彼が真実を話しているかどうかを判断するのです。
例えば、トランプはウソをつくときにストレスを表に出さない、とフリシュリングは The Los Angeles Timesに話しています。また、彼はプロンプターを読むときには読むスピードを1分間に220語から111語(全国平均は1分間におよそ110~150語)に落とします。フリシュリングによると、このbotは彼が簡潔に話し、腕を使って身振り手振りで本当に怒っていると見せている(腕の振りを小さくすることで怒りを表す)ことを見抜くことができます。
このbotは彼の言葉をほとんど取り込んでいるようですが、トランプが話したり書いたりする独特なスタイルを分析しようとしたのはこれが初めてではありません。2016年のAI botにはDeepDrumpfというハンドルネームを使ってトランプ節でツイートすることを試みたものがありました。シェイクスピア風のツイートをするように学習させたbotに触発されて、トランプの話は小学生レベルだと主張する報道を知ってトランプ風にツイートする方が簡単だと思った、とこのbotのクリエーターは話していることをQuartzが報じています。
試みた結果、トランプのパターンをある程度はまねてツイートすることができましたが無意味なツイートでした。おそらく Factba.seのデータベース全体にアクセスできていたら恩恵を受けられたかもしれません。
reference:iflscience