製品進化とマネジメント風景 第89話 AI技術に対する投資選択のマネジメント
この所、チャットGPTや生成AIの話が経済紙の1面を連日賑わせています。当社も注意深くこれを使い始めており、そのような背景もあって今回は自然言語を扱うAIを考えつつ、投資対象としてのAIについて考えていきます。
自然言語を扱うAIは昔からずっと開発が進められてきましたが、中々、実用的な能力を獲得できませんでした。しかし、2018年頃から急にその実力を高め始めました。その代表例としてBERT、GPT-3、PaLMなどが挙げられます。
従来の自然言語AIは、専門分野に特化した学習が必要だったのですが、上記の言語AIではそれが不要となりました。ですから汎用AIに分類されています。これが実用的な能力を獲得しつつあることを示す事例を3つ挙げましょう。どれもここ2-3年以内のものです。
第1の例は、AIにニュースのタイトルとサブタイトルだけを与え、ニュースを生成させるというものでした。AIが作成したニュースを人間が書いたのではないと見破れた人は半分だったと報告されています。つまり、2人に1人は、AIと人間の見分けがつかなかったということです。改善を続ければ、すべての人に見分けが付かなくなるのは時間の問題でしょう。
第2の例は、AIに日本の大学入試における英語筆記試験を受けさせた所、200満点中185点を取ったという話です。偏差値に換算すると64ということなので、平均よりもかなり高得点だったということです。今の自然言語AIは英語が強いですが、いずれ国語(日本語)でも高得点を取るようになるでしょう。
第3の例は第1の例の派生型です。第1の例ではニュースでしたが、ここでは科学論文です。論文は、通常、序論において、過去の文献を引用しながら何がどこまで進んできたということを述べますが、AIはこの作業を実に見事に実施したと報告されています。 論文はニュースよりも型が定まっており、しかも話題も絞られているのでAIに有利でしょう。過去の論文をサーベイするという行為に絞れば、人間よりも優れた内容を書くのは、本当に時間の問題になるでしょう。
自然言語AIの進化には目を見張るものがありますが、ビジネスとして考えた時、本当に自然言語AIに投資するのが良いのかどうか、短期に投資回収できるのかどうかについては良く考える必要があります。この話は後半に譲るとして、まずは停滞していた自然言語AI処理が、なぜ急速に進化したのかを考えたいと思います。
画像認識の分野ではいわゆる深層機械学習(Deep Learning, 以後DL)により、その精度は飛躍的に向上しました。しかし、DLは言語を扱うのは苦手です。それはDLが扱うデータが原則、固定長だからです。
画像であれば、解像度を調整することにより、様々な画像データを固定長データに容易に変換できます。言語は根本的に可変長ですが、画像のように簡単には固定長に変換することができません。文章の意味を変えないように長い文章を短い文章に変換することを思い浮かべていただければ、その難しさがすぐにご理解いただけるでしょう。
そこで言語を扱うために考えられたのがRNN(再帰的ニューラルネットワーク)でした。この方法では、単語を1つに追加する毎にAIはその文章がこの先どう発展するかを予想します。そのため、可変長を扱えるのです。
RNNは逐語的に進めていくので、並列処理にも適しており、高速な解析を出来るという長所があります。しかし、大きな短所もあります。それは、RNNは文章全体を俯瞰して意味を把握することが苦手なのです。ご存じのように、多くの単語は複数の意味を持っていますが、RNNではそれを適切に扱えない場合が多いのです。
ではBERTやGPT-3はどうなのか? ポイントはこれらの名前に含まれているTの文字です。このTはTransformationを表しており、日本語では転移学習と訳されますが、RNNとは明らかに異なる学習アプローチを採用しているのです。
結論を先に言うと、文章全体を俯瞰することができ、複数の意味を持つ単語であっても、どの意味で使っているかを正しく選択することが出来るのです。さらに、次に続ける文章も正しく選択できる能力を持つのです。
言われてみて「なるほど」と思ったのですが、自然言語を扱う精度を高めるポイントは3つです。第1は使われている単語の意味を正しく捉える能力、第2はある文章に自然につなげられる文章を選定できる能力、そして第3は文章のある位置にどの単語を置くのが適切かを評価する能力です。 ですから、この3つの能力を獲得する方法が模索されたのです。
その結果、転移学習に行き着いたわけですが、その方法では、まず、単語の意味をたとえば1024個のベクトルで表現します。この個数は変えても構いません。 単語をベクトルで表すというのは、例えば、寸法、重さ、硬さ、色、形状など、モノを表す属性、モノの移動や動きに関する属性、陸海空・宇宙等の場所の属性、喜怒哀楽などの感情を表す属性などが考えられます。
要するに、顔認証等の画像解析と同様に、人がその単語を使う際に考えられる言葉の属性をベクトルで表すことにしたということです。これは以前からある技術でword2vecと呼ばれます。これに人間の書いた文章をたくさん与えて学習させると、ベクトルに入る数値が決まります。 ベクトルの数値が決まると、原理的に足し算、引き算が可能になります。例えば、「王様-男+女」という足し算、引き算をすると「女王」という結果が表示されるのです。これは、単語の意味を一定レベル理解しはじめていると言えるでしょう。
その上で、文章を24層のTransformerに通します。そのメインの役割は、文章に含まれる全単語の関係性を俯瞰した上で、前述の3つのポイントに沿って文章の意味を理解して、それに応じる適切な文章を作成します。 このTransformerにおいて中心的な役割を果たすのがAttentionという機構です。最近の自然言語AIの立役者とも言われています。このAttentionは、単語の組み合わせによって生じる意味を把握する方法です。
自然言語を上手に扱う方法について述べましたが、進化を促進した要素としてはもう1つあります。それは、より多くのテキストデータを学習し、より多くのパラメータを使うと精度が向上していくということです。
機械学習やDL分野では、学習させていくと、ある所までは学習により予測精度が向上するが、あるレベルを超えると逆に精度が悪化すると現象が報告されていました。いわゆる「過学習」です。 しかし、少なくとも自然言語AIについては、一旦、過学習の現象が現れても、さらに多くの学習をさせると、再び予測精度が向上してくることが分かりました。そのため、現在は、ひたすら学習量とパラメータ数を増やす方向で進んでいます。 前述のBERTのパラメータ数は3.4億、GPT-3は1750億、PaLMでは5400億と言われています。
さて、ここからは、この自然言語AIのビジネスへの応用を考えます。今、適用されつつあるのはインターネット上の検索エンジンです。使った実感ですが、予測精度は従来方法よりも改善されつつあります。これ以外の用途ですぐに思いつくのは、チャットロボット、コールセンター、企業の受付業務、特許、論文、法律のサーベイなどです。しかし、これらの生産性向上だけでは莫大な投資を回収できるとは思えません。しかし、さらに踏み込むとプライバシー問題や秘密情報の漏洩につながるため、このような問題を回避して収益に変換するアイデアが必要です。
今回のG7サミットでも話題になるようです。AIを利用する立場の企業は、道筋がはっきりするまでは投資を待った方が良いかもしれません。なぜなら、今の自然言語AIよりも、もっと良い投資先があると考えるからです。
自然言語AIは人間の言語能力を再現することに焦点を当てています。それとは異なる側面、つまり、目や耳や手足で触れながら障害を避けて移動する動物的な能力も、事業化候補として注目されています。
動物的な能力を検討していくと、人や動物よりもニューロン数が圧倒的に少ない昆虫であっても人間よりも高い能力を持っています。この能力をAI化するという話です。これを言語AIに対して運動AIと呼ぶことにします。
一例としてトンボを挙げます。トンボは独立に制御できる4枚の羽根と3万個の目を持ち、さらに人間の3倍の動体視力を持っています。人が逃げる対象を追い掛けるタイプのゲームを行う時、人はその対象を見続けながら追いかけます。 これに対してトンボは3万個の目で見ることができるので、対象の動きを予測した上で最短のルートを選択します。人が追い掛けるよりも短い距離、短い時間で対象に追いつけるのです。
この運動能力は昆虫の脳のニューロンに由来すると考えられますが、ニューロン数だけを比較すると、昆虫は人間の約100万分の1です。コンピュータで再現するにしても人間よりもずっと易しいでしょう。ですから、人の脳を再現するよりも、昆虫の脳を再現する方が、少なくとも短期を考えた時にはビジネスとしての投資効率が高いと考えられます。さらに昆虫を研究するのであれば、人権問題も動物愛護の問題も引き起こしませんから政治的にも安全でしょう。
言語AIを事業化する際に面倒だなと思うことは、世界中のどこにでも通用するような普遍的なテキストで学習させなければならないことです。インターネット上のすべてのテキストデータを学習に用いると考えると、そこには様々な政治的な意見があります。単純に考えるとテキスト量の多いものに影響を受けるでしょうから、少数意見が無視される可能性もあります。それはビジネスにとって大きな火種になる可能性があります。そういう意味で難しそうだなと感じます。
ただし、インターネット上の情報でも政治問題を引き起こさない分野が1つあります。お気づきの人もいるでしょう。それは科学技術の分野です。AIを学習するテキストを科学技術の分野、しかも査読された論文や特許に限定するのです。査読付きテキストなので、その内容の信頼性はかなり高いものになるでしょう。
法律の分野への適用も有望です。IBMのAIである「ワトソン」は、かなり前から科学技術と法律の分野に特化してAIを開発していました。目の付け所が良いと言えるでしょう。また、イーロン・マスクも科学技術分野に絞ったAIの開発を考えているという報道がありました。これらの分野において学習するテキストを厳選すれば、信頼性の高いAIが出てきそうです。あとは、このツールの使い方の上手、下手です。これが企業の盛衰にも影響を与えるだろうと推測します。
科学技術や法律に特化したAIが出てきた時、貴社はどういうルールを作ってこれらを使いこなしていきますか?