2024年10月21日

AIは万能か？AIの苦手なタスクと現在地を知ろう

生成AIが登場したことで、世の中のあらゆる商品・サービスで「AI搭載」「AIが自動で○○」という言葉が踊っています。実際、AIは人間の負担を軽くするのに大いに役立つ技術です。しかし、AIは万能であることを期待をしているケースも散見されます。とくに私が働いているAIのBtoB領域では顧客から「思ったより便利じゃないね」という言葉をよくいただきます。そこで、本記事ではAIの限界と現状のレベルについて考察しようと思います。

1 AIの現在の能力と限界
2 文章生成AIが苦手なタスク
3 AIはまだ初期段階？レベル別AIの分類
4 まとめ

AIの現在の能力と限界

現在、我々人類が「AI」と呼ぶ技術は万能ではありません。AIといえば自律的に思考し、問題を解決するようなものを想像するかもしれません。しかし、AIの実力は特定のタスクを実行するにとどまっているのが実情です。具体的にいえば、生成AIは「○○を生成する」こと、分類AIは「データを分類する」ことしかできません。ほかのことはできないのです。

生成AIの代表といえるChatGPTは、文章を生成することはできますが、複雑な演算処理はできません。悩みを聞いてアドバイスはできますが、感情や微妙なニュアンスを読み取ってアドバイスはできません。

それぞれのAIは今この瞬間も進化を続けていますが各タスクにおいてまだ最高レベルに到達していません。ChatGPT 3が出てきて世間を驚かせたのが2021年です。2024年にはChatGPT 4oが出て、より自然な文章を生成できるようになりました。しかし、それでもまだ多くの課題があります。

ビジネス領域では、生成AIが苦手な部分をほかの技術と組み合わせて解消する動きも出てきています。たとえば生成AIはたまに嘘（ハルシネーション）をつきますが、嘘を抑え込む「RAG（Retrieval-augmented generation）」と呼ばれる技術がその1つです。RAGはあらかじめ登録しておいたデータを参照してそのデータの範囲内でのみ回答生成する技術で、企業のビジネス領域で注目されています。

このように、AIの苦手な部分を補完する技術も今後続々と出てくるでしょう。

文章生成AIが苦手なタスク

業務で生成AIを活用したいのなら、苦手なタスクを把握しておくことは重要です。ここでは、文章生成AIが苦手なタスクを見ていきましょう。

数値計算
ハルシネーション
Lost in the Middle
暗喩・隠喩表現の理解
あいまいな指示の理解
文化的・言語的ニュアンスの理解
長期記憶

数値計算

文章生成AIは複雑な数値計算や正確な数式処理が苦手です。単純な計算なら対応できますが、高度な数学的推論や大規模な数値の計算には適していません。たとえば、「5678×4321」といった桁数の多い数値の四則演算は苦手です。生成された文章に数値が入っている場合は、正誤チェックすることをおすすめします。

ハルシネーション

あらゆる質問に理路整然と回答してくれる生成AIですが、実はたまに嘘が混ざっています。これを「ハルシネーション（幻覚）」と呼びますが、別に生成AIは嘘をつこうとしているわけではありません。生成AIの仕組みはある単語に続く最適な単語を確率計算して決定しているに過ぎないからです。

そのため、生成AIで文章を作る場合は、人間の目でハルシネーションが起きていないかを確認する必要があります。

Lost in the Middle

「lost in the middle」とは、長いテキストの中間部分でコンテキストを見失うことです。AIを使っていると、長い文書を処理する際に前後の文脈を維持しきれず、文章の一貫性を保てないことがあります。

たとえば「気候変動について5,000字の論文を書いて」というプロンプトを生成AIに投げた場合、序盤は「気候変動」について言及していたのに、途中から「テクノロジーの変化」に話が飛び、最後に「気候変動」に話が戻るというケースがあります。

長文の生成にはコンテキストはもちろん、テーマが破綻していないかを確認する必要があるでしょう。

暗喩・隠喩表現の理解

文章生成AIは、複雑な文脈や暗喩・隠喩表現を理解できないことがあります。たとえば「ジョンはトムに彼の本を渡すように言った」という文章をAIに与えた場合、「彼」がジョンを指しているのかトムを指しているのかを正確に判断できず、あいまいな結果を出すことがあります。

あいまいな指示の理解

生成AIは、不明確な指示や曖昧な定義に対して適切な応答が苦手です。「昨日の夕方のその出来事について詳しく教えてください」といったあいまいな指示を出すと、AIは「その出来事」が何を指すのかを理解できず、適切な回答を生成できない可能性があります。

プロンプトを考えるときは、あいまいな表現は避けて明確な指示にしたほうが期待した結果を得やすくなります。

文化的・言語的ニュアンス

文化特有の表現や言語のニュアンスを理解し、文章生成するのも苦手です。とくに、会社内でしか通じない専門言葉や業界用語、若者言葉のような文化的なコンテキストを含んだ文章は、そもそもAIが学習していないケースが多く理解できません。

生成AIを使う際は、誰にでも通じるような一般的な単語を使いましょう。

長期的な一貫性

AIは会話や長いテキストでは、前後の文脈を長期的に保持し、一貫した情報を提供するのが苦手です。とくに対話形式でのAIは前の内容を忘れる、矛盾した発言をすることも珍しくありません。

会話を何往復も繰り返すとおかしな内容を返してきやすくなります。あまりにおかしければ、一度会話をリセットして新しく会話を始めるとよいでしょう。

AIはまだ初期段階？レベル別AIの分類

「AI」と呼ばれる技術には3つの種類があるのをご存じでしょうか。ちなみに現在のAIはレベル1。まだまだ生まれたばかりの赤ちゃんのレベルです。生成AIの到達点について詳しく知りたい場合は「生成AIって何？初心者でも簡単にわかるガイド」を一読ください。

レベル1：特化型人工知能（ANI）
レベル2：汎用人工知能（AGI）
レベル3：人工超知能（ASI）

レベル1：特化型人工知能（ANI）

特定のタスクや分野において優れた能力を発揮するAI。「特化型AI」とも呼ばれます。現在、私たちが目にするAIの大半はこのANIです。たとえば、ChatGPTやStable Diffusionなどの生成AIは「文章生成」「画像生成」といった特定のタスクで能力を発揮します。

このように、ANIは決められた条件化・用途でのみ効果があるため、「思ってたのと違う」という感想になるのでしょう。それでも各AIの性能は驚きを与えるには十分で、何もないところから長文を生成したり、画像・動画を生成したりできます。画像や動画の生成に関してはもはや魔法のように感じる人も多いでしょう。

レベル2：汎用人工知能（AGI）

人間のように多様なタスクをこなすことができるAI。「汎用型AI」とも呼ばれます。AGIは、特定のタスクだけでなく、広いな知識やスキルを使ってさまざまな問題を解決できるAIと定義されています。多くの人が思い描くAI像はAGIではないでしょうか。

AGIは多くのAI開発企業が目指す理想の姿ですが、人類がAGIに到達するにはもう少し時間が必要といわれています。一説には5～10年以内にAGIが作れるといった話もあります。近年の爆発的なAIの進化スピードを考えるとありえる話ですが、果たして？

レベル3：人工超知能（ASI）

人間の知能をはるかに超える知能を持つAI。人間の知識を超え、未知の問題や科学技術の新しい領域を切り開く可能性があります。ASIはもはや「想像上の存在」であり、AIの進化の先にある可能性の話です。SF映画でもテーマにされることがありますが「AIが人類を管理する」といったある種ディストピアのような世界観で登場ことから、あまり良い印象を持たない人のほうが多そうです。