AGIへのロードマップ

人工知能（AI）は近年、目覚ましい進歩を遂げています。特に、人間の認知能力を模倣することを目指す「汎用人工知能（AGI）」の登場は、私たちの社会や生活に大きな変化をもたらす可能性を秘めています。AGI は、特定のタスクだけでなく、人間と同じように幅広い認知タスクをこなせる AI として定義されます。これは、特定のタスクに特化した narrow AI とは対照的です。

AGI の開発は、OpenAI や Meta などの企業や、世界中の多くの研究機関で積極的に進められています。2020 年の調査では、37 カ国で 72 の AGI 研究開発プロジェクトが進行中であることが明らかになりました。

AGI が実現した場合、私たちの生活はどのように変わるのでしょうか？専門家の間では、AGI は人間の労働を大幅に自動化し、経済や社会に大きな影響を与えるという予測が出ています。また、AGI は医療、教育、環境問題など、様々な分野で革新的な進歩をもたらす可能性も秘めています。

しかし、AGI の開発にはリスクも伴います。 AGI が人間の知能を超えた場合、私たちが制御できなくなる可能性も懸念されています。

このブログでは、AGI 開発の現状、AGI がもたらす可能性、そしてリスクについて、最新の研究や専門家の意見を交えながら解説していきます。 AGI は人類にとって希望となるのか、それとも脅威となるのか？その答えを探る旅に出かけましょう。

なおこの記事は下記の２つの記事に基づいています。

How Far Are We From AGI

SITUATIONAL AWARENESS

2027年までにAGI達成？
AGIのレベル
アンホブリング – unhobbling

2027年までにAGI達成？

「Situational Awareness」の著者であるLeopold Aschenbrennerは、2027年までにAGIが実現する可能性は非常に高いと主張しています。彼は、GPT-2からGPT-4までの進化に注目し、計算能力、アルゴリズム効率、そして「アンホブリング」（AIシステムの能力を制限する要素を取り除くこと）の3つの要素が、AGI実現に向けた進歩を加速させていると分析しています。

Aschenbrennerは、GPT-2からGPT-4までの4年間で、AIの能力が「幼稚園児」レベルから「賢い高校生」レベルまで向上したと説明しています。これは、計算能力が約4.5～6桁、アルゴリズム効率が約1～2桁向上したこと、そして「アンホブリング」の進展によって実現しました。

彼は、この傾向が2027年まで続くと仮定し、2027年までに計算能力がさらに3～6桁、アルゴリズム効率がさらに1～3桁向上すると予測しています。また、「アンホブリング」の進歩により、AIシステムはチャットボットから「エージェント」や「リモートワーカー」へと進化し、人間と協力して仕事ができるようになると予想しています。

Aschenbrennerは、2027年には、主要なAI研究所が1分でGPT-4レベルのモデルをトレーニングできるようになると予測しており、これはGPT-4のトレーニング期間が3か月であったことを考えると、驚異的なスピードです。

彼は、これらの進歩により、2027年までにAIシステムは基本的にすべての認知的な仕事を自動化できるようになると予測しています。

Aschenbrennerは、AGIの定義を「自分や友人の仕事を完全に自動化できるAIシステム」としており、AI研究者やエンジニアの仕事を完全にこなすことができると考えています。

彼は、AGIが実現すれば、AI自身がAI研究を自動化できるようになり、それがさらなる技術進歩を加速させる強力なフィードバックループを生み出すと予測しています。

Aschenbrennerは、AGIは通過点に過ぎず、その後すぐに、人間よりもはるかに知能の高い「スーパーインテリジェンス」が出現すると予想しています。

Situational awarenessより抜粋。多くの領域で人間を凌駕している。

AGIのレベル

まず、AGIを3つのレベルに分けて考えてみましょう。

●レベル1：「胎児期のAGI」

●レベル2：「超人的AGI」

●レベル3：「究極のAGI」

レベル1のAGIは、ある特定のタスクなら人間より優秀だったり、同じくらいにこなせたりします。でも、まだまだ「専門家」レベルで、汎用性には欠けるんですね。例えば、今話題のGPT-4はすごい能力を持っていますが、それでもレベル1のAGIってことになるんです。

Level-1: Embryonic AGI This level of AGI usually performs better or on par with humans at specific benchmark tasks. Level-1 AGI represents the current state-of-the-art AI systems. For example, GPT-4 exhibits remarkable capabilities across many natural language tasks including language understanding,

レベル2になると、人間よりも多くのタスクをこなせるようになります。でも、開発にはまだ人間の力が必要なんです。

Level-2: Superhuman AGI The key turning point from Level-1 to Level-2 is the AI’s ability to fully replace human in real-world tasks and applications. They excel in terms of effectiveness (e.g., higher accuracy, better problem-solving skills), efficiency (e.g., faster processing speed, higher throughput, ability to handle massive amounts of data), and reliability (e.g., higher success rates, resistance to fatigue, enhanced safety guarantees). These systems might also learn from limited data, generalize knowledge across domains, adapt to novel situations with relatively little human intervention, and exhibit creativity and innovation in their approaches. They can also engage in complex decision-making processes, considering multiple factors and optimizing outcomes based on predefined objectives. Notably, Level-2 AGI should be ready to deploy in the real world and resolve the complex real-world tasks that are currently solved by humans today, without any human intervention. In our opinion, very few AI systems have achieved Level-2 except in highly specialized domains, e.g., playing the Go game.

そしてレベル3！レベル3のAGIは、与えられた目標に対して、なんと人間の介入なしに完全に自己進化できる、まさに究極のAGIなんです！でも、レベル3のAGIが本当に実現できるのかどうかはまだ分かりません。研究と議論が必要な段階です。

Level-3: Ultimate AGI While Level-2 AGI is able to replace humans in solving many tasks, the creation of the Level-2 AGI inevitably still requires human efforts. We argue that the essential milestone of Level-3

アンホブリング – unhobbling

「アンホブリング(unhobbling)」とは、AIシステム、特に大規模言語モデル（LLM）が持つ潜在能力を制限している要素を取り除き、その真価を発揮できるようにするプロセスを指します。

これは、例えるなら、これまで目を覆われていたAIの視界をクリアにするようなものです。

具体的な例として、「連鎖的な思考」のプロンプトが挙げられます。従来のLLMは、難しい数学の問題を解く際、即座に思いついた最初の答えしか出すことができませんでした。

これは、人間が難しい問題を解く際に、紙に書き出して段階的に思考するプロセスを踏まないことと同様で、AIの能力を制限する要因となっていました。

しかし、「連鎖的な思考」のプロンプトを導入することで、LLMは人間のように段階的に思考し、より複雑な問題を解決できるようになりました。

これは、アンホブリングによってAIの潜在能力が解放された一例と言えます。

アンホブリングには、以下のような様々な側面があります。

●RLHF（Reinforcement Learning from Human Feedback）：
人間のフィードバックを通して強化学習を行うことで、LLMの出力の質を向上させることができます。これは、AIが人間の意図や価値観をより深く理解し、それに沿った行動を取れるようにするための重要なステップです。

●ツールの活用：
人間が電卓やコンピュータなどのツールを使うように、LLMもツールを活用することで、より複雑なタスクを実行できるようになります。例えば、ChatGPTは現在、ウェブブラウザを使用したり、コードを実行したりすることができるようになっています。
将来的には、人間と同じようにコンピュータを操作できるようになることが期待されています。

●コンテキスト長の拡張：
LLMが利用できるコンテキスト長を拡張することで、より多くの情報を処理し、より複雑なタスクに対応できるようになります。例えば、GPT-3のコンテキスト長は2,000トークンでしたが、GPT-4では32,000トークン、Gemini 1.5 Proでは100万トークン以上に拡張されています。コンテキスト長の拡張は、LLMが大量のコードベースを理解して新しいコードを生成したり、関連する社内文書や会話のコンテキストを踏まえて文書作成を支援したりするなど、様々な応用を可能にします。

アンホブリングは、AIの能力を飛躍的に向上させるための重要な鍵であり、今後も様々な方法でAIの潜在能力が引き出されていくことが期待されています。