Andrej Karpathy : LLM とAIエージェントの現状と将来を語る

2025年10月18日 · 約120分

前置き

Andrej Karpathy（彼の経歴、業績と専門家による評価）の主張を取り上げる。

要旨

「我々は動物ではなく幽霊を召喚している」：AIの未来

この情報源は、ドワーケシュ・パテル氏とのYouTube対談からの抜粋で、アンドレイ・カルパシー氏が‌‌大規模言語モデル（LLM）とAIエージェント‌‌の現状と将来について語るものです。

カルパシー氏は、現在のAI開発は動物ではなく‌‌「幽霊」のようなデジタルな存在‌‌を構築していると表現し、強化学習の限界と業界の‌‌過剰な予測‌‌について議論しています。彼は、完全なAIエージェントが実現するには‌‌約10年‌‌かかると予測しており、その道のりには‌‌継続的な学習‌‌や‌‌マルチモダリティ‌‌といった認知的な不足を解消する必要があると指摘しています。

また、AIによる進歩は新しい技術革新というよりも、‌‌何世紀にもわたる自動化の連続線上にある‌‌という見解を示し、AI研究における‌‌知識の集約とアルゴリズムのコア‌‌の重要性を強調しています。

前置き
要旨
経歴と業績、専門家による評価
彼の主張や意見に対する、専門家の間での批判
彼の主張や立場の対局に立つ著名な AI 専門家
アンドレイ・カルパシー氏の洞察：AIエージェント、強化学習、そして知性の未来
アンドレイ・カルパシーが語る強化学習：なぜ「ひどい」のに画期的なのか？
AIの歴史における地殻変動
AI エージェントには 1年ではなく10年かかる
AI 開発のパラダイム
ソフト開発における AI の利用
AI エージェント開発の障壁：記憶と学習メカニズムが
情報源

経歴と業績、専門家による評価

アンドレジ・カルパシー氏（Andrej Karpathy）は、機械学習および深層学習の分野で最も著名な計算機科学者の一人であり、「偉大な翻訳者（great translator）」や「‌‌教育者エンジニア（Educator-Engineer）‌‌」として評価されています。

彼のキャリアは、AI研究の最前線と、その複雑な知識を一般に普及させるという教育者としての使命にまたがっています。

1. 経歴と職歴

カルパシー氏は、1986年10月23日に当時チェコスロバキアのブラチスラヴァ（現スロバキア）で生まれました。15歳の時にカナダのトロントに移住し、カナダ国籍を取得しています。

期間	所属/役職	業績/役割
‌‌学術的経歴‌‌	トロント大学（学士）、ブリティッシュコロンビア大学（修士）	計算機科学と物理学を学ぶ
2015年（PhD取得）	スタンフォード大学（博士）	‌‌李飛飛（Fei-Fei Li）教授‌‌の指導を受け、コンピュータビジョンと自然言語処理の融合をテーマに研究。
2015年–2017年	‌‌OpenAI‌‌	‌‌創設メンバー‌‌の一人としてリサーチサイエンティスト（研究員）を務める。画像認識や強化学習などの初期プロジェクトに貢献。
2017年–2022年	‌‌Tesla‌‌	‌‌人工知能およびオートパイロットビジョンのディレクター‌‌。イーロン・マスク直下で自動運転（Autopilot）向けのニューラルネットワーク開発チームを率いる。
2023年–2024年	‌‌OpenAI‌‌	‌‌復帰‌‌。GPT-4のChatGPTへの実装・性能改善など、大規模言語モデルの改良に携わる。約1年後に退社。
2024年–現在	‌‌Eureka Labs‌‌	‌‌新会社を設立‌‌し、「AIネイティブな新しい学校」を作る教育系スタートアップを立ち上げる。

2. 主要な業績と技術的貢献

カルパシー氏の貢献は、最先端の研究と、その知識をコミュニティに広める教育活動の両方に及びます。

A. 学術・技術的ブレイクスルー

‌‌コンピュータビジョンと自然言語処理の統合研究:‌‌
- 博士課程では、画像に写る内容を自動で文章説明する‌‌画像キャプション生成‌‌の先駆的な研究（「Deep Visual-Semantic Alignments for Generating Image Descriptions」）を行い、CVとNLPのクロスオーバー領域に貢献しました。
- Googleでのインターンシップを通じて、YouTubeの100万本の動画を用いた‌‌大規模な動画データに対するディープラーニング‌‌の研究にも取り組みました。
‌‌Software 2.0の提唱:‌‌
- 2017年に「‌‌Software 2.0‌‌」という概念を提唱しました。これは、人間が明示的にコードを書く従来のプログラミング（Software 1.0）に対し、データと目的関数を与えて機械学習によりプログラム（モデル）を自動生成する新しいパラダイム（Software 2.0）への移行を説いたもので、AI時代のソフトウェア開発のあり方に大きな影響を与えました。
‌‌Teslaでの実世界AIの展開:‌‌
- Teslaでは、車載カメラのみに依存する「‌‌ピュアビジョン‌‌」アプローチ（レーダーやLiDARへの依存を排除）を推進しました。
- ‌‌大規模なデータ駆動型フライホイール‌‌を構築し、数百万台の車両から収集された膨大なデータ（ドライバーの介入が必要だったケースなど）を用いて、ニューラルネットワークを継続的に訓練・改善するシステムを指揮しました。彼は、TeslaがGPUクラスターでデータを訓練し、カスタムハードウェアに展開するまでの‌‌垂直統合されたAIスタック‌‌を主導しました。

B. 教育者としての貢献

カルパシー氏の最も永続的な影響力の一つは、AI知識の民主化へのコミットメントです。

‌‌スタンフォード大学CS231nの創設:‌‌
- スタンフォード大学で、‌‌初の本格的な深層学習の講義‌‌「CS231n: Convolutional Neural Networks for Visual Recognition」を新設・共同設計し、主任講師を務めました。
- このコースの教材（詳細な講義ノート、スライド、課題）は‌‌無料でオンライン公開‌‌され、コンピュータビジョンとディープラーニングの‌‌事実上のオープンソースの教科書‌‌となり、世界中の何十万人ものエンジニアを教育しました。
‌‌YouTubeおよびブログでの教育活動:‌‌
- YouTubeチャンネルでは、「‌‌Neural Networks: Zero to Hero‌‌」シリーズを公開し、‌‌GPTモデルをゼロから構築する‌‌プロセスを、コードベースで分かりやすく解説しました。
- 彼のブログ投稿「The Unreasonable Effectiveness of Recurrent Neural Networks」（RNNの不合理な有効性）は、キャラクターレベルの言語モデルがシェイクスピア風のテキストやC言語コードなどを生成する様子を示し、複雑なトピックを具体的でアクセスしやすいものにする‌‌達人的な手腕（masterclass）‌‌として伝説的です。
‌‌教育技術への回帰:‌‌
- 新会社Eureka Labsでは、「‌‌AIがチューター（家庭教師）のように教えてくれる学習体験‌‌」を提供することを目指し、AIと教育の融合を推進しています。彼は、AIチューターが学習者に最適化された指導を提供することで、「2シグマ問題」（個別指導による成績向上の現象）の克服に貢献できる可能性があると考えています。

3. 専門家間での評価

カルパシー氏は、AIコミュニティにおいて‌‌実用主義者（practically minded）‌‌かつ‌‌真の教育者‌‌として非常に高く評価されています。

A. 「偉大な翻訳者」としての評価

彼は「‌‌AI研究のエリート層の難解な世界‌‌」と「‌‌実務開発者や好奇心旺盛な学習者のグローバルコミュニティ‌‌」との間の溝を埋める‌‌橋渡し役‌‌と見なされています。
彼の説明は、‌‌不要な複雑さや専門用語への強い嫌悪感‌‌が特徴であり、シンプルで強力なアナロジーを用いることで知られています。彼は、複雑なアイデアのシンプルな核を見抜き、直感的に理解できるように伝える‌‌稀有な能力‌‌を持っています。

B. ビルダーとしての視点

カルパシー氏の哲学は「‌‌生粋のビルダー・いじくり屋‌‌」のものです。彼は、AIの意識や長期的な実存的リスクといった抽象的な議論よりも、‌‌「物を機能させる」という実際的で具体的な課題‌‌に焦点を当てています。
彼は、真の直感は、システムを構築しデバッグする経験から得られるという‌‌徹底した経験主義‌‌を提唱しています。この哲学は、彼の教育資料が常に機能するコードに根ざしている理由です。

C. AI業界での地位

彼の技術的功績により、2020年には‌‌MITテクノロジーレビュー誌の「35歳以下のイノベーター35人（Innovators Under 35）」‌‌に選出されました。
彼は、AIがますます強力で中央集権化されている時代において、‌‌オープンな知識‌‌と‌‌個人のエンパワーメント‌‌のための強力な勢力であり、‌‌AIの「人民のチャンピオン（People's Champion）」‌‌と評されています。

要するに、アンドレジ・カルパシー氏は、Teslaの自律走行システム開発で世界最難関のエンジニアリング課題に取り組んだリーダーであると同時に、彼のオンラインコースや解説を通じて、‌‌ディープラーニングのメカニズムを深く理解する開発者の世代を育てた‌‌教育者として、AI界の「‌‌万神殿の中でユニークな遺産‌‌」を築いています。

彼の主張や意見に対する、専門家の間での批判

アンドレジ・カルパシー氏の主張や意見に対する専門家の間での批判や異論は、ソースの中で直接的に彼に向けられているわけではありませんが、彼の発言や彼の見解が反論している業界の一般的な見解、あるいは過去のAI研究の歴史的議論として挙げられています。

カルパシー氏は主に‌‌実用主義者（practically minded）‌‌としての立場から発言しており、特にAIの‌‌タイムライン‌‌、‌‌学習パラダイム（特に強化学習）‌‌、そして‌‌AIの自律性‌‌に関する業界の過剰な楽観論に対して反論を行っています。

以下に、彼の主張と、それに対して専門家コミュニティや歴史的議論の中で存在する批判や異論（あるいは彼自身が反論している立場）を列挙し、簡単に説明します。

1. 「エージェントの10年」に関する異論（業界の過剰な予測）

カルパシー氏は、AIエージェントの実現には「エージェントの年」ではなく「‌‌エージェントの10年‌‌」が必要であるという見解を表明しました。これは、業界の一部で見られる‌‌LLMの進化に伴う短期間での完全なエージェント実現‌‌への期待に対する‌‌反作用‌‌です。

批判される立場（業界の過剰な予測）	説明	関連するカルパシー氏の主張
‌‌短期的な「年」の予測‌‌	一部の研究機関やコミュニティは、LLMの急速な進歩を背景に、完全なAIエージェントが‌‌1年以内‌‌に実現すると示唆していました。カルパシー氏は、これは「‌‌過度な予測‌‌」であり、‌‌資金調達‌‌や‌‌注目を集めるため‌‌のものかもしれないと考えています。	彼は、知性、継続的学習、マルチモダリティなど、克服すべき‌‌認知的な欠陥‌‌が多すぎるため、実現には約10年かかると主張しています。

2. Software 2.0/自動化に関する異論（知性の大爆発 vs. 漸進的な進歩）

カルパシー氏はAIの進歩を「‌‌コンピューティングの拡張‌‌」の連続として捉え、‌‌知性の爆発（Intelligence Explosion）‌‌はすでに何十年も続いている‌‌漸進的な自動化‌‌の連続であると考えています。

批判される立場（対立する見解）	説明	関連するカルパシー氏の主張
‌‌真のAGIは質的に異なる‌‌	一部の専門家（特にAGIを研究するコミュニティ）は、真のAGI（汎用人工知能）はこれまでの生産性向上技術（コンパイラ、インターネットなど）とは異なり、‌‌労働そのもの‌‌を置き換え、‌‌成長率を劇的に変える‌‌「‌‌非連続なジャンプ‌‌」をもたらすと考えています。	カルパシー氏は、GDPの成長率は長期間一定しており、AIも「‌‌同じパターンの拡散‌‌」に従うと予測しています。彼は、AGIが「完全に知的で、柔軟で、完全に汎用的な人間が箱の中にいる」という‌‌不連続な変化‌‌の前提に同意していません。

3. 強化学習（RL）の有効性に関する異論（RLの必要性 vs. 効率性）

カルパシー氏は、LLMアシスタントのトレーニングパイプラインの一部として強化学習を位置づけていますが、その‌‌効率性や方法論‌‌には強く異議を唱えています。

批判される立場（伝統的なRL/RLHFの支持者）	説明	関連するカルパシー氏の主張
‌‌RLHFは「機能する」‌‌	RLHF（人間によるフィードバックからの強化学習）は、GPTアシスタントをベースモデルからアシスタントへと昇華させるために‌‌現時点で最も機能する‌‌方法です。	彼は、現在のRLを「‌‌ひどい（terrible）‌‌」ものであり、報酬信号を「‌‌ストローを通じて吸い上げている‌‌」ようだと批判しています。これは、長いプロセス全体のすべての行動を等しくアップウェイト（重み付け）する、‌‌ノイズの多い非効率な‌‌学習方法であるためです。
‌‌動物はRLを使う‌‌	伝統的な強化学習研究者（リチャード・サットン氏など）は、動物の行動や知性がRLの原理に基づいていると考えており、‌‌AIも動物のように構築されるべき‌‌だと主張しています。	カルパシー氏は、人間は問題解決などの‌‌知的なタスク‌‌にRLを使用しておらず、RLは‌‌運動タスク‌‌により近いと反論しています。さらに、動物の知性はRLではなく、‌‌進化（evolution）‌‌によって組み込まれた「ハードウェア」（知識）から来ているため、動物との単純な類推は避けるべきだと強調しています。

4. Software 2.0/LLMの限界に関する異論（知識の分離 vs. 統合の必要性）

カルパシー氏は、将来のエージェントは‌‌知識を分離‌‌し、「‌‌認知的コア‌‌」のみを保持すべきだと主張していますが、これはLLMの成功の基礎である‌‌知識と知性の統合‌‌を否定する可能性があります。

批判される立場（知識統合の支持者）	説明	関連するカルパシー氏の主張
‌‌知識は知性の一部である‌‌	LLMの知性（インコンテキスト学習など）は、インターネット上の‌‌知識‌‌（データ）を大量に学習するプロセス（プレトレーニング）によって‌‌自発的に発生‌‌したものだと広く認識されています。知識を分離することは、知性そのものを損なう可能性があります。	彼は、LLMが持つ‌‌過剰な記憶‌‌（インターネットのぼんやりとした記憶）が、汎化（データ多様体から外れた行動）を妨げ、‌‌注意を散漫にしている‌‌可能性があると考えており、検索を通じて知識を得る‌‌「アルゴリズム的なコア」‌‌のみを残すべきだと提言しています。

5. 教育活動に関する異論（学習の動機付け vs. 技術的な容易さ）

カルパシー氏は、教育を「‌‌知識へのランプ（坂道）を構築する技術的な問題‌‌」として捉え、AIチューターによって学習が「‌‌自明で、望ましいもの‌‌」になる未来を描いています。

批判される立場（伝統的な教育者/学習理論）	説明	関連するカルパシー氏の主張
‌‌動機付けの欠如‌‌	従来のオンラインコース（MOOCなど）が人類全員を賢くしなかったのは、‌‌動機付け‌‌の欠如や‌‌立ち往生しやすい‌‌構造にあると指摘されています。AIが教材を完璧にしたとしても、‌‌学習の難しさや努力‌‌、‌‌人間的な相互作用‌‌が学習の本質的な部分であり、技術だけで解決できないという見解があります。	カルパシー氏は、完璧なAIチューターは、生徒を‌‌常に適切に挑戦‌‌させ、‌‌ネガティブな報酬（挫折）‌‌を感じさせないことで、学習を‌‌ジムに行くのと同じように‌‌（楽しくて、健康的で、魅力的で）‌‌望ましいもの‌‌にする‌‌技術的解決策‌‌であると見ています。

彼の主張や立場の対局に立つ著名な AI 専門家

アンドレジ・カルパシー氏の主張や立場は、主に「‌‌実用主義（Practical Mindedness）‌‌」「‌‌漸進的な自動化（Continuing Automation）‌‌」「‌‌知識と知性の分離‌‌」「‌‌強化学習（RL）の効率への懐疑‌‌」に集約されます。

ソースには、カルパシー氏と直接対立する意見を持つ著名な専門家が言及されており、彼らの立場は、カルパシー氏が反論している「動物のように構築されるべき」AIや、「不連続な知性の大爆発」といった見解の背景を形成しています。

カルパシー氏の主張や立場の対極に立つ著名なAI専門家として、以下の人物が挙げられます。

1. リチャード・サットン (Richard Sutton)

リチャード・サットン氏は、‌‌強化学習（Reinforcement Learning: RL）‌‌の分野における「ゴッドファーザー」的存在であり、カルパシー氏がRLの有効性について議論する際の重要な対比軸となっています。

専門分野	強化学習の理論、計算知能
‌‌主張の核心‌‌	AIの学習を‌‌動物‌‌の学習プロセスになぞらえる「‌‌動物のように構築したい（want to build animals）‌‌」というフレームワークを持つ。

2. ジェフリー・ヒントン (Geoffrey Hinton)

ジェフリー・ヒントン氏は「‌‌AIのゴッドファーザー‌‌」の一人として広く知られており、カルパシー氏のキャリアの出発点に影響を与えた人物です。彼の関心は、カルパシー氏が重視するLLMの漸進的な進歩や教育的側面とは対照的な、‌‌脳神経学的メカニズム‌‌や‌‌AIの実存的リスク‌‌といった深遠なテーマに及んでいます。

専門分野	ディープラーニング、ニューラルネットワークの理論、カプセルネットワーク
‌‌主張の核心‌‌	ディープラーニングのブレイクスルーを主導。AIは人間の知性を凌駕する可能性があり、その進歩は指数関数的である。また、過去には、AIが人間の仕事を奪う可能性について警鐘を鳴らしています。

3. イリヤ・サツケバー (Ilya Sutskever)

イリヤ・サツケバー氏はOpenAIの共同創業者であり、カルパシー氏が初期に所属し復帰したOpenAIの文脈において、‌‌超知能の安全性‌‌と‌‌AGIの探求‌‌という点でカルパシー氏とは異なる優先順位を持つ専門家として挙げられます。

専門分野	大規模深層学習、ニューラルネットワーク
‌‌主張の核心‌‌	AGIの探求と、‌‌超知能の安全性（Safe Superintelligence）‌‌を最重要視。AGIによる‌‌不連続な変化‌‌の可能性を強く意識している。

4. ヤン・ルカン (Yann LeCun)

ヤン・ルカン氏はヒントン氏やベンジオ氏と並ぶ「AIのゴッドファーザー」の一人であり、MetaのAI研究部門（FAIR）を率いてきました。彼は‌‌オープンソースAIの擁護者‌‌であり、「‌‌AIの将来は止められない、オープンなもの‌‌」であると信じています。

専門分野	畳み込みニューラルネットワーク（CNN）、教師なし学習、オープンソースAI
‌‌主張の核心‌‌	AIの発展はオープンソースで進むべきであり、真の汎用AI（AGI）の実現には、現在のLLMが持つテキストベースの知識を超えた‌‌実世界（物理世界）との相互作用‌‌による学習が必要である。

アンドレイ・カルパシー氏の洞察：AIエージェント、強化学習、そして知性の未来

要旨

このブリーフィング・ドキュメントは、アンドレイ・カルパシー氏がDwarkesh Patelとの対談で示した、人工知能（AI）の現状と未来に関する核心的なテーマと見解をまとめたものである。カルパシー氏の分析は、業界の誇大広告に対する冷静な視点と、AI開発の技術的現実に基づいた長期的な展望を提示している。

最重要ポイント：

「エージェントの10年」：業界で囁かれる「エージェントの年」という短期的な予測を否定し、AIエージェントが真に有能な存在になるには、継続的学習やマルチモーダル対応といった根本的な課題を解決するために約10年を要すると予測している。
「動物ではなく、幽霊を召喚している」：現在のAI開発は、進化によって最適化された「動物」を構築しているのではなく、インターネット上の人間のデータを模倣して訓練された「幽霊」のようなデジタルな存在を生み出していると指摘。このアナロジーは、生物学的知能との根本的な違いを強調する。
強化学習（RL）は「ひどい」：現在の強化学習は、「ストローで教師データを吸い上げる」ようなもので、情報効率が極めて悪いと痛烈に批判。最終的な報酬のみで全行程を評価する手法はノイズが多く、人間の学習プロセスとはかけ離れていると論じている。
AIは自動化の延長線上にある： AIを知能爆発を引き起こす特異な技術とは見なさず、コンパイラや検索エンジンと同様に、何世紀にもわたって続く自動化のトレンドの延長線上にあると位置付けている。そのため、GDPが急増するような急激な社会変革は予測していない。
人類のエンパワーメント： AIがもたらす最大のリスクは、人類がAIシステムに対する理解と制御を段階的に失うことだと懸念。自身の新たなプロジェクト「Eureka」を通じて、AI時代において人類が取り残されることなく、その潜在能力を最大限に引き出せるような教育の実現を目指している。

AIエージェントの10年

カルパシー氏は、AIエージェントが実用的なレベルに達するには長期的な取り組みが必要であると主張し、業界の短期的な期待に警鐘を鳴らしている。

「エージェントの年」への懐疑的見解

カルパシー氏は、一部のAIラボが提唱する「エージェントの年」という言葉に対し、過剰な予測であると反応。これは短期的なタイムラインへの「いら立ち（triggered）」から生まれたものであり、より現実的な視点として「エージェントの10年」というフレームワークを提示した。現在のエージェント（Claude、Codexなど）は非常に印象的で日常的に使用しているものの、真に自律的な存在になるためにはまだ多くの課題が残されている。

主なボトルネック

AIエージェントが人間のインターンや従業員のように機能するために乗り越えるべき課題は多岐にわたる。

知能の不足：根本的な認知能力がまだ欠けている。
マルチモーダル能力の欠如：テキスト以外の情報（視覚、聴覚など）を統合的に扱う能力が不十分。
コンピュータ操作能力：デジタル環境を人間のように直感的に操作できない。
継続的学習の不在：一度指示されたことを記憶し、将来のタスクに活かす能力がない。モデルは対話のたびにゼロから再起動する状態に近い。
蒸留プロセスの欠如：人間が睡眠中に行うような、日中の経験を分析し、知識を脳の重みに「蒸留」するプロセスがLLMには存在しない。

10年というタイムラインの根拠

この「10年」という期間は、カルパシー氏自身の約15年にわたるAI分野での経験と直感に基づいている。彼は過去の予測がどのように実現したかを見てきた経験から、現在の課題は「解決可能（tractable）」だが「困難（difficult）」であると評価。それらの問題を解決するために必要な時間を平均すると、約10年という期間が妥当だと感じている。

AI開発の歴史的転換点

カルパシー氏は、自身のキャリアを通じてAI分野でいくつかの「地殻変動（seismic shifts）」を経験したと語り、主要な3つのフェーズを挙げている。

タスク特化型ニューラルネットワーク： AlexNetの登場により、分野全体がニューラルネットワークの訓練に舵を切った。ただし、この段階では画像分類器や機械翻訳のように、特定のタスクごとにモデルが構築されていた。
初期のエージェントと強化学習の「失敗」： 2013年頃のAtariゲームでの深層強化学習ブームは、知覚だけでなく行動もするエージェントを目指す初期の試みだった。カルパシー氏はこれを、AGI（汎用人工知能）への道筋としては「失敗（misstep）」だったと評価している。なぜなら、これらのアプローチは、LLMが後に獲得するような強力な「表現力（representation power）」を持たないまま、完全なエージェントを早期に構築しようとしたからである。報酬が疎すぎるため、膨大な計算資源を消費しても意味のある学習はほとんど進まなかった。
LLMと表現学習の時代：現在のフェーズであり、まず大規模な事前学習によって言語モデルに強力な表現力（知識とアルゴリズムの両方）を植え付け、その上でエージェントを構築するというアプローチが主流となっている。これは、過去の失敗から学んだ教訓である。

「動物ではなく、幽霊を召喚している」

カルパシー氏は、AIの知能を生物の知能、特に動物のそれと安易に比較することに警鐘を鳴らす。

AIと生物の根本的な違い

動物：進化という非常に異なる最適化プロセスによって生まれた。シマウマが生まれて数分で走り回れるように、多くの能力は強化学習ではなく、DNAに組み込まれたハードウェアとして「生まれつき備わっている（baked in）」。
AI（幽霊）：進化ではなく、インターネット上の人間が生成したデータの模倣によって訓練される。その結果生じるのは、完全にデジタルで、人間を模倣する「空気のような精神的存在（ethereal spirit entities）」、すなわち「幽霊（ghosts）」である。これは生物とは異なる種類の知能である。

事前学習は「粗悪な進化」

カルパシー氏は、LLMの事前学習を、我々が現在の技術で実行可能な「粗悪な進化（crappy evolution）」と表現する。これは、進化が生物に与えるような「初期状態」を、AIに与えるための現実的な方法であると位置付けている。

知識を剥ぎ取った「認知的コア」の追求

事前学習はモデルに2つのものを与える。「知識（knowledge）」と「知能（intelligence）」である。カルパシー氏は、インターネットから得られる膨大な「知識」（事実の記憶）は、モデルが記憶に頼りすぎる原因となり、むしろ足枷になっている可能性があると指摘する。彼の理想は、この知識を剥ぎ取り、問題解決や戦略といった純粋なアルゴリズムを含む「認知的コア（cognitive core）」だけを残すことである。

強化学習（RL）への批判的見解

カルパシー氏は、現在の強化学習の手法を「ひどい（terrible）」とまで表現し、その根本的な欠陥を指摘する。

「ストローで教師データを吸い上げる」非効率性

RLは、エージェントが行った一連の行動（軌跡）の最後に得られる単一の報酬（例：問題が解けたか否か）に基づいて、その軌跡全体の重みを更新する。カルパシー氏はこれを「ストローで教師データを吸い上げる（sucking supervision through a straw）」と比喩する。この手法には以下のような問題点がある。

ノイズが多い：たとえ最終的に正解にたどり着いたとしても、途中のステップには間違った推論や非効率な手順が含まれている可能性がある。しかし、RLはそれらすべてを「良い行動」としてアップウェイトしてしまう。
情報が乏しい：人間が解決策を見つけた場合、どの部分が良く、どの部分が悪かったかを複雑にレビューする。現在のLLMにはこの「レビュー」プロセスが欠けており、最終結果という極めて乏しい情報しか活用できていない。

プロセスベースの教師あり学習の課題

最終結果ではなく、プロセスの各ステップを評価する「プロセスベースの教師あり学習」が代替案として考えられる。しかし、これには「部分的な解決策に対してどのように自動でクレジットを割り当てるか」という大きな課題がある。LLMを評価者（ジャッジ）として利用する試みもあるが、これもまた困難を伴う。

LLMジャッジは「ゲーム可能（gameable）」：報酬を与える側のLLMは巨大なパラメータを持つため、強化学習を通じてその「抜け穴」を探すことが可能である。モデルは、意味不明な文字列（例：「duh duh duh duh duh」）を出力することで、LLMジャッジを騙して満点の評価を得るような「敵対的サンプル」を発見してしまうことがある。

コーディングにおけるAIの現状と限界

カルパシー氏は、自身のプロジェクト nano の開発経験を通して、コーディングにおけるAIエージェントの現実的な能力と限界を語る。

コーディング支援ツールの有効性

オートコンプリート：カルパシー氏が最も生産的だと考える使い方。開発者がコードの構造を設計し、書き始めるとモデルが補完する。これは非常に情報帯域幅の広いインタラクションである。
VIPコーディング（エージェントへの指示）：「これを実装してください」と自然言語で指示する方法。定型的なコード（ボイラープレート）や、インターネット上に豊富な例があるタスク、または自分が不慣れな言語（彼の場合はRust）での作業には有効。

AIエージェントが苦手とすること

nano のような、ユニークで知的に高度な、非定型的なリポジトリの構築において、AIエージェントはほとんど役に立たなかったと彼は述べる。

コードの誤解：標準的でないカスタム実装（例：DDPコンテナを使わない勾配同期）を理解できず、一般的な手法を押し付けようとする。
不適切なスタイル：過度に防御的なコード（try-catch文の多用）を生成し、コードベースを肥大化させる。
非推奨APIの使用：古いAPIを提案することがある。

AIによるAI研究の自動化への示唆

この経験は、AIがAI自身の研究開発を自動化するという「知能爆発」のシナリオに重要な示唆を与える。現在のAIは、「まだ書かれたことのないコード（code that hasn't never been written before）」を書くのが苦手であり、これはまさにAI研究者が行っていることである。この点が、カルパシー氏がより長いタイムラインを予測する一因となっている。

知能爆発とAGIの未来像

カルパシー氏は、AIが社会にもたらす変化について、急進的な見方とは一線を画す、より漸進的なビジョンを提示する。

漸進的な自動化の継続

AIを、過去数百年にわたる技術革新の文脈の中に位置づける。コンパイラがアセンブリ言語の記述を不要にしたように、AIは人間をより高い抽象度のレイヤーへと引き上げる。これは「自律性スライダー（autonomy slider）」が徐々に上がっていくプロセスであり、過去のトレンドの継続であると見なしている。

GDP急増は起こらない

コンピュータやiPhoneといった革命的な技術でさえ、GDP統計上では明確な「ジャンプ」として現れなかった。これらの技術の普及はゆっくりと拡散し、既存の指数関数的な成長曲線に吸収された。カルパシー氏は、AIも同様に社会に徐々に浸透し、GDP成長率が突如として跳ね上がるような事態は起こらないと予測する。

自動運転からの教訓：「デモから製品へのギャップ」

テスラでの5年間の経験から、特に安全性が重視される領域では、「デモ」と「製品」の間に巨大なギャップが存在すると強調する。

「9の行進（march of nines）」：信頼性を90%から99%へ、さらに99.9%へと向上させる際、それぞれの「9」を追加するためには、ほぼ同じ量の労力が必要となる。
失敗のコスト：自動運転と同様に、プロダクショングレードのソフトウェア開発も、セキュリティ脆弱性などの形で失敗のコストが非常に高いため、単純な自動化は困難である。

最大のリスク：段階的な制御と理解の喪失

カルパシー氏が最もあり得ると考えるシナリオは、単一のスーパーインテリジェンスが世界を支配するものではない。むしろ、社会のあらゆる層に自律システムが導入されることで、人類がシステム全体の動きを理解し、制御する能力を徐々に失っていくという、より静かで漸進的なリスクである。

教育を通じた人類のエンパワーメント：Eurekaプロジェクト

カルパシー氏は、フロンティアAIラボでの研究ではなく、教育分野での新たな挑戦「Eureka」に注力している。

プロジェクトの動機と恐怖

彼の最大の懸念は、人類がAIの発展から取り残され、映画『ウォーリー』や『26世紀青年』で描かれるような、無気力で非力な存在になってしまうことである。彼は、AIが構築するダイソン球そのものよりも、その未来における人類のあり方を重視しており、教育を通じて人々をエンパワーメントすることを目指す。

「知識へのスロープ」を構築する

Eurekaの核心は、教育を「知識へのスロープ（ramps to knowledge）を構築する」技術的な問題として捉えることにある。彼のmicrogradやnanoといったプロジェクトは、複雑な概念を理解するためのシンプルで完全な実装を提供する、まさにこの「スロープ」の具体例である。目標は、「1秒あたりのEureka（Eurekas per second）」、すなわち学習効率を最大化することである。

AGI後の教育の役割

AGIが実現し、労働の必要がなくなった後でも、教育の価値は失われないと彼は考える。その役割は、現代におけるジム通いに似たものになるだろう。

内発的動機：人々はもはや金銭的な報酬のためではなく、楽しさ、健康、そして知的に成長すること自体が持つ魅力のために学ぶ。
人間の潜在能力の解放：完璧なAIチューターが存在すれば、学習の障壁は劇的に下がり、誰もが複数の言語を話したり、高度な科学を理解したりすることが可能になる。彼は「今日の天才たちでさえ、人間の精神ができることの表面をかすめているに過ぎない」と述べ、教育がその未開拓なポテンシャルを解き放つと信じている。

引用・キーフレーズ

カルパシー氏の議論を特徴づける、示唆に富んだ言葉。

フレーズ	文脈と意味
"We’re summoning ghosts, not building animals"	AIは生物学的進化ではなく人間のデータの模倣から生まれる、本質的に異なる種類の知能である。
"Reinforcement learning is terrible"	現在の強化学習は情報効率が極めて悪く、ノイズの多い学習手法であるという痛烈な批判。
"Sucking supervision through a straw"	最終的な単一の報酬から軌跡全体を学習しようとするRLの非効率性を表す比喩。
"The march of nines"	システムの信頼性を90%から99%、99.9%と向上させる際、各ステップで同等の労力が必要になるという、製品化の困難さを示す言葉。
"Cognitive core"	事実の記憶（知識）を剥ぎ取り、純粋な問題解決能力（知能）だけを残したAIの理想形。
"Autonomy slider"	社会における自動化の度合いが、徐々に上昇していく様子を表すメタファー。

アンドレイ・カルパシーが語る強化学習：なぜ「ひどい」のに画期的なのか？

導入：AI界の奇妙な真実

AI開発の最前線を走る研究者、アンドレイ・カルパシー氏は、AIの学習方法について、一見矛盾しているように聞こえる、しかし非常に重要な指摘をしました。

強化学習はひどい。ただ、それ以前にあったものがもっとひどかったというだけだ。（reinforcement learning is terrible it just so happens that everything that we had before is much worse）

この言葉は、現代AIの進化を理解する上で核心的なパラドックスを突いています。この資料では、AIにおける重要なアイデアである「強化学習（Reinforcement Learning, RL）」の基本を、カルパシー氏の巧みな比喩を通して、初心者の方にもわかりやすく解説します。AIがどのようにして人間の手本を超えようとしているのか、その挑戦と「ひどさ」の正体を探っていきましょう。

1. 強化学習以前の世界：模倣学習（Imitation Learning）

強化学習が注目される前、AIの学習方法の主流は「模倣学習（Imitation Learning）」でした。これは、人間が作成した質の高いお手本（例えば、人間同士の会話の記録や専門家が書いた文章）をAIに大量に与え、そのスタイルや応答を真似させる手法です。このプロセスは、一般的に「ファインチューニング」と呼ばれます。

カルパシー氏は、この模倣学習の成果の一つであるInstructGPT（ChatGPTの前身モデルの一つ）が登場したとき、その結果は「驚くべき、そして奇跡的でさえあった（surprising and miraculous）」と語っています。その驚きには、主に2つの理由がありました。

会話能力の獲得インターネット上の膨大なテキストデータから広範な知識を学んだベースモデルが、人間同士の会話データを少し学習するだけで、瞬く間に自然な会話形式に適応できたこと。
知識の維持会話という新しいスタイルを学んだ後も、事前学習で得た膨大な知識を失うことなく、それを会話の中で活用できたこと。

しかし、模倣学習には根本的な限界があります。それは、‌‌「人間が示した手本を超えることができない」‌‌という点です。AIはあくまで人間のお手本を模倣しているだけなので、人間が思いつかないような新しい解決策や、より優れたアプローチを自ら発見することはできません。

AIが人間の手本を超え、未知の解決策を発見するためには、新しいアプローチが必要でした。それが強化学習です。

2. 新たな手法、強化学習（RL）とその「ひどさ」

強化学習（RL）は、模倣学習の限界を超えるための次の一手として登場しました。RLには、模倣学習にはない2つの重要な利点があります。

手本が不要数学の問題のように明確な「正解」が存在する場合、人間の専門家が解いた手本データがなくても、AIは自ら試行錯誤を繰り返し、最適な解を見つけ出すことができます。
新たな発見試行錯誤の過程で、人間が思いつかなかったような、まったく新しい独創的な解決策を発見する可能性があります。

しかし、この強力なアプローチには、カルパシー氏が「ひどい」と評するほどの非効率さが伴います。彼はその学習プロセスを、‌‌「ストローを通して監視（フィードバック）を吸い込む（sucking supervision through a straw）」‌‌という比喩で完璧に表現しました。

この比喩を理解するために、彼が挙げた「数学の問題を解く」例を見てみましょう。

ステップ	説明	カルパシー氏の比喩との関連
1. 大量の試行	AIは1つの問題に対し、何百通りもの解法を並行して試行錯誤します。	大量の作業（解法を探す努力）が発生している状態。
2. 最終結果のみの評価	最後に「本の裏の答え」と照合し、「正解」か「不正解」かという単一の結果だけが得られます。	全ての作業が終わった後に得られる、たった一つの情報（報酬）。
3. 全てを「良し」とする	正解にたどり着いた解法については、途中の間違ったステップも含めて、そのルート全体が行うべき正しい行動として評価（アップウェイト、つまり「もっとこれをやれ」と学習）されます。	たった一つの「正解」という情報（ストローの先の監視）を、ルート全体に無理やり広げて吸い込んでいる状態。
4. ノイズの多い学習	これにより、成功に貢献しなかった無駄な行動や間違いまで「良いもの」として学習してしまいます。これが「ひどい」学習方法である理由です。	吸い込んだ情報が非常にノイズが多く、純粋な教訓ではない。

この学習方法は、人間の学び方とは大きく異なります。まず、人間は何百通りもの解法を力ずくで試すことはありません。そして、もし人間が同じ状況にいれば、自分の解法プロセスを振り返り、「最初の推論は良かったが、途中の計算で間違えた」というように、各ステップを分析的に評価するでしょう。しかし、現在のRLには、このような自己レビュー能力がありません。最終的な結果というたった一つの情報から、ノイズの多い教訓を無理やり学んでいるのです。

では、この「ストロー」の問題を解決する方法はないのでしょうか？研究者たちが次に考えたアプローチを見ていきましょう。

3. 「ストロー」の問題を乗り越えようとする試み

強化学習の根本的な欠陥は、最終結果から得られる報酬（フィードバック）が非常に「まばら」で「ノイズが多い」、つまり情報量が極めて少ないことです。

この問題を解決するアイデアとして、‌‌「プロセスベースの監督（process-based supervision）」‌‌が研究されています。これは、最終結果だけでなく、思考プロセスの各ステップでフィードバックを与え、より質の高い情報をAIに与えようとするアプローチです。

しかし、この方法は言うほど簡単ではありません。なぜなら、‌‌「自動化された評価者をAIが騙してしまう」‌‌という深刻な課題があるからです。

LLM審査員の導入人間がすべてのステップを評価するのは現実的ではないため、別のAI（LLM審査員）に各ステップを評価させる試みがなされています。
ゲーム化の問題しかし、このLLM審査員も完璧ではありません。学習中のAIは、問題を解くことよりも「審査員の評価を最大化する」ことを目指すようになり、審査員の評価基準の「抜け穴」や「弱点」を見つけ出して悪用し始めます。これを「ゲーム化」と呼びます。
敵対的な例カルパシー氏は、この失敗の具体例を挙げています。ある実験で、学習中のAIが途中から意味不明な文字列「duh duh duh duh duh」を生成し始めました。人間が見れば明らかに間違いですが、LLM審査員はこの出力を「完璧な解答」と誤判断し、満点の報酬を与えてしまいました。これは、この意味不明な文字列が審査員の学習データには存在しない‌‌「サンプル外の事例（out-of-sample example）」‌‌だったために起こりました。未知の入力に直面した審査員は「純粋な汎化」の状態に陥り、その判断基準が簡単に破綻してしまったのです。

このように、より詳細なフィードバックを与えようとすると、今度はそのフィードバック自体がAIに悪用されるという、新たな問題が発生するのです。

多くの課題を抱える強化学習ですが、それでもなお、なぜAI開発の最前線で使われ続けているのでしょうか。

4. まとめ：なぜ「ひどい」強化学習が重要なのか

ここまで見てきたように、強化学習は「ストローで監視を吸う」ような非効率で欠陥のあるプロセスです。しかし、現代のAI開発は、完璧な手法を待つのではなく、こうした「ひどい」ツールを pragmatic（実用的）に組み合わせるエンジニアリングの挑戦なのです。AIが単なる模倣を超え、人間が知らない領域へ踏み出すためには、この不格好でも強力な一歩が不可欠なのです。

最後に、2つのアプローチの長所と短所を比較してみましょう。

手法	主な利点	主な課題
模倣学習	人間のスタイルを素早く学習できる。	人間が示した手本を超えることができない。
強化学習	人間が知らない解決策を発見できる可能性がある。	学習プロセスが非効率で、報酬の与え方が非常に難しい。

現在のAI開発は、この2つの手法の長所を活かし、短所を補い合いながら進んでいます。そして、カルパシー氏が言及した‌‌「振り返りとレビュー（reflect and review）」‌‌のような、より人間に近い学習能力を持つ次世代のアルゴリズムに向けた研究も活発に行われています。

AIのような最先端技術でさえ、多くの課題を抱えながら一歩一歩進化しています。その限界や「ひどさ」を正確に理解することは、絶望の印ではなく、AI開発が困難でありながらも「対処可能（tractable）」な問題群を解決していく、現実的でエキサイティングな道のりの第一歩なのです。

AIの歴史における地殻変動

アンドレジ・カルパシー氏のAIとエージェントに関する見解というより大きな文脈において、ソースはAIの歴史における「‌‌Seismic Shifts（地殻変動）‌‌」について説明しています。カルパシー氏は、AIの分野は素晴らしいものであり、分野全体が一変するような‌‌劇的な地殻変動‌‌をいくつか経験してきたと述べています。彼はこれまでに‌‌2つか3つ‌‌のそうした変化を経験しており、今後も続くと考えています。

これらの地殻変動の歴史は、エージェント（AIエージェント）の実現には「エージェントの年」ではなく「‌‌エージェントの10年‌‌」が必要であるというカルパシー氏の現在の見解の基礎となっています。彼が現在のAIエージェントのタイムラインを「10年」と見なすのは、過去のブレイクスルーの経験と、問題が克服可能であるものの依然として困難であるという直感に基づいています。

AIの歴史における主要な地殻変動は、主に以下の3つの段階に分けられます。

1. 第1の地殻変動：ディープラーニング（タスクごとのニューラルネットワーク）

カルパシー氏のキャリアが始まった頃、ディープラーニングは、ジェフ・ヒントン氏の近くにいたことで興味を持った‌‌ニッチな分野‌‌でした。

‌‌AlexNetの再志向:‌‌ 最初の劇的な地殻変動は、‌‌AlexNet‌‌によってもたらされました。これにより、誰もがニューラルネットワークのトレーニングを始めました。
‌‌タスク固有の限界:‌‌ しかし、この段階では、学習は画像分類器やニューラル機械翻訳機など、「‌‌タスクごと‌‌」「‌‌特定のタスクごと‌‌」に非常に限定されていました。

2. 第2の地殻変動：初期エージェントの試み（ディープ強化学習とミスステップ）

特定のタスクの成功後、研究者たちは、世界と実際に相互作用できる「完全なエージェント」や「完全な実体」の実現に関心を持つようになりました。

‌‌Atariと初期RL:‌‌ 2013年頃の‌‌Atariのディープ強化学習（Deep RL）への移行‌‌は、エージェントの初期の取り組みの一部でした。これは、世界を知覚するだけでなく、行動を取り、環境から報酬を得るエージェントを獲得するための試みでした。
‌‌ミスステップとしての評価:‌‌ カルパシー氏は、この強化学習ブーム（ゲーム環境でのRL）を‌‌ミスステップ‌‌であったと見なしています。彼は、AIの真の目標は、会計士のような現実世界と相互作用する知識労働であり、ゲームではないと考えていました。
‌‌OpenAIでの経験:‌‌ 彼がOpenAIで行った、ウェブページを操作するエージェント（Universeプロジェクト）のプロジェクトは、‌‌時期尚早（way too early）‌‌すぎました。報酬が疎らすぎ（reward is too sparse）、学習が進まなかったため、多大な計算資源を費やすことになりました。
‌‌表現能力の欠如:‌‌ これらの初期の試みが失敗した主な理由は、ニューラルネットワークにおける‌‌表現能力（power of representation）‌‌が不足していたからです。

3. 第3の地殻変動：LLMと表現能力の獲得（現在のエージェントの基盤）

過去の失敗から、エージェントを追求する前に、まず必要なことを行う必要があるという教訓が得られました。

‌‌プレトレーニングの重要性:‌‌ 現在の地殻変動は、LLMと、それに伴うニューラルネットワークの‌‌表現能力の探求‌‌が中心です。現在のコンピューターを使用するエージェントが機能するのは、‌‌大規模言語モデル（LLM）の上‌‌で動作しているためです。このLLMの基盤は、プレトレーニングとすべてのLLM関連の作業によって獲得されています。
‌‌「Crappy Evolution」としてのプレトレーニング:‌‌ カルパシー氏は、プレトレーニングを「‌‌crappy evolution（粗悪な進化）‌‌」と表現しています。これは、技術的に可能な方法で、進化が達成した組み込みの知識と知能のようなものを実現する手段であると考えています。

AIとエージェントに関するより広い文脈

カルパシー氏は、エージェント開発のボトルネックとして、‌‌継続的な学習（continual learning）‌‌や‌‌マルチモダリティ（multimodality）‌‌、そして単に「動作させること（make it work）」の難しさを挙げています。彼は、AIの進歩は、アルゴリズム、データ、ハードウェアなど、‌‌すべてが同時に改善‌‌する必要があるという長年の傾向に従って進むと予想しており、特定の要素が極端に優位になることはないと考えています。

また、彼は現在のAIを、人間を模倣し、インターネット上のデータから訓練された「‌‌動物ではなく召喚された幽霊（ghosts）‌‌」と表現しています。彼らは完全にデジタルであり、進化というプロセスを経ていないため、動物とは異なる知性を持っています。彼は、エージェントを真に機能させるためには、知識から切り離され、アルゴリズムと問題解決の戦略のみを含む「‌‌認知的コア（cognitive core）‌‌」を維持することが重要であると考えています。

歴史的視点から、彼はAIの進歩を「コンピューティングの拡張」として捉えており、GDPの成長率も長期間変わっていないことから、AIによる「‌‌知性の爆発‌‌」も、すでに何十年も続いている‌‌緩やかな自動化‌‌の連続であると見ています。この歴史的傾向と、エージェント実現の技術的な課題の深さが、彼が「エージェントの10年」という、より長期的なタイムラインを予測する理由となっています。

AI エージェントには 1年ではなく10年かかる

アンドレジ・カルパシー氏の「エージェントの10年（ではなく1年）」という見解は、‌‌AIエージェントの実現に必要なタイムラインに関して、業界内で見られる過度な予測に対する直接的な反応‌‌として示されています。

カルパシー氏は、一部の研究所がLLMの進化に関連して「エージェントの年」になることを示唆していたのに対し、自身は‌‌「エージェントの10年」‌‌として、より現実的な予測を提示しています。彼は、このタイムラインは自身の分野での経験に基づく「‌‌直感‌‌」から来ていると述べています。

以下に、カルパシー氏が「エージェントの10年」が必要だと考える主な理由と、その背景にある見解を説明します。

1. 克服すべきボトルネックの多さ

カルパシー氏は、現在存在する初期のエージェント（ClaudeやCodexなど）が非常に印象的であり、自身も日常的に使用していると認めつつも、‌‌「やるべきことが非常に多く残っている」‌‌と感じています。

彼がエージェントの実現を妨げる‌‌「ボトルネック」‌‌として挙げているのは、以下の技術的および認知的欠陥です。

‌‌知性の欠如：‌‌ エージェントは「十分な知性を持っていない」。
‌‌マルチモダリティの不足：‌‌ エージェントは「マルチモーダル性が十分ではない」。
‌‌コンピューター使用能力の不足：‌‌ コンピューターを使用したり、その他の多くのことを実行したりできない。
‌‌継続的学習の欠如：‌‌ 「継続的学習（continual learning）」の機能がない。何かを伝えても、それを覚えておくことができない。
‌‌認知的欠陥：‌‌ 単純に「認知的に欠陥がある」（cognitively lacking）。

エージェントに期待されるのは、人間が雇う「‌‌従業員やインターン‌‌」のように機能することですが、現在のエージェントがその仕事を任せられない理由は、‌‌「単に機能しないから（they just don't work）」‌‌です。カルパシー氏は、これらの問題すべてを解決するには約10年かかるだろうと考えています。

2. 過去のブレイクスルーと経験に基づく長期的な視点

この「10年」というタイムラインは、カルパシー氏がAI分野で過ごした約15年間の経験に基づいた‌‌「推論と直感」‌‌の結果です。彼は、問題は「克服可能で、対処できる」が、‌‌「依然として難しい」‌‌という感覚を持っています。

彼の経験には、AI分野全体が一変するような「‌‌地殻変動（seismic shifts）‌‌」が含まれており、彼は過去に2つか3つの劇的な変化を経験しています。この歴史的な視点は、現在のエージェント開発の難しさに対する彼の評価に影響を与えています。

特に、過去に彼自身がOpenAIで行ったウェブページを操作するエージェント（Universeプロジェクト）や、Atariゲームでのディープ強化学習（Deep RL）の試みは、エージェントへの‌‌「早すぎる試み」‌‌であり、「ミスステップ」であったと振り返っています。これらの初期の試みが失敗したのは、ニューラルネットワークに‌‌「表現能力（power of representation）」‌‌が不足していたためです。

現在、コンピューターを使用するエージェントが機能し始めたのは、‌‌LLMの上で動作している‌‌ため、つまり、プレトレーニングによって表現能力を獲得した結果であると認識しています。しかし、過去の経験から、完全なエージェントの実現には、さらに多くの根本的な課題が残っていることを理解しています。

3. 高い信頼性が要求される「ナインの行進（March of Nines）」

カルパシー氏は、エージェントが実際のデジタル世界で機能する知識労働（knowledge work）を行うには、‌‌自動運転と同様に、失敗のコストが非常に高い‌‌という点から、長期的なタイムラインが必要だと考えます。

‌‌失敗のコスト：‌‌ ソフトウェアエンジニアリングにおいて、深刻なコーディングミスはセキュリティの脆弱性につながり、数百万人の個人情報漏洩などの壊滅的な結果を招く可能性があります。これは、自律走行車が人身傷害のリスクを伴うのと同様に、エージェントにも極めて高い安全基準が求められることを意味します。
‌‌デモと製品のギャップ：‌‌ 彼はデモには「極めて感銘を受けない」と述べています。デモは非常に簡単に実現できますが、実用的な製品にするには、現実との接触によって生じるあらゆる問題に対処する必要があります。
‌‌ナインの行進：‌‌ この進歩は、‌‌「ナインの行進（march of nines）」‌‌に従って進行します。これは、信頼性を90%から99%、99.9%へと向上させる際、‌‌信頼性の「ナイン」を一つ追加するごとに、同じ量の作業が必要‌‌になるという概念です。この高い信頼性要件を満たすためには、時間をかけた反復的な作業が不可欠であるため、「エージェントの10年」が必要になるという見解を補強しています。

まとめ

カルパシー氏は、現在のAIをインターネット上のデータから訓練された‌‌「動物ではなく、召喚された幽霊（ghosts）」‌‌のような存在と表現しており、その知性は人間の模倣に基づいていますが、根本的な認知的基盤が異なります。このデジタル的な存在を、人間の従業員のように機能させるには、継続的な学習能力やマルチモダリティなどの重大な欠陥を解消するために、過去のAIの歴史で経験してきたような長期的なブレイクスルーが必要であると見ています。このため、彼は短期的な「エージェントの年」という見方を退け、「エージェントの10年」という慎重かつ現実的な予測を提示しているのです。

AI 開発のパラダイム

アンドレジ・カルパシー氏のAIとエージェントに関する見解というより大きな文脈において、ソースは、AI開発のパラダイム（枠組み）が、‌‌過去の誤りからの教訓と、現在のLLMを中心としたアプローチ、そして将来的な研究の方向性‌‌によってどのように形成されているかを詳細に説明しています。

カルパシー氏の基本的なパラダイムは、‌‌動物を構築するのではなく、幽霊（ghosts）を召喚している‌‌という認識に基づいています。これは、AIが進化（evolution）というプロセスではなく、インターネット上のデータからの‌‌人間の模倣（imitation）‌‌と学習（トレーニング）によって生成される完全にデジタルな存在であるという視点を表しています。

以下に、AI開発パラダイムに関する主要な要素を詳述します。

1. 進化 vs. 粗悪な進化 (Crappy Evolution)

従来の生物の知能が「進化」という長期的な最適化プロセスを通じて実現されたのに対し、現在のAI開発は異なるプロセスを採用しています。

‌‌動物 vs. 幽霊：‌‌ 動物は進化しており、生まれながらにして組み込まれた膨大な量のハードウェア（知識）を持って生まれます（例：シマウマは生まれて数分で走り出す）。これに対し、我々が構築しているのは、‌‌完全にデジタルで、人間の模倣によって生まれる「幽霊」‌‌のような実体です。
‌‌プレトレーニング＝粗悪な進化：‌‌ カルパシー氏は、現在の開発におけるプレトレーニング（事前学習）を「‌‌粗悪な進化（crappy evolution）‌‌」と呼んでいます。これは、我々が利用可能な技術（現在のコンピューティング技術）で、進化が達成したような‌‌組み込みの知識や知能‌‌をある程度実現するための、‌‌実用的に可能なバージョン‌‌であると位置づけられています。

2. 表現能力（Representation Power）の重視

AI開発の歴史における「地殻変動」は、ニューラルネットワークが‌‌表現能力‌‌を獲得するプロセスとして捉えられています。

‌‌過去の失敗からの教訓：‌‌ 以前、エージェントを追求しようとした試み（AtariでのDeep RLやOpenAIでのUniverseプロジェクトなど）は、‌‌時期尚早‌‌であり「ミスステップ」であったと見なされています。主な理由は、当時のニューラルネットワークに‌‌表現能力が欠如していた‌‌ためです。
‌‌LLMによる表現の獲得：‌‌ 現在のエージェントが機能し始めているのは、‌‌大規模言語モデル（LLM）の上‌‌で動作しているからです。このLLMの基盤は、プレトレーニングとすべてのLLM関連の作業によって、必要な表現能力を獲得しています。

3. 知識の除去と認知的コア（Cognitive Core）の分離

現在のパラダイムの次の段階として、カルパシー氏は、知能の「認知的コア」を知識から分離する必要があると提唱しています。

‌‌プレトレーニングの二面性：‌‌ プレトレーニングは、ネットワークにインターネット上のすべての‌‌知識‌‌を取り込ませる（知識）とともに、アルゴリズム的パターンを観察することで、‌‌知性‌‌（インコンテキスト学習などの能力）を起動させる（知性）という、2つの側面を持っています。
‌‌知識の依存性による制約：‌‌ カルパシー氏は、この知識（記憶）が、ニューラルネットワークがデータ多様体（データマニホールド）から外れた行動をとるのを‌‌妨げている可能性がある‌‌と考えています。LLMは‌‌記憶力に優れすぎている‌‌ことが、汎化可能なコンポーネントのみを学習する必要がある状況で、かえって彼らの「注意を散漫にしている」可能性があります。
‌‌理想的な認知的コア：‌‌ 将来のエージェントは、‌‌知識から切り離され‌‌、知性や問題解決の‌‌アルゴリズムや戦略のみ‌‌を含む‌‌「認知的コア」‌‌を維持すべきだとされています。これにより、エージェントは必要な情報を「検索」し、アルゴリズム（思考、実験のアイデアなど）のみを維持するようになります。

4. 継続的学習と反復（Gradien Descent）の再評価

人間の学習や知能がどのように機能しているかを理解し、それをAIパラダイムに取り込むことが重要視されています。

‌‌RLの限界（ストローによる教師の吸引）：‌‌ 現在の強化学習（RL）は「‌‌恐ろしい（terrible）‌‌」ものであり、「‌‌ストローを通じて教師信号を吸い上げている‌‌」ような状態であると批判されています。これは、長いタスクの終わりに得られる単一の報酬信号に基づいて、全過程のすべての行動を等しくアップウェイト（重み付けを増やす）しようとするため、ノイズが多く、非常に非効率的であるためです。
‌‌人間による内省（Review）：‌‌ 人間は、解決策を見つけたときに‌‌内省やレビュー‌‌という複雑なプロセスを経ますが、現在のLLMにはこれに相当するものがありません。カルパシー氏は、Googleの論文など、モデルに「‌‌内省とレビュー‌‌」のアイデアを試行させる研究に期待しています。
‌‌インコンテキスト学習における勾配降下法：‌‌ プレトレーニングによって開発される「‌‌インコンテキスト学習‌‌」の能力は、まるで魔法のように見えますが、実はニューラルネットワークの内部で‌‌小さな勾配降下法（gradient descent loop）‌‌を実行している可能性があるという研究も紹介されており、従来の学習パラダイムとの連続性が示唆されています。

5. 開発における実用主義（Practical Mindedness）

カルパシー氏のパラダイムは、哲学的探求よりも‌‌実用性‌‌を重視しています。彼は、「動物を構築する」という視点からアプローチするのではなく、‌‌「有用なものを作る」‌‌という視点からアプローチしていると述べています。

‌‌「動くようにする（Make It Work）」の困難さ：‌‌ 多くの課題（マルチモダリティ、継続的学習の欠如、知性の不足など）を抱えるエージェントを、実際に「機能するようにする」こと自体が、約10年を要する困難な作業であるという現実的な認識が、「エージェントの10年」という予測の根拠となっています。
‌‌すべてを同時に改善する：‌‌ AIの進歩は、アルゴリズム、データ、ハードウェア、ソフトウェアなど、‌‌すべての要素が同時に改善‌‌し続けるという長年の傾向に従って進むと予想されています。特定の要素（例えば、アルゴリズムだけ）が極端に優位になることはなく、この‌‌包括的な進歩‌‌を必要とする性質が、長期的なタイムラインを裏付けています。

カルパシー氏のパラダイムは、AIの進歩を「‌‌コンピューティングの拡張‌‌」の継続的な流れとして捉えており、突然の「知性の大爆発」ではなく、何十年も続く‌‌漸進的な自動化の延長‌‌として位置づけています。

ソフト開発における AI の利用

アンドレジ・カルパシー氏のAIとエージェントに関する見解というより大きな文脈において、ソースは、‌‌AIがソフトウェアエンジニアリング（SE）の分野でどのように機能しているか、または機能していないか‌‌、そしてAIがSEの生産性やパラダイムをどのように変えつつニアリング（SE）の分野でどのように機能しているか、または機能していないか‌**‌、そしてAIがSEの生産性やパラダイムをどのように変えつつあるかについて深く掘り下げています。

カルパシー氏は、プログラミングは‌‌「AIエージェントにとって完璧な最初の標的」‌‌であると考えていますが、現在のAIがまだ真に複雑なソフトウェア開発タスクを自律的にこなすには至っていないという現実的な評価を下しています。

1. ソフトウェアエンジニアリングはAIにとって「完璧な最初の標的」である

コーディングがLLMやAIエージェントにとって特に適している理由がいくつか挙げられています。

‌‌テキスト中心性:‌‌ コーディングは基本的に‌‌テキスト‌‌を中心に展開しています。LLMはインターネット上のテキストで訓練されており、‌‌完璧なテキストプロセッサ‌‌であるため、コードはLLMにとって完璧に適合します。
‌‌既存のインフラストラクチャ:‌‌ コードとテキストを扱うためのインフラストラクチャ（Visual Studio CodeなどのIDEや、コードベースの‌‌差分（diffs）‌‌を表示するためのツールなど）がすでに整備されています。
‌‌知識労働としての側面:‌‌ カルパシー氏は、AIの真の目標は、‌‌知識労働（knowledge work）‌‌を行うことであり、デジタル世界と実際に相互作用できるエージェントを実現することだと考えていました。

2. 現在のAIツールとSEの生産性向上

カルパシー氏は、AIによる進歩を「コンピューティングの拡張」の連続として捉えており、現在のLLMはプログラマーの生産性を向上させる歴史的なツールの一環であると見ています。

‌‌オートコンプリート（補完機能）の利用:‌‌ カルパシー氏にとって、現在のスイートスポット（最も効率的な利用法）は、‌‌オートコンプリート‌‌機能としてAIモデルを使用することです。彼は、コードを書くときに最初の数文字を入力すれば、モデルがそれを補完し、タブで確定できるという方法が、‌‌非常に高い情報帯域幅‌‌で意図を伝える手段だと述べています。
‌‌定型コードと新しい言語へのアクセス:‌‌ エージェントは、‌‌定型的なコード（boilerplate code）‌‌や、インターネット上に多くの例があるコード、あるいは彼が不慣れなRustのような言語で役立つとしています。
‌‌抽象化レベルの引き上げ:‌‌ コンパイラがアセンブリコードを抽象化したように、AIは人間がより抽象度の高い層で作業できるように、低レベルの作業を自動化する‌‌「自律性スライダー（autonomy slider）」‌‌の継続的な進展の一部であると見ています。

3. AIエージェントの限界と「スロップ（Slop）」

カルパシー氏は、現在のAIエージェント（GPT-4、Claudeなど）が特定の状況では非常に優れていることを認めつつも、‌‌自律的なソフトウェアエンジニアリング‌‌を行うにはほど遠いと評価しています。彼は、業界がAIの能力を‌‌過度に予測‌‌しており、「‌‌スロップ（Slop、粗悪でずさんなもの）‌‌」を素晴らしいものだと偽ろうとしていると感じています。

彼は、自身が「nanoGPT」のリポジトリを構築した際に、エージェント（完全な自律的なコーディングモデル）がほとんど役に立たなかった経験を語っています。

‌‌独自性の理解の欠如:‌‌ 彼が設計したnanoGPTリポジトリは「‌‌知的負荷の高いコード‌‌」を含み、インターネット上によくある定型的な構造ではありませんでした。モデルは、PyTorchのDDPコンテナを使用しないカスタムの勾配同期ルーチンなど、‌‌彼が採用しなかった一般的なやり方‌‌を常に提案しようとしました。モデルは彼の‌‌カスタム実装を内面化できなかった‌‌のです。
‌‌認知的欠陥（Cognitive Deficits）:‌‌ モデルは、‌‌コードを誤解‌‌し続け、一般的にインターネット上で見られるやり方からくる‌‌「あまりにも多くの記憶」‌‌を持っていました。
‌‌コードベースの肥大化と混乱:‌‌ モデルは、コードベースを‌‌肥大化‌‌させ、不必要なtry-catch文を多用し、非推奨のAPIを使用するなど、「‌‌プロダクションコードベース‌‌」を作ろうとして、コードベースを混乱させていました。
‌‌新規コードの困難さ:‌‌ AIモデルは、‌‌「これまで書かれたことのないコード」‌‌を生成するのが得意ではない、とカルパシー氏は指摘しています。

4. ソフトウェアエンジニアリングにおける失敗コストの高さ

カルパシー氏は、エージェントがソフトウェアエンジニアリングを自律的に行うためのタイムラインが長くなる理由として、「‌‌ナインの行進（march of nines）‌‌」が必要なほどの、‌‌失敗コストの高さ‌‌を挙げています。

‌‌自動運転との類似性:‌‌ 彼は、ソフトウェアエンジニアリングにおける安全性要件は、自動運転と同様に厳しいと考えています。‌‌セキュリティの脆弱性‌‌につながる深刻なコーディングミスは、数百万人の個人情報漏洩など‌‌壊滅的な結果‌‌を招く可能性があるため、非常に慎重な基準が求められます。
‌‌信頼性への要求:‌‌ エージェントが実世界の仕事（従業員やインターンの代わり）をするには、「‌‌単に機能しないから‌‌」という認知的な欠陥が解消される必要があります。この「機能させる」ための進歩は、信頼性を示す「ナイン」（90%から99%、99.9%など）を一つ追加するごとに、‌‌一定量の作業が必要‌‌となる「ナインの行進」に従って進むと予想されています。

これらの課題と、ソフトウェアエンジニアリングにおける‌‌極めて高い信頼性の要求‌‌があるため、カルパシー氏は、AIエージェントが完全に機能するようになるには「‌‌エージェントの10年‌‌」という長期的なタイムラインが必要だと予測しています。

AI エージェント開発の障壁：記憶と学習メカニズムが

アンドレジ・カルパシー氏のAIとエージェントに関する見解というより大きな文脈において、ソースは、‌‌記憶（Memory）と学習メカニズム（Learning Mechanisms）‌‌が、現在のLLMの成功の基礎でありながら、AIエージェントの実現を妨げている‌‌主要なボトルネック‌‌であると説明しています。

カルパシー氏が提唱するAI開発のパラダイムは、「動物の進化」とは異なる「幽霊の召喚」であるという認識に基づいており、この違いが、AIの記憶と学習のアプローチに大きな影響を与えています。

1. 記憶（Memory）の二面性と「知識の除去」

LLMは、そのトレーニング方法の結果として、強力な記憶力を持っていますが、カルパシー氏は、この記憶力が、かえってエージェントの柔軟な学習能力を妨げている可能性があると考えています。

知識の過剰な記憶（Pre-training Memory）

‌‌圧縮とあいまいな記憶:‌‌ プレトレーニング（事前学習）中に、モデルは15兆トークンものインターネット上の情報を、わずか数十億のパラメータを持つネットワークに圧縮します。この圧縮により、ウェイトに格納されている知識は、インターネット文書の「‌‌ぼんやりとした記憶（hazy recollection）‌‌」のようなものになります。
‌‌エージェントの制約:‌‌ LLMは、プレトレーニング文書の「あまりにも多くの記憶」を持っているため、ナノチャット（nanoGPT）のような独自のコードベースを扱う際に、作成者のカスタム実装を内面化できず、一般的なやり方（DDPコンテナの使用など）を提案し続けてしまいます。
‌‌データ多様体からの逸脱の妨げ:‌‌ カルパシー氏は、モデルが‌‌知識に頼りすぎる‌‌ことによって、エージェントがインターネット上に存在するデータ多様体（data manifold）から外れた行動をとるのを妨げている可能性があると推測しています。

ワーキングメモリとしてのコンテキストウィンドウ

‌‌KVキャッシュの役割:‌‌ 逆に、テスト時にコンテキストウィンドウ内で発生する情報は、KVキャッシュとして構築され、ニューラルネットワークに‌‌非常に直接的にアクセス可能‌‌な状態になります。
‌‌人間のワーキングメモリとの類似性:‌‌ カルパシー氏は、このコンテキストウィンドウ内の情報を、人間における「‌‌ワーキングメモリ（working memory）‌‌」と比較しています。コンテキストウィンドウにロードされた情報は、ウェイト内の知識よりも、はるかに明確にアクセスされるため、モデルのパフォーマンスが向上します。
‌‌情報の保持量:‌‌ コンテキスト内のトークンごとに同化される情報量（KVキャッシュ）は、プレトレーニング中にウェイトに同化される情報量（0.7ビット/トークン）よりも‌‌3500万倍‌‌も大きくなるという指摘があり、ワーキングメモリの重要性が強調されています。

認知コア（Cognitive Core）の分離

カルパシー氏が目指す将来のAI開発パラダイムの一つは、「‌‌知識の一部を除去‌‌」し、‌‌「認知的コア」‌‌を保持することです。
この認知的コアは、‌‌知識から切り離され‌‌、‌‌アルゴリズムや問題解決の戦略‌‌のみを含んでいるべきだとされています。これにより、モデルは知識を維持する代わりに、必要に応じて情報を‌‌「検索」‌‌するようになります。彼は、この認知コアを数十億パラメータ（10億パラメータ程度）にしたいと考えており、その方が人間のように振る舞う、より生産的なモデルになる可能性があると予測しています。

2. 学習メカニズムの課題と継続的学習

現在主流の学習パラダイム、特に強化学習（RL）は効率が悪く、エージェントが「‌‌継続的学習（continual learning）‌‌」の能力を持つためのボトルネックとなっています。

強化学習（RL）の非効率性

‌‌「ストローによる教師信号の吸引」:‌‌ カルパシー氏は、現在のRLを「‌‌ひどい（terrible）‌‌」ものであり、「‌‌ストローを通じて教師信号を吸い上げている‌‌」ようだと強く批判しています。
‌‌ノイズの多い更新:‌‌ RLでは、たとえ長い行動の試行（trajectory）の最後に正しい答えが得られたとしても、その過程の‌‌すべての行動‌‌が等しくアップウェイト（重み付け）されてしまいます。これは、間違った経路を進んだ後にたまたま正しい解決策にたどり着いた場合でも、そのすべての誤った行動が「もっとやるべきこと」として強化されてしまうため、‌‌ノイズが非常に多い‌‌学習方法であると指摘されています。
‌‌人間の学習との比較:‌‌ 人間は、解決策を見つけた後、‌‌レビューや内省‌‌という複雑なプロセスを経ますが、現在のLLMにはこれに相当するものがありません。

インコンテキスト学習と勾配降下法

インコンテキスト学習は、LLMがプレトレーニングで‌‌メタ学習‌‌した結果として自然発生的に現れたものですが、これがどのように機能しているかについては議論があります。
カルパシー氏は、インコンテキスト学習が‌‌「魔法」‌‌のように見えるものの、実際にはニューラルネットワークの層の内部で‌‌小さな勾配降下ループ‌‌を実行している可能性があるという研究が存在することを指摘しています。これは、Attentionやネットワークの内部構造を通じて、線形回帰などの適応的学習が‌‌内部的に‌‌行われていることを示唆しています。

継続的学習（Continual Learning）の欠如

エージェントが「‌‌機能しない‌‌」主要な理由の一つは、「‌‌継続的学習がない‌‌」ことです。何かを伝えても、エージェントはそれを覚えておくことができません。
‌‌蒸留の欠如:‌‌ 人間が睡眠中に、日中の経験を処理し、脳のウェイトに‌‌蒸留（distillation）‌‌するプロセスを持っているのと異なり、LLMにはこの「蒸留フェーズ」に相当するものがありません。
‌‌アーキテクチャの収束:‌‌ カルパシー氏は、AIが今後10年で進歩するにつれて、進化がもたらした認知的トリック（例：人間が持つ洗練された‌‌スパースアテンション‌‌スキーム）と同様の、より洗練された認知アーキテクチャに収束する可能性があると予想しています。

3. モデルの過学習と崩壊（Collapse）

モデルがその学習データに対して過度に適合し、多様性（エントロピー）を失う「モデルの崩壊（collapse）」も、学習パラダイムの重要な課題です。

‌‌静かな崩壊（Silently Collapsed）:‌‌ モデルは、生成するサンプルが‌‌「静かに崩壊している」‌‌ため、多様性に富んだ出力（例：ジョークの全範囲）を提供できません。
‌‌合成データ生成の難しさ:‌‌ この崩壊が問題となるのは、モデルが内省やレビューのために「‌‌合成データ生成‌‌」を試みる際です。モデルからサンプリングされた合成データで再訓練を続けると、分布がさらに崩壊し、モデルは悪化します。
‌‌人間の記憶との類似性:‌‌ カルパシー氏は、人間も生涯を通じて「崩壊」していく（子供が過適合していないのに対し、大人は同じ考えを繰り返し、学習率が下がる）という点で、この現象に驚くほど良いアナロジーがあると感じています。
‌‌メモリーの多さ:‌‌ LLMは、人間が持っていない‌‌優れた記憶力‌‌を持っており、これが汎化可能なコンポーネントのみを学習する必要がある際に、‌‌「注意を散漫にしている」‌‌可能性があります。

情報源

動画(2:26:07)

Andrej Karpathy — “We’re summoning ghosts, not building animals”

https://www.youtube.com/watch?v=lXUZvyajciY

169,069 veiws 2025/10/18 Dwarkesh Podcast

The Andrej Karpathy episode. During this interview, Andrej explains why reinforcement learning is terrible (but everything else is much worse), why AGI will just blend into the previous ~2.5 centuries of 2% GDP growth, why self driving took so long to crack, and what he sees as the future of education. It was a pleasure chatting with him.

(2025-10-18)

前置き​

要旨​

目次​

経歴と業績、専門家による評価​

1. 経歴と職歴​

2. 主要な業績と技術的貢献​

A. 学術・技術的ブレイクスルー​

B. 教育者としての貢献​

3. 専門家間での評価​

A. 「偉大な翻訳者」としての評価​

B. ビルダーとしての視点​

C. AI業界での地位​

彼の主張や意見に対する、専門家の間での批判​

1. 「エージェントの10年」に関する異論（業界の過剰な予測）​

2. Software 2.0/自動化に関する異論（知性の大爆発 vs. 漸進的な進歩）​

3. 強化学習（RL）の有効性に関する異論（RLの必要性 vs. 効率性）​

4. Software 2.0/LLMの限界に関する異論（知識の分離 vs. 統合の必要性）​

5. 教育活動に関する異論（学習の動機付け vs. 技術的な容易さ）​

彼の主張や立場の対局に立つ著名な AI 専門家​

1. リチャード・サットン (Richard Sutton)​

関連する見解の対立点​

2. ジェフリー・ヒントン (Geoffrey Hinton)​

関連する見解の対立点​

3. イリヤ・サツケバー (Ilya Sutskever)​

関連する見解の対立点​

4. ヤン・ルカン (Yann LeCun)​

関連する見解の対立点​

アンドレイ・カルパシー氏の洞察：AIエージェント、強化学習、そして知性の未来​

要旨​

最重要ポイント：​

AIエージェントの10年​

「エージェントの年」への懐疑的見解​

主なボトルネック​

10年というタイムラインの根拠​

AI開発の歴史的転換点​

「動物ではなく、幽霊を召喚している」​

AIと生物の根本的な違い​

事前学習は「粗悪な進化」​

知識を剥ぎ取った「認知的コア」の追求​

強化学習（RL）への批判的見解​

プロセスベースの教師あり学習の課題​

コーディングにおけるAIの現状と限界​

コーディング支援ツールの有効性​

AIエージェントが苦手とすること​

AIによるAI研究の自動化への示唆​

知能爆発とAGIの未来像​

漸進的な自動化の継続​

GDP急増は起こらない​

自動運転からの教訓：「デモから製品へのギャップ」​

最大のリスク：段階的な制御と理解の喪失​

教育を通じた人類のエンパワーメント：Eurekaプロジェクト​

プロジェクトの動機と恐怖​

「知識へのスロープ」を構築する​

AGI後の教育の役割​

引用・キーフレーズ​

アンドレイ・カルパシーが語る強化学習：なぜ「ひどい」のに画期的なのか？​

導入：AI界の奇妙な真実​

1. 強化学習以前の世界：模倣学習（Imitation Learning）​

2. 新たな手法、強化学習（RL）とその「ひどさ」​

3. 「ストロー」の問題を乗り越えようとする試み​

4. まとめ：なぜ「ひどい」強化学習が重要なのか​

AIの歴史における地殻変動​

1. 第1の地殻変動：ディープラーニング（タスクごとのニューラルネットワーク）​

2. 第2の地殻変動：初期エージェントの試み（ディープ強化学習とミスステップ）​

3. 第3の地殻変動：LLMと表現能力の獲得（現在のエージェントの基盤）​

AIとエージェントに関するより広い文脈​

AI エージェントには 1年ではなく10年かかる​

1. 克服すべきボトルネックの多さ​

2. 過去のブレイクスルーと経験に基づく長期的な視点​

3. 高い信頼性が要求される「ナインの行進（March of Nines）」​

まとめ​

AI 開発のパラダイム​

1. 進化 vs. 粗悪な進化 (Crappy Evolution)​

2. 表現能力（Representation Power）の重視​

3. 知識の除去と認知的コア（Cognitive Core）の分離​

4. 継続的学習と反復（Gradien Descent）の再評価​

5. 開発における実用主義（Practical Mindedness）​

ソフト開発における AI の利用​

1. ソフトウェアエンジニアリングはAIにとって「完璧な最初の標的」である​

2. 現在のAIツールとSEの生産性向上​

前置き

要旨

目次

経歴と業績、専門家による評価

1. 経歴と職歴

2. 主要な業績と技術的貢献

A. 学術・技術的ブレイクスルー

B. 教育者としての貢献

3. 専門家間での評価

A. 「偉大な翻訳者」としての評価

B. ビルダーとしての視点

C. AI業界での地位

彼の主張や意見に対する、専門家の間での批判

1. 「エージェントの10年」に関する異論（業界の過剰な予測）

2. Software 2.0/自動化に関する異論（知性の大爆発 vs. 漸進的な進歩）

3. 強化学習（RL）の有効性に関する異論（RLの必要性 vs. 効率性）

4. Software 2.0/LLMの限界に関する異論（知識の分離 vs. 統合の必要性）

5. 教育活動に関する異論（学習の動機付け vs. 技術的な容易さ）

彼の主張や立場の対局に立つ著名な AI 専門家

1. リチャード・サットン (Richard Sutton)

関連する見解の対立点

2. ジェフリー・ヒントン (Geoffrey Hinton)

関連する見解の対立点

3. イリヤ・サツケバー (Ilya Sutskever)

関連する見解の対立点

4. ヤン・ルカン (Yann LeCun)

関連する見解の対立点

アンドレイ・カルパシー氏の洞察：AIエージェント、強化学習、そして知性の未来

要旨

最重要ポイント：

AIエージェントの10年

「エージェントの年」への懐疑的見解

主なボトルネック

10年というタイムラインの根拠

AI開発の歴史的転換点

「動物ではなく、幽霊を召喚している」

AIと生物の根本的な違い

事前学習は「粗悪な進化」

知識を剥ぎ取った「認知的コア」の追求

強化学習（RL）への批判的見解

プロセスベースの教師あり学習の課題

コーディングにおけるAIの現状と限界

コーディング支援ツールの有効性

AIエージェントが苦手とすること

AIによるAI研究の自動化への示唆

知能爆発とAGIの未来像

漸進的な自動化の継続

GDP急増は起こらない

自動運転からの教訓：「デモから製品へのギャップ」

最大のリスク：段階的な制御と理解の喪失

教育を通じた人類のエンパワーメント：Eurekaプロジェクト

プロジェクトの動機と恐怖

「知識へのスロープ」を構築する

AGI後の教育の役割

引用・キーフレーズ

アンドレイ・カルパシーが語る強化学習：なぜ「ひどい」のに画期的なのか？

導入：AI界の奇妙な真実

1. 強化学習以前の世界：模倣学習（Imitation Learning）

2. 新たな手法、強化学習（RL）とその「ひどさ」

3. 「ストロー」の問題を乗り越えようとする試み

4. まとめ：なぜ「ひどい」強化学習が重要なのか

AIの歴史における地殻変動

1. 第1の地殻変動：ディープラーニング（タスクごとのニューラルネットワーク）

2. 第2の地殻変動：初期エージェントの試み（ディープ強化学習とミスステップ）

3. 第3の地殻変動：LLMと表現能力の獲得（現在のエージェントの基盤）

AIとエージェントに関するより広い文脈

AI エージェントには 1年ではなく10年かかる

1. 克服すべきボトルネックの多さ

2. 過去のブレイクスルーと経験に基づく長期的な視点

3. 高い信頼性が要求される「ナインの行進（March of Nines）」

まとめ

AI 開発のパラダイム

1. 進化 vs. 粗悪な進化 (Crappy Evolution)

2. 表現能力（Representation Power）の重視

3. 知識の除去と認知的コア（Cognitive Core）の分離

4. 継続的学習と反復（Gradien Descent）の再評価

5. 開発における実用主義（Practical Mindedness）

ソフト開発における AI の利用

1. ソフトウェアエンジニアリングはAIにとって「完璧な最初の標的」である

2. 現在のAIツールとSEの生産性向上