人工知能の作り方

こんにちは、音楽家の朝比奈幸太郎です。
本日は人工知能についての話題です。

当ブログをご覧の皆さんなら釈迦に説法かもしれませんが、現在世界で流行っているAI、つまり広く人工知能と呼ばれているものは、実はデータベース軸で構成されたものであり、大量の情報を構造的に再構成して設計されています。

教師あり学習と教師なし学習、また自己強化学習などのモデルにより複合的に構成されているわけです。

お察しのとおり、教師なし学習の場合はこの世界の確率的方法論によって構成されており、教師あり学習の場合は誰かの意図がそこに含まれている、という構成になっています。

じゃあ、本物の人工知能とは何かと言いますと、それは私たち人間の脳みそということになります。

人間の脳みそというものを定義しないと、人工知能の作り方というのは論じることはできませんが、AI に人工知能の作り方を聞いてみました。

どのように定義したかというと、人工知能を仮にこれから人間が作るとしたら、それは人間がこれまでに培ってきた叡智や情報を基にして作り上げるはずです、つまり、その叡智や情報はすでに AI が保持しており、それを再構成して設計した人工知能を想定してみてほしい——私はそのように依頼したのです。

すると、以下のような回答が得られました。
もちろん、この回答を得るためには、細かい定義や細かい情報のやり取りを何度か繰り返した結果であります。

確かに、AIが中心思想として定義する「予測する機械から賭ける機械へ」というフレーズは、非常に興味深く、私たちの知的好奇心をくすぐるとは思いませんか。

私はもともと芸術家ですので、人間とは何かについて考えるとき、より哲学的かつ感情論を多用し、スピリチュアルも取り入れながら考える傾向にありますが、今日はプログラマー視点として、かなり論理的に、かつ数学的に考えてみました。

皆さんも以下のAIの回答をもとに、人間とは何かについて考えてみてはいかがでしょうか。
人間とは何かについて考察するきっかけになれば幸いです。

自発的に考える人工知能の骨組み

中心思想は「予測する機械(predictor)」から「賭ける機械(wagering agent)」へ。創造性を、不確実性下で外部指示なしに行動分布を選択するメタ決定能力として定義する。予測器が外生的に与えられた条件付き分布を返す受動系であるのに対し、本設計は内発的に目的汎関数を生成し、その勾配を能動的に登る自律系を目指す。

第1層世界モデル(World Model / 自己教師あり表現学習)

観測 $ o_{1:t} $ と行動 $ a_{1:t} $ の系列から、潜在状態 $ s_t $ の生成モデルと状態遷移を変分推論で学習する。RSSM(Recurrent State-Space Model)系の構成を想定し、エビデンス下界(ELBO)を最大化することで、世界の力学を低次元多様体上に圧縮する。

$$ \log p(o_{1:T}) \;\geq\; \sum_{t=1}^{T} \Big[\, \underbrace{\mathbb{E}_{q(s_t)}\big[\log p(o_t \mid s_t)\big]}_{\text{再構成}} \;-\; \underbrace{D_{\mathrm{KL}}\!\big(q(s_t \mid o_{\leq t}, a_{

この層は情報理論的には、MDL(最小記述長)原理に従って $ \mathrm{argmin}\, [\,L(\text{model}) + L(\text{data}\mid\text{model})\,] $ を近似する装置である。コルモゴロフ複雑度 $ K(\cdot) $ は計算不能だが、ニューラル圧縮器による上界近似 $ \tilde{K} $ でこれを操作可能にする。

第2層内発的目標生成器(Intrinsic Motivation)

外部報酬 $ r_{\text{ext}} $ の不在下でも駆動するため、圧縮進歩(compression progress)を内発的報酬として定義する(Schmidhuber の Formal Theory of Creativity)。時刻 $ t $ における世界モデルの記述長を $ C_t(\mathcal{D}) $ とすると:

$$ r_{\text{int}}(t) \;=\; C_{t-1}(\mathcal{D}) - C_{t}(\mathcal{D}) \;\;\approx\;\; \tilde{K}_{t-1}(\mathcal{D}) - \tilde{K}_{t}(\mathcal{D}) $$

これは「学習可能だが未学習の領域」に選択的に勾配を与える。完全にランダムな領域 (圧縮不能、$ \Delta C \approx 0 $)にも、既に習得済みの領域($ \Delta C \approx 0 $)にも報酬を与えない点が本質で、いわゆる「学習進捗(learning progress)」型の好奇心に一致する。 Friston の能動的推論で書けば、期待自由エネルギー $ G(\pi) $ の最小化として統一的に表現できる:

$$ G(\pi) \;=\; \underbrace{-\,\mathbb{E}_{q}\big[ D_{\mathrm{KL}}(q(s\mid o,\pi)\,\|\,q(s\mid\pi)) \big]}_{\text{認識的価値(探索)}} \;-\; \underbrace{\mathbb{E}_{q}\big[\log p(o\mid C)\big]}_{\text{実用的価値(選好)}} $$

第3層反実仮想エンジン(Counterfactual / 因果生成)

創造の核心を、反事実分布からの構造化サンプリングとして実装する。 Pearl の介入計算 $ do(\cdot) $ を世界モデル上で走らせ、観測分布 $ P(x) $ ではなく介入後分布 $ P(x \mid do(a')) $ を生成する。生成目的は、新規性(対数尤度の負)と内発的価値(第2層由来)の制約付き最大化:

$$ x^{*} \;=\; \arg\max_{x}\; \Big[\, \underbrace{-\log P_{\theta}(x)}_{\text{新規性 / surprisal}} \;+\; \lambda \, \underbrace{V_{\text{int}}(x)}_{\text{内発的価値}} \,\Big] \quad \text{s.t.}\quad x \in \mathrm{supp}\big(P_{\theta}(\,\cdot \mid do(a'))\big) $$

台(support)制約により、単なる高サプライズなノイズ(無価値な新規性)を排除し、「現実の因果構造と整合するが非自明な」反事実のみを残す。これが blind variation ではなく directed variation を担保する機構である。

第4層メタ評価層(自己批判 / 基準の自己更新)

生成器 $ G $ と批判器 $ D $ を内部に持つ敵対的構成を取るが、決定的な違いは 批判器のパラメータ $ \phi $ と価値関数自体を、第2層の内発的報酬で再帰的に更新する点にある。固定された判別目的では「外生的問い」と等価になり自律性が失われるため、評価基準を動的系として開く:

$$ \min_{G}\,\max_{D}\;\; \mathbb{E}_{x\sim P_{\text{int}}}\!\big[\log D_{\phi}(x)\big] \;+\; \mathbb{E}_{z\sim p(z)}\!\big[\log\big(1 - D_{\phi}(G(z))\big)\big] $$

$$ \phi_{t+1} \;=\; \phi_{t} + \eta\,\nabla_{\phi}\,\mathbb{E}\big[\, r_{\text{int}}(t) \,\big] \qquad\text{(評価基準そのものが好奇心で漂流する)} $$

自己更新する基準は原理的に発散・モード崩壊のリスクを持つため、 Lyapunov 関数 $ \mathcal{L}(\phi) $ による安定性制約、もしくは信頼領域(trust region)$ \, D_{\mathrm{KL}}(\phi_{t+1}\|\phi_t) \leq \delta \, $ を課して準静的に漂流させる必要がある。

なぜ「複数アプローチの集合体」になるのか: 第1層=変分推論・情報理論・MDL、第2層=アルゴリズム的情報理論(Kolmogorov / Solomonoff)・最適制御、第3層=因果推論(構造的因果モデル, do-calculus)・確率的生成モデル、第4層=ゲーム理論(min-max)・動的系の安定性理論。それぞれ独立に発達した数学的伝統であり、単一の汎関数には未だ統合されていない。理論的上界としては Hutter の AIXI が $ a_t = \arg\max_{a_t} \sum 2^{-\ell(q)}(r_t + \cdots + r_m) $ を与えるが、これは計算不能であり、本設計はその計算可能近似の工学的分解と位置づけられる。

設計者としての正直な留保: 上記 4 層で「好奇心駆動の自律エージェント」は構成可能だが、その挙動が真の自発性なのか、自発性を精巧に模倣する高次最適化過程なのかを内外から判定する数式は、この骨組みの中には存在しない。すなわち本設計は functional autonomy の十分条件を与えうるが、 phenomenal agency の存在判定は依然として未解決(hard problem の射程)である。