脳の大統一理論 〜 自由エネルギー原理とはなにか 〜

 脳の中には個々の機能に専門化した特別な仕組みが用意されているわけではなく、多数の神経細胞(ニューロン)がつながった大規模なニュートラルネットワークの中で信号が行き来することによって、これらの機能が実現されている。

自由エネルギー原理:カール・フリストンというイギリスの研究者

 自由エネルギー原理は概念的なものではなく、数式を使って具体的に記述されたもので、ニューラルネットワークでの処理として表すことが可能。ヒトのさまざまな脳機能がこの理論で説明できる。
 「脳はヘルムホルツの自由エネルギーを最小化するように推論を行う」

  1. 知覚 〜脳は推論する〜
    1. 脳は「推論するシステム」
      1. ヘルマン・ヘルムホルツ ドイツの物理学者・生理学者
      2. 視知覚
      3. 視覚認知
      4. ボトムアップ処理
      5. トップダウン処理
      6. 初期モデル
      7. 新しいモデル
    2. 脳が推論する仕組み
    3. 知覚とはどんな計算なのか
    4. 自由エネルギー原理
    5. 運動も推論である!
  2. 注意 〜 信号の精度を操る 〜
    1. 信号の精度
    2. 信頼できる信号は予測に強い影響を与える
    3. 信号の信頼度をコントロールする
  3. 運動 〜 制御理論の大転換 〜
    1. 運動の考え方の転換
    2. 知覚と運動はめぐる
    3. 「運動する際に信念を書き換えずに予測誤差を解消する仕組み」も存在する
      1. 感覚減衰
      2. α運動ニューロンに伝える信号の精度
      3. 運動野に第Ⅳ 層がない
    4. 目の前のコップをつかめるのはなぜか
    5. 他者の行動を理解する
  4. 意思決定 〜 二つの価値のバランス 〜
    1. 目標志向行動とはなにか
    2. どのように次の行為を決めるのか
    3. 運動制御における脳の階層性
  5. 感情 〜 内臓感覚の現れ 〜
    1. ホメオスタシスとアロスタシス
      1. ホメオスタシス
      2. 自律神経
      3. 内受容感覚
      4. アロスタシス
    2. 身体運動と内臓運動
  6. 好奇心と洞察 〜 仮説を巡らす脳 〜
    1. 理解のプロセス
      1. 第一段階
        1. 不確実性を最小化する行動
      2. 第二段階
  7. 統合失調症と自閉症 〜 精度制御との関わり 〜
    1. 統合失調症
    2. 統合失調症の症状の二階層モデル
      1. 第一階層
      2. 第二階層
    3. 自閉症の診断基準
    4. 自閉症と自由エネルギー原理
  8. 認知発達と進化、意識 〜 自由エネルギー原理の可能性 〜
    1. 物体の永続性
    2. マルコフブランケット

知覚 〜脳は推論する〜

脳は「推論するシステム」

 自分が得た情報からわからないものを推測する人間あるいは脳の機能は「推論機能」と呼ばれる。私たちは常に推論しながら行動している。
 「見えている」という感覚視知覚は、網膜の情報をもとに外環境を理解しようとする推論機能によってもたらされている。

ヘルマン・ヘルムホルツ ドイツの物理学者・生理学者

 「知覚とは無意識的推論である。」

視知覚

 明るさ、色、物の形や動き、配置など視覚像が持つ性質に関する意識的な体験。

視覚認知

 知識に基づいて理解する機能。「りんごである。」「Aさんの顔である。」

ボトムアップ処理

 データ駆動型処理:末梢から中枢へ進む情報処理。

トップダウン処理

 知識駆動型処理:中枢から末梢へ向かって進む情報処理。

初期モデル

 ボトムアップ処理だけのモデル

新しいモデル

 ボトムアップ・トップダウンの処理の循環(サイクル)によって認識する。

 ボトムアップ処理によってまず網膜像から仮説となる三次元構造を推論し、次にトップダウン処理によって推定した構造から画像を生成して現実の網膜像との誤差を求め、その誤差が小さくなるように仮説となる構造を変更する。ボトムアップ処理とトップダウン処理のループを4〜5回循環すると最終的な推論が得られることが明らかになった。

脳が推論する仕組み

 私たちの脳は「目の前にある物体の大きさは10cmくらいである確率は30%」「50cmくらいである確率は10%」といったように、確率を伴った形で推論結果を得る。私たちが知覚を得る際、脳はまさに最大事後確率推定を一瞬のうちにやっている。

視覚システムの概要
 網膜に投影された網膜像は、約660万個の錐体と呼ばれる光電変換素子によって電気信号に変換される。これが画像処理され、ニューロンに伝えられ、後頭葉の一次視覚野に伝わる。
 最近のスマートフォンカメラは、2000万画素以上で、高級カメラではi億個以上の画素数がある。これに比べて、網膜の画素数660万は極めて少ない。脳が少ない画素数のセンサを使ってこれだけの高い機能を実現していることは、脳の処理がそれだけ高級であることを示唆している。

知覚とはどんな計算なのか

 外環境を知覚する際、脳は感覚信号(感覚情報を表す神経活動)そのものを理解しているのではなく、感覚信号の原因となった外環境の構造や状態を推論している。
 推論すべき外環境の状況は、「隠れ原因」「隠れ状態」(直接知ることができない隠れた情報)と呼ばれている。
 隠れ原因:物体の形状、大きさ、色など不変な性質を表す時に使う。
 隠れ状態:物体の動きや照明など時間とともに変化しうる性質を表す。
 私たちの脳は、観測した感覚情報に基づき、事前確率分布、条件付き確率分布という二つの確率分布を利用して、最大事後確率推定によって「隠れ原因」「隠れ状態」を無意識に推論している。脳はまず、隠れ状態について何らかの想定(これを信念と呼ぶことがある)をおく。そして、その想定が正しければこんな感覚信号が得られるのではないかという予測信号を生成する。この予測信号と実際に受け取っている感覚信号を比較して両者のずれを計算する。このずれを「予測誤差信号」という。
 最終的に予測誤差がゼロになったときに、隠れ状態の推定結果として、知覚が得られると考える。つまり、予測誤差が最小化されるように頭の中の想定を書き換えることで、私たちは外環境に何があるのかということを理解しているのである。

自由エネルギー原理

 世界の生成モデル:外環境の隠れ状態uと感覚信号sが同時に生起する確率をP(s,u)と表す。
 P(s,u)=条件付き確率(原因によって感覚信号が生じる確率)P(s|u) × 原因の事前確率 P(u)
 P(u|s) 感覚信号sが得られた条件のもとで状態uである確率=事後確率(推論の結果)
 また、P(u|s)P(s)=P(s|u)P(u)が成り立つから、P(u|s)=P(s|u)P(u)/P(s)=P(s,u)/P(s)
 両辺の対数をとると、logP(u|s)=logP(s,u)-logP(s) この赤部分はシャノンサプライズと呼ばれる。感覚信号sがめったに観測されないときに大きなマイナスの値をとる。
 事後確率の対数=世界の生成モデルの対数+シャノンサプライズ
 ヘルムホルツの自由エネルギー=認識確率と真の事後確率のダイバージェンス+シャノンサプライズ
 フリンストンは、知覚の過程を「ヘルムホルツの自由エネルギーを最小化する」過程だと考えた。

運動も推論である!

 自由エネルギーを小さくするには、ダイバージェンスだけなく、シャノンサプライズを小さくするという手もある。サプライズを小さくするためには、感覚信号sを変化させなくてはならない。感覚信号を変化させるためには自分が動く必要がある。「どのように運動すれば自由エネルギーを最小化できるか。」
 自由エネルギー原理は、感覚信号から知覚をもたらす過程を説明するだけでなく、運動を生成する過程を説明する理論としても機能する。
 受け取る信号を自分が予測する信号に適合するように自分の身体を動かすことを、フリストンは「能動的推論」と呼んだ。
 誤差を小さくするには予測信号(正確にはその源である信念)を変化させても良いし、感覚信号を変化させても良い。能動的推論において感覚信号を変える一つの例は「視線(あるいは眼球)を動かす」ことである。自分の身体を動かすことで観察する信号を選択する。
 脳は能動的推論において、自由エネルギーを小さくすべく、自分の推定が正しいことの証拠となる観測信号を得る努力をすると考えられている。つまり、脳は「自己証明する」のである。

注意 〜 信号の精度を操る 〜

 運動や認知などの機能は自由エネルギー原理の立場からどのように説明できるか。

信号の精度

 システム内部を流れる信号はいつも雑音(ノイズ)の影響を受けて時間的に揺らいでいる。ノイズの大きさは個々の測定値の「信頼度」に影響を与える。
 受け取った信号=送った信号+ノイズ ノイズの値は「正規分布」と呼ばれる確率分布にしたがう。ノイズの分散が小さい時は「信号の精度が高い」と呼ぶ。
 フリンストンの理論では、分散σ2の逆数1/σ2を「精度」と呼び、πで表す。脳がπを大きく設定すれば、脳は誤差をより重大に扱うことになる。信号の精度を能動的に制御して、その信号のもつ意味の重大さを操作する機能を「精度制御」と呼ぶ。そして、フリンストンの理論では、この「信号の精度を高める」操作が「注意を向ける」という機能に相当する。

信頼できる信号は予測に強い影響を与える

 ニューロンの信号にはノイズが含まれている。ニューロンが発する感覚信号のゆらぎが小さければ「精度の高い感覚信号」で、ゆらぎが大きければ「精度の低い感覚信号」となる。
 予測信号についても同様で、予測が安定していれば「精度が高い予測信号」といえる。
 感覚信号と予測信号の精度のバランスをうまく操作することが、脳が環境を理解するうえで重要な意味を持っている。 「予測誤差信号=感覚信号ー予測信号」
 「(感覚信号の精度)/(感覚信号の精度+予測信号の精度)=予測誤差信号の精度」
→ 感覚信号が信頼できるときは予測誤差を重視して予測信号(自分の推論)を大きく修正する一方、感覚信号が信頼できないときは予測誤差を無視して自分の推論内容を維持する、ということになる。

信号の信頼度をコントロールする

 ある対象に注意を向けると、その対象を処理しているニューロンの反応が大きくなる。
 (注意を向ける)=(その信号の精度を上げる)=(予測誤差を大きく捉える)
 精度を制御する信号:人が何かに注意を向ける際に脳の黒質緻密部からドーパミンという物質が放出され、それが注意の際に活動しているニューロンの信号の増幅や減弱をもたらすという現象がわかった。ドーパミンが精度πを調節する役割を果たしている。
 ドーパミンは、大切だと思われる信号に対しては伝達先のニューロンの反応を増幅し、大切でないと思われる信号に対しては反応を減弱させるのである。

運動 〜 制御理論の大転換 〜

運動の考え方の転換

 運動のメカニズムは知覚のメカニズムと同一であり、両者を区別して考える必要はない。
 運動は、大脳皮質の前頭葉にある運動野と呼ばれる部位から脊髄のα運動ニューロンを介して筋に信号が送られ、その信号に従って筋が収縮することで実行される。
 フリンストンは、運動野が出力する信号は「筋感覚の予測信号」と提案した。この予測信号は運動を達成した状態(ゴール状態)における感覚信号の期待である。
 運動野の出力信号:α運動ニューロン → 筋繊維 → 筋のセンサ(筋紡錘) → α運動ニューロン  このようにα運動ニューロンには、運動野からの信号と筋センサからの信号という二種類の信号が入力される。
 運動野からの信号を「予測信号」、筋繊維からの信号を「感覚信号」とみなせば、α運動ニューロンは予測信号と感覚信号を比較して両者の差(予測誤差信号)を計算する役割を担っていると考えられる。=能動的推論
 この予測誤差を最小化する仕組みとして反射弓が機能する。予測誤差最小化という観点にたてば、知覚も運動もまったく同一の定式化ができる。

知覚と運動はめぐる

 能動的推論では、新たな感覚信号を得る(再サンプリングする、または確認する)ために、視線を移動させたり身体運動を行ったりする必要があった。

〜 一旦整理 〜
 外環境を知覚する過程は、予測誤差が小さくなるように信念を書き換えて、信念を介して外環境を理解するプロセスであった。次に、身体や眼球を動かして予測信号に合う感覚信号を再サンプリングする過程は、予測誤差が小さな感覚信号を観察することで自分の信念が正しいことを確認するプロセスであった。このように私たちは知覚と運動の循環的因果性のもとで外環境を理解し、そして外環境に働きかけているのである。

「運動する際に信念を書き換えずに予測誤差を解消する仕組み」も存在する

感覚減衰

  再求心性感覚信号:自分が身体を動かすことによって生じる感覚信号のこと。
  一般に、自分の運動によって引き起こされる感覚は抑制される。= 「感覚減衰」と呼ぶ。

α運動ニューロンに伝える信号の精度

 α運動ニューロンにおいて再求心性感覚信号と予測信号を比較する際に両者の重みづけを精度制御によってコントロールしていると考えられている。再求心性感覚信号の精度を低下させると、単に感覚減衰が生じるだけでなく、予測誤差の精度も低下するので、予測信号の修正が起きにくくなる。さらに、精度制御の仕組みは運動達成状態に関する信念を積極的に保持する。
 注意は信号の精度を高めるので、このような注意の働きは、運動野から出力される自己受容感覚の予測信号の精度を高める。

運動野に第Ⅳ 層がない

 運動野は予測誤差信号を受け取らない。
 大脳皮質において、皮質外部からの入力信号は該当部位の第Ⅳ層に入力されるが、運動野には第Ⅳ層がほとんどない。つまり、運動野には外から入力が与えられないため、運動野で保持されている信念は修正されずに維持される。(視覚野、体性感覚野などの感覚皮質ではこの第Ⅳ層の厚さは大きい。)

目の前のコップをつかめるのはなぜか

 外受容感覚(視覚、聴覚など」):外環境の情報を捉える
 自己受容感覚:自分の身体の状態(関節角度や身体全体の動きなど)を捉える
 このような2種類以上の感覚を入力とし、予測信号を出力とする高次ニューロンは多感覚ニューロンと呼ばれ、感覚統合に関与している。
 目の前のコップに手を伸ばす場合、このニューロンは、コップの外受容感覚(網膜像)と、コップを把持するための自己受容感覚の予測信号を出力する。コップを見ただけで自動的にそれをつかむような身体の調節がなされることを意味し、「アフォーダンス機能」と呼ばれている。能動的推論によって知覚と運動が循環するからである。

他者の行動を理解する

 ミラーニューロン:他者がその行為をするのを見た時にも反応するニューロン

意思決定 〜 二つの価値のバランス 〜

目標志向行動とはなにか

 目標志向行動:いくつかの行為、運動を積み重ねることで(この積み重ねを「行為系列」という)目標を達成する行動。
 成果:目標志向行動において重要なことは、期待される成果を最大にするように行為系列を決めること。
 フリンストンは、人間は将来のサプライズをできる限り小さくなるような行動をとると言う。

どのように次の行為を決めるのか

 1) 目標状態に達するための最適な行為系列(フリンストンは「ポリシー」と呼ぶ)を決定する。
  前頭葉の中に「仮想ユニット」と呼ばれるニューロン群があり、それらがシュミレーションを行なって可能な行為の中から最適なものを一つ選んで実行する。眼球運動の計画細胞も仮想ユニットの一例である。
 2) 随伴性の不確実性を低下させる。
  将来の成果の不確実性(エントロピー)を表す「期待自由エネルギー」という量を考え、期待自由エネルギーを最小化する行為を選択することで実現できる。
 (期待自由エネルギー)=ー(認識的価値)ー(実利的価値):人間はこれら二つの価値の和が最大となるような行為系列を選択する。
 認識的価値:随伴性の不確実性を低下させることに対応。→ 本人しかわからない内在的価値。
  例 ゴールを見るために見晴らしの良い場所に移動したりする。
    見慣れない箱が机の上にあったとき時それを開けてみる。
 実利的価値:目標状態に到達することに対応。→ 効果の大きさが外部から観察可能な外在的的価値。
  期待効用と呼ばれ、食べ物・金銭などに対する満足度のような心理的な量。
 自由エネルギー原理は、行動が実利的価値と認識的価値のバランスによって決定されることを主張。
 ある行動をとることによって期待自由エネルギーが小さくなると、ポリシーの信念の精度(信頼度)が上昇するように精度制御が働く。

運動制御における脳の階層性

 行動は階層的な制御システムによって実行されている。階層的な行動決定においてレベルによって処理の速さが異なる。
 階層的制御の上位レベル 離散的
  眼球運動で、0.2〜0.3秒程度続く固視(視線を動かさない)
 階層的制御の下位レベル 連続的
  眼球運動で、数十ミリ秒で視線を高速に移動させる眼球運動(サッカード)
 上位レベルは下位レベルへ予測信号を送る。一方、行動決定の階層モデルでは、上位レベルである連合野や運動関連領野の活動が切り替わるごとに下位レベルで一つの行為系列が実行される。下位レベルに対応する運動野からは、すでに繰り返し述べてきたように自己受容感覚の予測信号が筋に向けて送られ、反射弓によって運動が実行される。

感情 〜 内臓感覚の現れ 〜

 感情は自己の内臓の状態と密接に関係している。
 情動:外的刺激や記憶の想起によって生じる内臓や血管の状態変化(内臓そのものの変化)を表す。
 感情:情動に伴う主観的意識体験(気持ちの変化)を表す。

ホメオスタシスとアロスタシス

ホメオスタシス

 自分の身体の状態が外環境の変化によらず一定になるように制御する仕組み。

自律神経

 内臓の感覚やコントロールをつかさどる。一部がホメオスタシス機能を実現している。

内受容感覚

 内臓や血管の状態の知覚に関わる。
  (外受容感覚:視覚など、いわゆる五感  自己受容感覚:筋感覚と平衡感覚)

アロスタシス

 ホメオスタシスの混乱が大きくならないように、体内の状態に関する設定値を予測的に変更する機能のこと。突然のスピーチ依頼で、まだスピーチしていない段階で、ドキドキしたりすること。
 前頭葉の前帯状皮質から視床下部を通じて送り出される信号は内臓に関する予測信号で、脳幹ではこれと内臓状態を知らせる信号を比較して予測誤差を求め、それを内臓に送ってその状態を変化させることでアロスタシスが実現されている。アロスタシスもまた能動的推論であるといえる。

身体運動と内臓運動

 自律神経調節(ホメオスタシス)では、内受容感覚の予測誤差が自律神経における反射弓によって抑制・解消される。
 アロスタシスの機能が働く際には、通常、外受容感覚、自己受容感覚と内受容感覚が同時に働き、それらが相互に関連し合っている。自由エネルギー原理のもとでは、アロスタシスとは、事前確率分布を変更することで、将来起こりうるホメオスタシスの異常を回避することとして解釈される。
 起立性調節障害では、起立直後に低血圧になり、立ちくらみや倦怠感を覚える。これらは内受容感覚の予測誤差を最小化できないために適切な内臓(血管)運動制御ができないことと考えられる。

好奇心と洞察 〜 仮説を巡らす脳 〜

 アブダクション(仮説生成):データから仮説やモデルを作り出すこと。
 自由エネルギー原理によれば、「人間は世界に関する不確実性の最小化を目指して仮説を立てる。」

理解のプロセス

第一段階

 好奇心による仮説生成(現象を説明できる生成モデルを学習する。)
 「人間は環境の不確実性を最小化するような行動をとる」

不確実性を最小化する行動
  • 情報を求めて探索する認識的行動
  • ゴールを探求する実利的行動
  • 新奇性を好む好奇心による行動

第二段階

 得られた生成モデルをできるだけ単純な形にする。

 一般に正確なモデルほど複雑になることから、正確さと複雑さの両方を同時に達することはできず、実際には両者のバランスが重要である。自由エネルギー原理では、このバランスが自動的に調節される。

統合失調症と自閉症 〜 精度制御との関わり 〜

 自己主体感:「その行為は自分が主体的に行なった」と感じる感覚。
 自己主体感の異常が統合失調症の重要な症状である。自己主体感が生じるかどうかは感覚減衰が生じるかどうかにかかっている。

統合失調症

 幻覚や妄想などの陽性症状や意欲低下などの陰性症状が見られる精神疾患である。
 自分が行なった行為であるにもかかわらず、他人にさせられたと認知する妄想、「させられ体験」が生じ、自己主体感の喪失と解釈できる。
 健常者では自己運動時に生じる頭頂葉での感覚減衰統合失調症では生じない。感覚減衰が起こると自己主体感が生じ、感覚減衰が起こらないと「させられ体験」が生じる。

統合失調症の症状の二階層モデル

第一階層

 感覚減衰の低下により感覚信号が支配的になり予測信号の影響が薄まる。

第二階層

 ドーパミンの働きにより精度の高い予測信号が生成される。

 こうして予測誤差による信念の修正はほとんど起こらなくなり、その結果、事前の信念のみに従った、現実から乖離した知覚や認知を得ることになってしまう。これが統合失調症などで見られる幻覚や妄想の原因であると考えられる。

自閉症の診断基準

  • 社会的コミュニケーションおよび対人的相互反応における持続的欠陥がある。
  • 同じものにずっと注意を向けたり、同じ行為を長時間繰り返したりする(手をひらひらさせる、体を揺らす)「常同性」

自閉症と自由エネルギー原理

 自閉症の諸特性は、予測信号(事前の信念)の精度が低いことに起因している。予測信号の精度が低く、感覚信号の精度が相対的に高い場合には、感覚予測誤差は大きくなる。
 感覚過敏:予測誤差によって常にサプライズが起こっている状況。精度制御がうまく働かず、感覚信号に必要以上に大きなウエイトがかかるせいで、健常者が無視するような些細な感覚信号にも大きく反応してしまう。

認知発達と進化、意識 〜 自由エネルギー原理の可能性 〜

物体の永続性

 「物体は場所を移動しても同一性がが保たれる」ジャン・ピアジェによる研究では、物体の永続性の理解は生後12ヶ月から18ヶ月くらいにかけて徐々に発達する。
 赤ちゃんは一般に、赤ちゃん自身にとって統計的にサプライズの大きいところを見ることで多くの情報を獲得することが知られている。

マルコフブランケット

 生物は外部状態(世界(外環境・内環境)の状態)に関する推論を内部状態(感覚と運動を除く脳の状態)を用いて行うが、環境からの信号によって決まる「感覚状態」と、内部状態から環境に働きかける信号によって決まる「運動状態」の二つの状態を表すサブシステムが存在する。
 高次階層から低次階層への予測を伝える機構の状態が「運動状態」に、低次階層から高次階層への予測誤差を伝える機構の状態が「感覚状態」に対応する。
 「感覚状態」と運動状態」というマルコフブランケットを仲介することによって、世界(外部状態)から自分自身(内部状態)を分離し、自分の中で現実とは異なる世界の状態について「自律的」に推論できる。これにより、環境とエネルギーの交換をしながら、環境とは独立した自己を形成することが可能となる。

 私たちは環境との相互作用を通じてエントロピーを一定の範囲内に抑えることにより、ホメオスタシスを維持し、生存している。そして、内受容感覚を通じて内環境を推論し、精度の最適化を通じて自身の状態を通じ、世界の中で自身の存在を感じることができるのである。

著者

乾 敏郎(いぬい としお)
大阪大学大学院基礎工学研究科修士課程修了。京都大学大学院文学研究科教授、情報学研究科教授などを経て、現在、追手門学院大学心理学部教授。工学修士、文学博士。専門は認知神経科学、計算論的神経科学。著書に『感情とはそもそも何なのか』、『イメージ脳』など多数。

阪口 豊(さかぐち ゆたか)
東京大学大学院工学系研究科修士課程修了。東京大学工学部助手、講師、電気通信大学大学院情報システム学研究科助教授などを経て、現在、電気通信大学大学院情報理工学研究科教授。工学博士。専門は感覚運動機能、身体技能の計算理論。共著に『ニューロコンピュータの基礎』、共編著に『脳の計算機構』など。

タイトルとURLをコピーしました