widgets (詳説)上位注意制御

Brain 112:1587

現環境で適用可能な多くの反応セットの中でより難しい反応セット(あるいはタスクセット)を選ぶ上位の制御。Norman, Shallice (1980)により Supervisory attentional system (SAS)として提案された(図は Shallice et al. Brain 112:1587, 1989 から引用)。Split attention 条件での dACC の賦活(Corbetta..Petersen, J Neurosci 11:2383, 1991)から始まって、SAS を必要とする局面での dACC の賦活がヒトとサルで広く報告されている。Botvinich と Cohen らは 2000 年代前半に、反応コンフリクトのモニターがこの機能の本質であるとする有名な説を提案したが、反論も多かった。Botvinich と Cohen はその後、dACC は認知制御過程の予測価値(予測結果―コスト)を計算して比較し選ぶという説を提案した(Shenhav, Botvinich, Cohen, Neuron 79:217, 2015)が、これは SAS と殆ど同じ内容で、STS をどうやって行うかの説になっている(ただし認知制御過程を選択の対象にした点は新しい)。上位注意制御と反応抑制は支配的な反応またはタスクセットを抑制しそれ以外を選ぶという点では似ているが、反応抑制が反応レベルでの抑制であるのに対し、上位注意制御はタスクセット(あるいは認知制御過程)レベルでの選択である。タスクセットレベルでの選択の方がずっと難しい。タスクシフトとも似ているが、タスクシフトが新たに採用するタスクセットがどこかで決められた後にどうシフトするかが中心であるのに対し、上位注意制御は注意を向けるべき認知制御過程の選択が中心。

上位注意制御に本質的な神経活動を決めるには、上位注意制御を引き出すためにタスクが設けた具体的設定に特異的な神経活動と、上位注意制御に共通な神経活動を識別することが肝要。そのため、ひとつのタスクを推薦するのは難しい。Hayden et al (2011)のタスクは比較的訓練が容易ではないか。

Hayden..Platt (2011) Neuronal basis of sequential foraging decisions in a patchy environment. Nat Neurosci 14:933-939.

Nat Neurosci 14:933-939.

マカクでの細胞活動記録。青色短標的と灰色長標的のどちらかをサッケードで選ぶ。青標的を選ぶと 0.4 秒後に報酬がでる。この報酬量は、最初 0.31ml で、選ぶたびに 0.02ml ずつ減る。灰色標的を選ぶと青標的への報酬量がリセットされる。しかし、報酬なしで、ITI が延長する。ITI の延長時間は灰色標的の長さが示す(0.5~10.5 秒、灰色標的を選ばないブロック内は一定)。サルは、延長時間が長いときはリセットをゆっくり(報酬がかなり減ってから)選び、延長時間が短いときは早く選んだ。約半数の ACC 細胞がサッケード開始付近で活動したが、この大きさはリセット選択に向けて次第に大きくなった。著者は ACC 細胞活動はリセット決定を媒介すると示唆した。

Johnston..Everling (2007) Top-down control-signal dynamics in anterior cingulate and prefrontal cortex neurons following task switching. Neuron 53:453-462.

Neuron 53:453-462.

マカク。標的に対し prosaccade または antisaccade をする。規則を指示する手掛かり刺激はなし。ひとつの規則で 30 回成功すると規則が変わる。規則に選択的な反応をする細胞は ACC と dlPFC の両方にあるが、規則変更の直後には ACC に強く、変更後しばらくたつと dlPFC に強くなる。後の論文では、同じタスクで fMRI(Ford..Everling Neuroimage 45:470, 2009)、局所電場電位の解析(Womelxdorf..Everling PNAS 107:5248)もしている。

Sarafyazd, Jazayeri (2019) Hierarchical reasoning by neural circuits in the frontal cortex. Science 364:eaav8911

Science 364:eaav8911

マカクでの細胞活動記録。刺激間隔が 850ms 以上なら pro-saccade、以下なら anti-saccade という規則 1 と、850ms 以上なら anti-saccade、以下なら pro-saccade という規則 2 がブロック(10~22 試行)ごとに切り替わる。間違えた場合、その原因が刺激間隔の知覚と規則適用のどちらの間違いに起因するかに応じて異なる対応をする必要がある。電気生理記録と微小電気刺激により、DMPFC は間違いへのフィードバックに応答し結果をエンコードする、ACC は規則のスイッチに応答しより長い時間スケールでの意思決定のモニタリングを行うことを示した。

Kolling..Rushworth (2012) Neural mechanisms of foraging. Science 336:95-98.

Science 336:95-98.

ヒト fMRI。まず、提示された2択のどちらかを選ぶ「今の選択枝から選択」、別枠に示された6個の中のランダムな2個が次に選択肢として示される「その他の可能性を選択」のどちらかを選ぶ(第1選択)。刺激の報酬量は一定で前もって学習してある。「今の選択枝から選択」を選ぶと、それぞれの報酬確率が示され(左右の縦棒)、実際に2択のどちらかを選ぶ(第2選択)。第1選択で「その他の可能性」を選択するとサーチコストがかかる。サーチコストは第1選択の前に別枠の色で表示し、70%の確率で発生する。下の青横棒で蓄積獲得報酬を表示。

dACC の活動は、第1の選択のときに「その他の可能性」の平均価値に正相関し、今の選択枝の平均価値に負相関した。これは今の選択枝を選択したときも他の可能性を選択したときも同じ。「その他の可能性」を選択したときにはサーチコストにも負相関した。第2の選択に移っても「その他の可能性」の平均値に正相関した活動を示し続けた。つまり、いつも「その他の可能性選択」の価値を表した。dACC は今のデフォールトの行為以外の選択の価値を表し、そのような選択肢選択を誘導するという考えを提唱。