昨今の第3次AIブームは、「専門知識をつめこむことで優秀なカウンセラーが育成できるわけではない」ということを示唆しているように思います。
かつて学生時代に認知科学(AI関連分野)を学んでいた心理セラピストが、AIメタファーによって、心理カウンセラーの暗黙知の理解を試みます。
※この記事はAI研究から受ける示唆を書くものであって、人間の脳を解剖学的に述べたもではありません。(認知科学では、実際の脳の詳細構造を明らかにするのではなく、むしろ単純化されたモデルで脳機能を再現したり説明したりすることで脳についての理解を深めようとすることをモデルベースアプローチとか、構成論的アプローチと言います)
心理カウンセラーの心の回路図
ニューラルネットワークは脳細胞の結合を模したものです。脳細胞に相当するのがユニット(図中の楕円)、神経伝達経路シナプスに相当するのがエッジ(図中の交差する矢印)です。
ユニットは他のユニットからの信号を受けて、興奮(反応、活性化)したり冷めたりします。その興奮を他のユニットに伝えます。
左の層から右の層がどのように影響を受けるかが、エッジのネットワークによって決まります。それがニューロAIの学習状態を表していて、セラピストの暗黙知(一部は専門知識を反映)に相当します。
入力層にはセラピストが観察したクライアントに関する情報が入ってきます。たとえば、クライアントが話した言葉、表情、涙、その他の状況なども含みます。
たとえば、図中の入力層の情報1は「クライアントは顔をしかめた」に反応するユニットかもしれません。
実際の脳はたくさんの脳細胞でその情報を受け止めるはずですが、ここではそれらを代表して「クライアントが顔をしかめたときに反応する脳細胞(ユニット)が1つある」というように単純化します。(モデルベースアプローチでの理解)
入力層の影響を受けて、中間層のユニットたちも反応します。図では中間層は2層ですが、もっとたくさんの層が重なっていると想像してください。そして、最後に出力層が影響を受けて反応します。
それぞれが前の層の意見を聞いているかのようです。
経験や知識のあるセラピストは、クライアントの悩みの種類や、覚醒状態など、より多くの情報を使って複雑な判断を行います。
たとえば、図中の中間層の状況1は「クライアントは内省中」かもしれません。理解1~3は「クライアントの抵抗」「クライアントのカタルシス」「転移」かもしれません。(1~3の番号に意味はありません)
ちなみに、実際の人間を研究している神経科学では概念ニューロンと呼ばれるものが見つかっているそうです。
*ただし、中間層のユニットの大多数は言語化できない「あー、この感じ」みたいなものでしょう。ニューラルネットワークではそのような潜在的意味も抽出されます。いわゆる暗黙知ですね。
なお、ここでは扱いませんが、近年の脳科学の計算モデルは双方向(中間層から入力層へ向かう信号もある)になっているそうです。1
エンコーディング領域
入力層付近から中間の処理はエンコーディング領域と呼ぶことにします。
すなわち観察された膨大な情報から、その本質や特徴を抽出する部分です。
これはマニュアル化がしにくく、その大半は暗黙知になっています。
たとえば、クライアントが笑顔をみせた場合、それは安心しているからかもしれないし、気を遣う性格だからかもしれません。ですので「笑顔」ユニットは「安心」ユニットにも「気遣い」ユニットにも信号を強く送りますが、「安心」「気遣い」のどちらが反応するかは他のユニットからの信号と総合して決まります。
「この独特の話の流れ」や「いい感じの沈黙」みたいな名称なき現象に反応するユニットがあります。
プロセスワークの「シグナル」などのように、「何かが起きた、何なのかは未だわからないけど」みたいなものも中間層が作り出すものと考えられます。
しかし、実際にはセラピストが全く自覚しないユニットが大半になるはずです。
エンコーディング領域を活用する心理セラピー(力動アプローチ、ゲシュタルト療法など)の場合、その状況判断や理解は心理学によって用語定義されていないものを多く含みます。抽象化されているけど名前はついていない状況や理解を扱えるのがニューラルネットワークです。
デコーディング層が受け取る情報は、高度に抽象化された状況判断や理解です。それらはエンコーディング層によって作られます。
デコーディング領域
具体的な行動へと展開するための、出力層付近の処理はデコーディングと呼ぶことにします。
たとえば出力層の「傾聴」ユニットが興奮したら、セラピストが傾聴するという行動を選択したことになります。あるいは別のユニットが興奮したら「直面化」(クライアントが気づいていないことを率直にフィードバックするみたいなこと)を選択します。あるいは提案する療法メソッドを決めるかもしれません。
それらのうちどの対応が活性化するかは、直前の層からの複数の信号の影響で決まります。
デコーディング領域はマニュアル化(形式知に変換)しやすいので、手順が明示されるようなメソッド(認知行動療法など)はデコーディング領域だけで成果を出せるメソッドと捉えることができます。
エンコーディング 領域 | デコーディング 領域 |
---|---|
入力層~中間層 (側頭葉っぽい) | 出力層の近く (前頭葉っぽい) |
特徴や意味抽出 (見立て) | 判断や対応 (介入) |
暗黙知 (非認知的能力) | 形式知に近い (認知的能力) |
人間性 | 専門性 |
暗黙知って何だ
専門知識をつめこんで失敗した第2次AIブーム
第2次AIブーム(半世紀前、レベル1人工知能)では、ルールベース(「こんなときはこうする」の集まり)でAIを開発しようとして失敗しています。
それは、形骸化した形式知(つめこみ専門知識)でカウンセリングを学ぶと、「クライアントが悲しいと言ったら、共感の言葉を言え」みたいな形骸化が起こることと似ています。
ニューラルネットワークモデルに照らすと、エンコーディング領域がちゃんと育っていない場合、または入力層と出力層が単純に直結(つまり中間層がないこと)に相当します。
中間層の重要性は暗黙知に相当するように思います。
心理かうセラーの暗黙知とは
マニュアル化しやすいのはデコーディング領域です。
また、カウンセリングの実務経験によって学習しやすいのもデコーディング領域です。なぜかというと結果に直結しているので、答え合わせがしやすく、ニューラルネットワークを育てる学習が進みやすいからです。
それに対してエンコーディングによって中間層に現れるのは、「転移」とか「カタルシス」とか「そのようなクライアントによくある独特の感じ」とかでしょう。それらはAIでは「潜在的意味」とか「特徴ベクトル」とか呼ばれているものに似ていると思います。
それらを扱うため処理を暗黙知と呼んでもよいのではないでしょうか。
しかし、エンコーディング領域、中間層のニューラルネットワーク(暗黙知)は結果にどのように影響したかが分かりにくいので、なかなか学習が進みません。
では、AI研究ではどのように対処しているかというと、入力層だけを育てたり、中間層だけを育てるという事前学習を行います。それは出力層(カウンセリング業務)をなくして、その代わり広範な状況(異なる課題の出力層をつけて)での経験を積むわけです。そして、この事前学習を膨大に行ったうえで、最後の仕上げとして出力層を付けた学習(カウンセリングのトレーニング)を行います。
ちなみに、世を騒がせているGPTもこの方法によって進化したそうです。GPTの「P」はPretrainedです。
この事前学習をセラピストに当てはめると、人として生きた経験、社会人経験、人間関係、当事者経験、克服経験などが相当するでしょう。つまり専門家としての経験ばかり積むと、デコーディング領域は鍛えても、エンコーディング領域が強くないということになります。
流派による学習スタイルの違い
ざっくりとしたイメージを個人的な見分に基づいて書きますので、偏りのあることをご承知おきください。
精神分析
精神分析はカウンセリング業務経験をたくさんやることで学ぶスタイルです。臨床経験やスーパービジョン(師による助言)を蓄積して、一人前になるのに10年かかるみたいな世界です。
いわゆる「勘と経験を使う」アプローチですから、エンコーディング領域を重視していると言えます。
しかし、臨床経験(カウンセリング業務経験)は出力層を評価します。出力層から入力層への逆伝搬で学習しますので、層が深くなると、中間層や入力層が育つのに膨大な時間とデータが必要になります。
ベテランの先生ほど偉いみたいな世界になるかもしれません。
訓練データは多ければ多いほうがよい。しかし、それを学ぶのに膨大な時間がかかる。
これはGPT3より以前のAIによく似ているのではないかと思います。
認知行動療法
入力層や中間層にはあまり頼らないぞというアプローチもあります。評価しやすいデコーディング部分だけをノウハウ化してしまおうという実証主義です。
これは形式知にしやすく、答合わせもしやすい(エビデンス)ので、速く学ぶことができます。
再現性も高く、これこそ心理技術といった感じでしょう。ベテランほど偉いという権威主義ではなく、とっととコツを教えてくれる感じがします。
しかし、深い心の傷や、好きだから嫌いというような機微を扱うことは苦手かもしれません。
予め用意された入力データにしか対応していないので、個別のストーリーを扱えないのです。型にはめちゃう感じですね。
この認知行動療法の勉強会では「クライアントが教科書通りの反応をしてくれないのですが、どのようにすれば教科書通りの反応をしてもらえるでしょうか?」というような質問がよく聞かれます。
人間性アプローチ
ネイティブセラピスト(当事者経験から学んだ人)、社会人出身のセラピストなどは転移学習をしています。
これは精神分析と同様にエンコーディング領域を重視します。直感や感覚を重視します。
それは出力層よりも中間層を先に学びます。
それは出力層を外して(あるいはカウンセリング業務とは別のもものに取り換えて)、中間層のネットワークを育てます。
彼氏に「いまの電話は誰から?」と尋ねると彼氏が声を荒げて「仕事だよ!」と言ったら、アヤシイですよね。荒げた声と仕事だよの組み合わせはアヤシイと判断する中間層ネットワークが育っているわけです。
社会の中の様々なヘンテコな状況を経験することで、中間層は育ちます。騙されたり、挫折したり、浮気されたり、共依存に巻き込まれたり、知人が自殺したり、リストラされたり、仲直りしたり、嫌いなやつに助けられたり、いろんな経験の中で、入力層に意味を見出す中間層が作られます。それを事前学習といいます。
そして、そのような豊かな暗黙知をもって、カウンセリング業務の訓練を受けます。
学習に非現実的な膨大な時間がかかるという従来のAIの限界も、それとよく似た「事前学習+ファインチューニング」によって劇的な進歩をとげ、GPT3のような実用レベルに近いAIが現れたわけです。
ただ、人間性アプローチは自分たちのやっていることの良さを説明したり証明したりするのが苦手です。AI業界ではこれを説明性・解釈性の課題と呼んでいます。
セラピスト・マインドフルネス
入力層を集中的にトレーニングするのがマインドフルネスと言えます。
AI研究の示唆によると、心理セラピストのトレーニングとしては、入力層や中間層を事前学習することから始めるとよさそうだということを上述しました。
事前学習の最初の一歩として入力層のネットワークを取り出して、そこだけトレーニングするとしたら、それはまさにマインドフルネスです。
何もせずに座るというのは、出力層をもたない(もしくは、出力層は自己観察)ということです。さらに、「いまここにある気づき」というのは、中間層による解釈もしない(してもいいけど、再び入力層に注力する)ってことです。
セラピー実践のためにセラピスト自身がマインドフルネスを実践することは、セラピスト・マインドフルネスと呼ばれます。
Kojunは茶道をきっかけに20代の頃からマインドフルネス実践をしています。役に立っている実感はします。
多様な経験が中間層を育てる
また、中間層の事前学習について言えば、社会人経験や様々な人間関係を経験することは重要になると思います。
当事者体験も事前学習になるでしょう。セラピストがクライアント側の体験をすることは米国などでは重要視されています。
多様な経験をした人材を心理業界に入れておくことが心理支援業界の全体の学習を促進することもAI研究の示唆するところかと思います。
多様なAIモデルを共存させて全体としてよい判断をしてゆくことをAI業界ではアンサンブル学習といいます。心理支援業界が統一や均一化を競っているのとは真逆ですね。これは心理支援業界の伸び代でもあると思います。。
心理セラピストの並列処理
一つの状況(入力層の状態)に対して、複数の特徴抽出(中間層で2か所のユニットが反応する)が起きることがあります。
たとえば、クライアントが「どうせダメだ」と言っているとします。それに対して、セラピストは「正当な嘆き」と「自己否定」という相反する複眼的な見立てをすることがあります。
ある面で、「そうだよなあ、やってられねえよな」と本当に共感します。そこに伴走すると、「ダメでもいいじゃん」という癒しが生まれたりします。
一方で、「自己否定を手放せたらいいね」というクラアントが”直る”イメージも持ちます。そして、クライアントに変化する準備や機会を提供できます。
クライアントを変えようとしないのが心理セラピストの本分であり、クライアントが変わることを支援するのも心理セラピストである、という不思議なパラドックスはニューラルネットワークの複数個所(結論を急ぐと論理的には相反する)が同時に活性化できるということに相当するかと思います。
これにより、クライアントを苦しめる矛盾から、生きやすくなる矛盾へと展開してゆく見通しが立てられるのだと思います。たとえば、「頑張らないといけない」&「もう頑張れないよ」という矛盾から、「頑張らなくていいんだよ」&「ほら頑張りたくなったでしょ」という矛盾へですね。
つまり、クライアントを二通り、またはそれ以上に観ているのです。弱くて強い人になってもらうために。
ちなみにKojunは、女でもあり男でもあります。中間ではありません。
参考
ここに挙げたのは便宜的な世界観ですが、関連分野の学術的な入門書としてはこちらをお勧めします。