エビデンスのある心理療法!?:「多くの人に効果がある」≠「私に効果がある」

「エビデンス1のある心理療法」というような言葉が流行しています。

「エビデンスがある」と言われると、効果が保証されているように聞こえます。「エビデンスがない」と言われると、アヤシイ感じに聞こえます。ですが、これらは「よくある誤解」です。

「エビデンスのない手法を撲滅しよう」なんて言うエビデンス警察もいるようです。

エビデンス・ベースト・アプローチのメリットとして「効果のない手法を淘汰できる」を挙げる人もいます。

これらもエビデンス・ベースト・アプローチのよくある誤解と呼ばれています。

「効果のエビデンスがない」と「効果がないというエビデンスがある」とは同じでしょうか?

「エビデンスがある」と「効果がある」は同じでしょうか?

「エビデンスがある手法とやらを試したけど、効果がなかった」というお悩み当事者の話は珍しくありません。

なぜそんなことが起きるのか考えてみましょう。

なぜこんな話をするのか?

なぜこの話題に拘るかというと、「○○(疾患や悩み)はエビデンスのある△△法でなおる」と言われて、効果を得なかった人たちが、「私の○○はなおらないんだ」と諦めたり、「私の〇〇は仮病みたいなものだ」と自身を責めてる人を見てきたからです。

また、エビデンスというのは、足元を照らしてくれる灯りのようなものであるべきですが、残念ながら臨床心理の世界では他学派を攻撃するための喧嘩の道具として使われてきました。ですから歪んだエビデンスも多かったですし、「エビデンスのないことを言うな/するな」みたいな非科学的な態度を流行らせたりもしました。

他人の喧嘩に巻き込まれないために、そろそろ「科学的と言われるとなんでも信じる」みたいなのも卒業した方がよいと思います。

多くは介入法がその効果の実証的支持を得ているのかということを求め、実証的に支持されない手法を用いることに対する戒めとしてエビデンスが持ち出される。しかし、効果のお墨付きを得ることがエビデンスの第一目的であってはならなき。また、臨床家が、自分の理論的立場の妥当性を肯定するために、研究データを根拠としてあげるのも、有意義ではない。

「感情への招待」岩壁茂 臨床心理学177第20巻第3号p.247

この文献では理解と発展をエビデンスの意義と関係づけています。

また、多元的アプローチでも、実証データのみから手法を選ぶことに異を唱えられています。

「多くの人に効果がある」と「私に効果がある」は異なる

「エビデンスのある心理療法」を受けて、効果がぜんぜんなかったという話は珍しくありません。

たとえば「60%の人に効果があった」などと言う場合、残り40%の人には効果がないわけです。全ての人に効果があると言っているわけではありません。

あなたが効果ない40%側の一人だった場合、あなたが次に探すべき療法は「70%、80%の人に効果がある療法」でしょうか?

あなたに必要なのは、「多くの人に効果がある療法」ではなくて、「自分に効果のある療法」です。

たとえ10%の人にしか効果がない方法でも、それが自分に効果があるのであれば、それがあなたが探しているものです。

私はこの世に多様な療法や支援が必要なのだと思います。

エビデンスの低いものを撲滅してはいけません。

むしろ、療法の多様性を守ることも専門家の役割であると思います。

※生物医学と心理支援では、このあたりの加減がいくらか違うかもしれません。

研究者、行政、治療者は「より多くの人に効果のある療法」を採用すると仕事の成果になりますが、当事者が探すべきは「自分に効果のある療法」です。

治療者や行政にとって素晴らしい療法と、当事者にとって素晴らしい療法は同じではないのです。

エビデンスのあるものを候補の最初に挙げて検討するのは一理あると思います。その後は、だんだんと自分に必要なものが分かってくるのがよいと思います。

「自分にとって効果があるか」(外部妥当性)は自分(または自分にとてもよく似た人たち)で検証するしかありません。ですので、自分だけの克服日誌を書くこともお勧めしています。

確証ないから「エビデンス」

クライアントにとってエビデンスが

「エビデンスがある」と「あなたに効果がある」はイコールではありません。

「効果がある」と言いきれないから、「エビデンスがある」と言うのです。

携帯電話は「通話が出来るエビデンスがあります」とは言いません。通話が出来なければ交換してもらえるでしょう。エビデンスではなく、保証されているのです。

エビデンスがあるというのは、確証はないよという意味です。

「統計的に有意な結果が得られた」って何だろ

実際のエビデンス研究は改善率を示すだけでなく、統計的検定もされますが、それでも「確実に効果がある」とか「効果がない」ことが証明されることはありません。

心理学の「証明された」はせいぜい母集団について語っているのであって、自然科学ほどの再現性はありません。物理学や化学のデータバラツキは測定誤差が主ですが、心理学のデータバラツキは個人差(個性や個別性)です。

たとえば、女性と男性の身長のデータを集めて統計処理すると、それぞれの平均の差がはっきり認められますが、それを「女性は男性よりも身長が低いことが科学的に証明された」と言うのが心理学の作法です。実際には彼氏よりも背の高い女性は珍しくありません。

「効果があることが実証されている」という表現は、ほぼ政治的な/宣伝的な/思考停止な発言だろうと思います。

たいていは実施したグループと実施しなかった比較対照グループの結果(平均値)の差が「有意」(誤差では説明しにくい差がある)と言っているのですが、ちょっぴりの小さな効果であっても有意にはなります。追試したら覆されることもあります。

自然科学者なら安易に「実証された」とは言いません。

言うとすれば「個々のケースに効果が出る可能性が実証された」でしょう。

実は統計的に「検証された」は「多くの人にあてはまる」ですらないです。

すごく小さな効果であっても、効果に個人差が大きくても、サンプルデータを増やせば平均値の再現性は高くなるので有意(「検証された」)になります。

たとえば、51%の人に効果あり、49%の人に効果がない場合も、サンプルデータが非常に多ければ再現性が高いので「検証された」となります。「多くの人に効果あり」ということが検証されたわけではありません。

寛解率が従来手法より1%良くなっただけでもサンプルデータが非常に多ければ「検証された」になります。

たったそれだけの差ならコストの安い方から試してもよいですね。平均値においてたったそれだけの差なら、各ケースについては個人的な勘のほうが良い選択をするかもしれません。

(前略)本来意味のある平均値差があるのに被験者数が少ないから統計的には有意にならなかったり、本来意味のない相関係数の値なのに被験者数が多いから統計的に有意となってしまったりするものです。

『統計分析のここが知りたい - 保健・看護・心理・教育系研究のまとめ方』石井秀宗, p.130 p値の正体

自然科学ではなく統計研究

「科学的」というと「再現率が100%に近い」という印象を与えますが、それは物理化学などの自然科学法則に限った場合です。その印象を流用して「科学的」という言葉が販促に使われます。

心理学の「科学的に証明された」というのは、ほとんどの場合「統計的に有意差が検定された」ことを指しています。

「5%の有意水準で検定された」というのは、「再現率が95%」という意味ではありません。

仮に再現率95%だったとしても自然科学や工学の再現性(99.99999%など)よりはかなり低いです。5%の確率で墜落する飛行機には誰も乗らないでしょう。

「科学的に証明された」心理学の再現性はかなり低い

1億年経ても変わらない物理化学法則と、個人要因や時代背景によって簡単に崩れる「研究により証明された」心理学の確かさは雲泥の差です。

心理学で「実証された」「エビデンスがある」「科学的」という話は、自然科学の「化学反応の法則」とか「重力の法則」ほどの再現性はありません。

自然科学の法則は再現性が100%。工学の再現性は99%以上がざらですが、心理療法の再現性はよくて70%くらいだったりします。

工学では5つの部品が直列しても99% × 99% × 99% × 99% × 99% = 95%くらい成功します。さらに、工学では複数のバックアップを並列することができます。それが「科学技術」という言葉の信頼を作っています。

心理療法の場合、「見立て」と「手法」の2項目が直列するだけで、70% × 70% = 49%というように、当てはまらない可能性がどんどん増えてゆきます。

※数字は例です。

ちなみに、心理療法の「効果があることが証明された」は、再現率ではなくて、「やった場合」と「やらなかった(または、従来の方法をやった)場合」に有意差があるとの証明であることが多いです。「意味なくはないよ」くらいの意味です。それも母集団的に見てです。

自然科学のイメージがあるので、「科学的」と言われると「再現性100%に近い」との印象を与えますが、そうではありません。

理学部出身の私からすると、心理の世界で「科学的に証明された」という言葉を聞くと、似非科学っぽさを感じることがあります。理系出身のカウンセラーの先人たちからの似た意見を聞きますが、今後は臨床心理学部で「これが科学だ」と教えられた人しか受験できない資格制度なども導入されたので、どんどん閉鎖的になってゆくでしょう。

私が若いときに仕事をしたIT分野にいたっては再現性はほぼ100%くらいあります。それでもエラーが起きることを前提にエラーのための処理コードはプログラムの半分くらいを占めます。そして、再現性があるからといって「科学的に証明された」とか「科学的に否定された」などとは言いません。それを言いたくなるあたりも、似非科学っぽさかと思います。比較的健全な臨床心理の文章では「研究によって支持された」などのように書かれています。

「科学的」といってもメカニズムは主観に満ちた推測でしかない

メカニズム(機序)の解明を捨てることによって科学になろうとする心理学、そこでいうエビデンスはたいてい統計的に確認された経験則に過ぎません。

それは顕微鏡、解剖、天体望遠鏡などによって確かめた事実とはかなり意味が違います。

「電子レンジで食品が温まる」というのは、実験検証で食品が温まっただけではなく、そのメカニズムまで解明されています。

「電子レンジで食品が温まる」のは、H2Oの分子には電荷の偏りがあり、電磁波によって揺さぶることができるため、水分を含む食品は電子レンジで温めることができるわけです。電磁場が電荷を動かすこというようなメカニズムの要素も実験実証されています。

「骨折」はレントゲン写真で確認できますし、「(ある種の)貧血」は鉄分が不足していることが血液検査で判ります。

心理の世界の「科学的」はメカニズムが解明されていないものが多いです。理論モデルはあっても構成要素に分解できないので、経験則を大規模に調査したに過ぎません。そういうのを「経験科学」と言うそうです。

お薬については、物理化学的なメカニズム(機序)が(最近は)解明されていて、さらに統計的な試験していますので、わりと科学的だと思います。ただ、機序が解明されているのは脳への作用であって、心への作用ではないでしょう。

たとえば認知の歪みを修正する認知行動療法はウツ病に効果があると統計研究されています(エビデンスがある)が、その手順の中には「自分の感情を振返る」部分が含まれています。じつは「自分の感情を振返る」ことがウツ病に効果があるのであって、認知の歪みの修正は効果とあまり関係ないかもしれません。

※これはKojunの持論でしたが、後に「自分の感情を振返る」メンタライゼーションが大流行りになりました。

昔、青色絵の具をつくる釜で大きな音を立ててかき混ぜると鮮明な青色が出来ると言われていたそうです。しかし、後に、それは釜が削れて鉄の成分が混ざるからだと解りました。そこまで分れば「科学的」だと思いますが、大きな音を立てると発色がよくなるというのはメカニズムが解明されていない経験則です。

療法の「科学に基づく」という売り文句は、たいていメカニズムが解明されたという意味ではなくて、統計的に有意差を確認したという意味です。

統計ではマイノリティが排除される

統計的な研究は何がマジョリティかを示しているにすぎないこともあるでしょう。

自然科学の統計処理で消されているバラツキは測定誤差ですが、心理学の統計処理で消されているバラツキは個性です。

マクロな目的の場合は、統計的に扱うことに意味があるでしょう。つまり、統計が示しているのは一人ひとりではなく母集団の性質です。たとえば、コロナ発症の人数を減らすことで医療負担を防ぐことが目的なら「少数ではなく多くの人に効果のあるワクチン」を選択することに意味があります。生活保護者の数が経済を圧迫しないためにトラウマの治療をするのであれば、「多くの人に効果のある治療法」に予算を投入することに意味があるでしょう。地球環境の保護などもそうです。目的が個人の救済というよりも社会の負担、合計としての成果だからです。

しかし、一人ひとりの個々の支援というミクロな目的の場合、統計に従って判断することは、「帰納して一般化した知識を、演繹で個々に戻す」ということになります。マイノリティを無視するマジョリティ指向のアプローチとなります。「多くの人がこうなんだから、あなたもこうでしょう」というように個別性をつぶす作業になります。

「エビデンスのある心理療法」というのは、マクロな目的の心理療法ですよという意味になります。マイノリティを見捨てて効率よく感謝されるにはよいでしょう。

臨床家の先人達も個別性こそが心理支援の本質というようにおっしゃっています。

エビデンシャリズムは白黒思考、べき思考、完璧主義などの認知の歪みが含まれるように思います。

物理化学の統計誤差は無視するべきノイズによるものですが、心理に関する統計的誤差は注目すべき個性であり、お悩みの本質です。

※「信頼区間」という言葉も使われますが、「95%信頼区間」は95%の人がこの範囲に入るという意味ではありません。

※「標準偏差で標準化された平均差」や「治療必要数」などは個人差のバラツキの程度を考慮していると言えるかもしれません。

RCTで得られた平均的な結果に、個人的な体験談を加えてバランスをとることは、全隊を完成させるために役立ち、現在では「生存者研究(サバイバーリサーチ)」という新しい分野が生み出されるほど、広く受け入れられています。

『精神科診断に代わるアプローチ PTMF』メアリー・ボイル/ルーシー・ジョンストン,p.ⅵ

「エビデンスがない」≠「効果がない」

「エビデンスがない」というのは「効果が証明されていない」という意味ですが「効果がないことが証明されている」という意味ではありません。

そもそも「効果がない」ということを証明するのは科学的ではありません。

科学者たちの講演をいくつか観てください。科学的に証明されていない物事を否定している科学者はいないでしょう。本物の科学者は科学的証拠がないものを否定するために科学を使う人たちではありません。

一時期「精神分析はエビデンスがない(だからダメだ)」ということを言う専門家がいたようですが、その時点でエビデンスがなかったからといって「効果がない/効果がある人が少ない」と証明されたわけではありません。「〇〇療法はエビデンスがないことが研究で証明された」という不思議なコメントをしている専門家もいます。

ある手法が「効果がないと証明された」とテレビで報道されていたそうです。それは愛着不安定(愛着障害)のためのロールプレイなのですが、男性セラピストが母親役をしていたそうです。その手法はKojunもやったことありますが、母親役が女性である必要があり、しかも子供を産んだことがあり、愛着安定している人でなきと効果は出にくいと言われています。実際にそのような手法で救われた人たちはたくさんいます。つまり人選を間違えているわけです。「効果がない」というのは「まだ工夫が足りない」「検証者が習熟していなかった」という可能性が残ります。

薬物療法に関しては「投与しても効果がなかった」という研究結果は意味があるでしょう。薬物療法はそもそも「量産」してマジョリティを救うという戦略だからです。薬物という物質は、実験段階でも完璧に再現され、配布段階で現場で進化することもないからです。(他の薬や療法との組み合わせで効果がでる可能性はあるかもしれませんが)

エビデンスは基本的には薬物療法を根拠づけるために用いられるものなんです。(中略)まして精神分析のように、患者個人との関係の一回性を重視する治療法だと、複数の事例を重ねて統計解析するなどナンセンス、という批判もあり得るでしょう。

『現代思想2021年2月号 特集=精神医療の最前線』p.17, セルフケア時代の精神医療と臨床心理, 斎藤環

「エビデンスがある」というのは「検証しやすい」という意味でもある

エビデンスがあるというのは、「検証しやすい」という意味でもあるかと思います。エビデンスがないというのは、効果がないというよりも、検証しにくいという意味であったりします。

そして、検証しやすさは研究者や開発者にとっては価値がありますが、悩みを克服しようとする当事者にとってはどれほどの価値があるでしょうか?

「人」に依存するものは検証しにくい

また、ゲシュタルト療法、精神分析(精神力動)、ファミリーコンステレーションのように、「手順」よりも支援者の「在り方」や「場づくり」や「相性」に大きく依存するものもあります。それらは実験から客観データをとるエビデンス検証が難しでしょう。

たとえば、ドラマセラピー的な手法の一種では、虐め被害トラウマの方のイメージワークで、セラピストが被害者を守るように「やめろ!」と叫ぶことでトラウマ解消が起きることがあります。実際に起きます。このような手法の場合、セラピストが実際の生活の中で自身の危険をかえりみず痴漢や暴力者を怒鳴りつけて追い払った経験がある人物である場合と、講習会で習った通りその台詞を読み上げるのとでは効果はかなり違います。

つまり「あり方」に大きく依存する手法を「エビデンスがない」という理由で撲滅してしまうと、「あり方」や「場をつくり」の優れたセラピストを撲滅してしまう危険があります。私の知る限りでも「あり方」や「場をつくり」に優れたセラピストが辞めていったケースはあります。これは学術界の教育者の商売にとっては都合がよいかもしれません。

また、ひきこもりの支援では、支援者が会うことすら拒絶されるため、元ひきこもりの人たちが支援者として活躍しているようです。そこには一定の技術や手法があるのですが、これは「誰がやるかが効果に大きく影響している」ことを示唆しますが、「専門知識」よりも「誰がやるか」によって効果が変わることの検証はあまり行われません。

このようにセラピストの実体験、生き様、人柄に成果が大きく依存するような手法や支援は、エビデンスを検証することが難しいです。

だとすると、エビデンス重視の手法というのは、「誰がやっても同じ成果がでる」ということといえるかもしれません。

たとえば、演劇指導を通して効果的に人の心に変容を起すセッショニストもいるかもしれません。というか、いるそうです。ですが、それできるの人は稀です。稀であれば、統計的エビデンスは出ません。行政は心理支援者の量産を目指しているので、行政が「誰がやっても同じ成果がでる」手法を重視するのはわかります。ですが、どの手法も最初は誰かの神業だったのではないでしょうか。悩みの当事者としては、「自分にあった」手法か人に出会えるまで、いろいろ探せる多様性がほしいです。

自分が必要としているのは、技法(手法)か、人か、ということも支援者探しのヒントになりそうです。

Lambert, M.J.が分析した心理療法の成功要因の比率によると、治療関係要因(セラピストとの相性など)は30%、技法要因は15%となっています。

「手順」は評価されやすく、「人間への理解」は評価されにくい

また、手法には、「手順」ではなく「考え方」を示すものもあります。

その視点をもって対話することで成果が出ます。ですが、手順が標準化されないので、検証されずエビデンスのある方法とは認められません。

つまり、「考え方・枠組み・理論」⇒「人間への理解」⇒「臨機応変な対応」というようになっているので、「なにをするか」という手順に相当する部分はケースバイケースとなります。

これは再現性が低い(マニュアル化しにくい)ということであって、有用ではないという意味ではありません。

一方で、筋肉の弛緩や眼球運動など身体にアクセスする手法は「手順」中心なのでエビデンス検証がしやすいです。認知行動療法も「手順」が毎回同じなのでエビデンス検証がしやすいです。

上述の「人に依存する手法」というのは、「関係性」中心なのでエビデンス検証がしにくいという言い方もできるでしょう。

マニュアル化された心理療法の効果を検証することによって、ブランド名をもつ新たな心理療法が決められるという現状に、筆者は納得していない。心理療法の実証研究が重要であることに疑念はないが、臨床試験による効果研究が黄金律として強調されることにより、変容プロセスの理解は遠ざけられてしまった。(中略)心理療法の学派は、学識よりも政治、経済、権力が優勢になりやすい。

『エモーション・フォーカスト・セラピー入門』p.41 レスリー・S・グリーンバーグ

クライアントのモチベーションに依存する手法は統計的に評価されにくい

たとえば、「飲めば痩せるサプリメント」は、100人の痩せたい人に飲んでもらって、何%の人が痩せたかを調べれば効果が評価できるでしょう。

では、食事制限や運動はどうでしょうか? 

100人の人が挑戦。そのうち続かな人が70%、やりきった人は30%。やりきった人のうち90%に効果があった。

この場合、その効果は 90% でしょうか、それとも 30% × 90% = 27% でしょうか?

それは、多くの人にとっては上手くいかない方法(効果がない)ですが、一部のモチベーションの高い人(モデル業とか、合併症が差し迫っている人とか)にとっては90%の効果でしょう。

葛藤を伴う心理療法の場合は、プロセスの途中で心理的抵抗があります。軽く悩んでいる人にとっては効果が得にくい手法ですが、一部のモチベーションが高い人(とても苦しい、このまま人生を終えたくない、大切な人をこれ以上傷つけたくない、などなど)にとっては、とても挑戦しがいのある手法である場合があります。

そのようなハードル高い心理療法などは、エビデンス研究がとても難しくなるでしょう。

となると、安易なエビデンシャリズムによる手法の淘汰をすることは、統計上の成果(件数としての成果)のために、本当に苦しんでいる人や大きな試練を背負っている人のための支援をつぶしてゆくことになります。

たとえば、ワーカホリックで苦しんでいる人の場合、ちょっと苦しんでいる人(あるいは行動変容プロセスの前半の人)は「私は本当は劣等感をハードワークで隠そうとしているのだ」なんて絶対に認めたくないでしょう。しかし、そのせいで我が子までもが苦しんでいると気づいた人(行動変容プロセスの後半の人)などは、「私は本当は劣等感をハードワークで隠そうとしているのだ」くらいのことにはガンガン向き合います。

エビデンスが低いセラピーを撲滅することよりも、誰に向いているのかを分かり易くすることが有益なのではないでしょうか。それを分かり易くするのは統計エビデンスとは限らないです。たった一件の事例でも、「あ、これだ」と試す価値があることが分かることがあります。

他にも、「エビデンスがある」≒「誰かが儲かる/得する」やという傾向が生じる可能性もあります。また、「専門教育を受けた専門家と、短期間の講習で学んだ者のカウンセリングの効果は差がない」というようなことを専門家は証明したがらないかもしれません。

最近は、研究者がデータを見てから都合よいように分析するバイアスを防ぐために、データを見る前に分析法や判断基準を公表しておくということが行われるようになってきているそうです。それだけ利害や思想のバイアスは手ごわいということかと思います。

医学・医療において高度化した科学や技術の自己目的化や自己満足は、<臨床の知>によって初めてチェックすることができるからである。また、それがそのまま、医療を、商業主義と結びついた科学や技術による奴隷状態から、人間の手に、生活世界に取り戻すことにもなるのである。

『臨床の知とはなにか』p.156, 中村雄二郎

エビデンスの安定性

エビデンスのなかった/エビデンスの低かった手法が、後にデータが増えて「エビデンスあり」に変わることはよくあるようです。

データが少ないとエビデンスが出ないからです。(効果がないのではなくて、データがない)

逆にエビデンスがあったものが後に覆ることは少ないのでしょうか?

過去の研究成果をもれなく収集して分析する系統的レビューでエビデンスありとされているものは、覆りにくいとされています。

単一の研究の場合は、他項目に書いたようなバイアスのため、後に覆ることはあるようです。

バイアスに対策(研究方法)も進化しているので、古い研究は覆りやすい傾向があるかもです。

系統的レビューでは各研究のバイアス対策も吟味してまとめているので、新しい系統的レビューでの「エビデンスあり」は覆りにくそうです。

参考リンク

統計について

エビデンス情報源の例

※当サイトの記事には実践経験に基づく意見や独自の経験的枠組みが含まれます。また、全てのケースに当てはまるものではありません。ご自身の判断と責任においてご活用ください。

※当サイトの事例等は事実に基づいてはいますが複数のケースや情報を参考に一般化して再構成、フィクション化した説明目的の仮想事例です。

\(^o^)/

- protected -