ギフテッドにすり寄る自称高IQ者支援団体の疑似科学性を見破るためのIQリテラシー（２）

f:id:KeiPapa:20191022222145j:plain

前回の記事では一般財団法人高IQ者認定支援機構（HIQA）が開発、使用する「高域知能検査CAMS」の欠陥について、その”標準化”がサンプル抽出時点で既に破綻していることを指摘しました。

www.giftedpower.net

ところで、この団体の理事である前川眞一氏が公表したCAMSに関する統計資料を読んで、「標準化」という文言が一度も出てこないことに気づかれた方がいるかもしれません。心理検査が十分な信頼性と妥当性を確保するために、標準化は欠かせないはずです。それなのに、なぜ「標準化」という言葉が使われていないのでしょうか？

実はこのCAMS、標準化と呼べるまともな手続きを一切行っていないのです！つまり資料の中で「標準化」という言葉を使っていないのは、実際に標準化を行っていないことを反映してのことと考えられます（ある意味正直ですね）。では標準化を行っていないのに、なぜIQが算出できるのでしょうか？その疑似科学的カラクリを、具体的に見ていきましょう。

（以下、ただ「IQ」とある場合は全て偏差型IQ（DIQ）を意味しています）

高IQ者認定支援機構（HIQA）のCAMSはIQを算出していないという事実

一般財団法人高IQ者認定支援機構（HIQA）のサイトにある「IQについて」のページ（https://www.hiqa.or.jp/about-iq）を見ると、以下のような説明が見つかります。

◆「偏差値型IQ（DIQ）」
一方、「偏差値型IQ（DIQ）」は正規分布を利用して算出します。定義の正確性から現在はこちらが主流となっています。例えば、被験者のスコア（検査結果）が完全な正規分布になった場合。99.9パーセンタイル（1,000人に1人出現）がIQ146 sd15（sdについては後述）となります。50パーセンタイル（2人に1人出現）がIQ100sd15となります。

この2種類の算出方法で示されるIQは、それぞれの数値の持つ意味が全く異なるため比較できません。
当機構が実施する知能検査では「偏差値型IQ（DIQ）」を採用しています。

この団体が自ら説明しているように、知能テストにおけるIQ算出の基本原理は、正規分布の利用にあります。ほとんどの知能テストでは、標準化データの合成得点を最終的に平均値100、標準偏差15（ビネー式などでは16）の正規分布へと変換することで、得られた検査結果が「普通からどれくらい違っているか」の解釈を可能にします。中央値である100が、標準化によって定められたその知能テストの「普通の基準」です。そして、そこから数値が離れていくほどに、「普通からは違っている」と判断できることになります。

ところがなんと、CAMSの統計情報のどこを見ても、CAMSの成績を正規分布に変換している部分が見当たりません。「項目反応理論を用いた成績の算出」の項目でCAMSの成績を出した後、やっているのは以下の作業です。

Cattell-CFIT Scale３の成績を持つ 63 名分のデータを用い、算出されたθを CFIT の尺度へ線形等化法を用いて変換した。なお、CFIT の成績は、平均が 100、標準偏差が 15 の尺度へ変換済みのものを用いた。この手続きにより以下の変換式を得た。

IQ = 10ｘθ + 140

いったいこれは何でしょうか？これは２つの異なるテスト間で得点差を調整する、「等化」と呼ばれる作業です。

例えば、検定試験の問題の難易度が毎回違ってしまうと、受けた時期によって同じ得点でも合格できたりできなかったりと、有利不利が生まれてしまいます。こうした問題が起きないように、実施するテスト間での難易度差を考慮して得点調整を行う、この作業が等化です。

しかしこの等化、基本的にテスト項目や評価尺度が同一のテスト間でしか行えません。例えば音楽のテストと数学のテストの点数で”等化”を行うことは、数値計算上は可能ですが、等化の結果調整された点数は、何を意味しているのかわからない数値に化けてしまいます。音楽のスコアで数学のスコアを補正することに妥当性がないからです。

この数値計算上可能であるが意味のわからない等化、それを行っているのがCAMSです。CAMSは一部の受検者に別の知能検査であるCattell CFITのスコアを提出してもらい、CAMSのスコアとの間で”等化”を行っています。そして、その”等化”の結果変換されたCAMSのスコアを”IQ”と称しているのです。

従って、CAMSの”IQ”は、正規分布と標準偏差を用いて算出されるまともな偏差型IQではありません。CAMSの成績をCattell CFITのスコアを元に線形変換した、何を意味するかわからない謎の数値です。上で引用したように、この団体は

当機構が実施する知能検査では「偏差値型IQ（DIQ）」を採用しています。

と宣言していますが、これは明らかな虚偽説明です。

資料をよく読むと、このCattel CFITのスコアを利用したCAMSスコアの"等化"は、本当に意味のわからない、妥当性の欠片もない作業であることがわかります。それを示しているのが次の部分です。

また、IQ と Cattell-CFIT Scale３の散布図を以下に示すが、両者の相関係数は 0.45 であった。

相関係数0.45は、中の下程度の相関関係を示し、強い相関とはまったく言えない数字です。標準化されたまともな知能検査同士で相関を調べると、大抵0.6～0.8程度の相関係数が得られます。例えば田中ビネーVとWISC-IIIは検査内容が結構違いますが、そのIQの相関係数は低い部分で0.58となっています。同じ図形行列推定課題によるテスト同士の相関係数として、0.45は非常に残念な結果と言えるでしょう。
https://www.ritsumeihuman.com/uploads/publication/ningen_06/025-42ohkawa.pdf

この分析を行った前川氏自身は、この0.45という相関に関して

二つのテストが異なる環境で開発された問題で構成され、またその実施環境も異なること等を考慮すれば、この両者はおおむね同じ構成概念を測定していると考えられる。

と述べていますが、この低い相関係数からこんなことが言えるわけがありません。もちろん前川氏がどう考えようと勝手ですが、これは査読論文はおろか学会発表レベルでも多くの人から疑問を投げかけられる考察でしょう。

つまり、この前川氏のCAMS分析ではまともな標準化をしていないことに加え、CAMSと大して相関のないCattell CFITのスコアを使った線形等化で、「何か」を算出しているのです。大して相関のない２つの点数を使って、いったい何が算出できているんでしょうね？しかも、その等化に使われたサンプル数は、全部でたったの63。これは知能検査の標準化においては、あまりに少ないサンプル数です。

高IQに特化したIQ測定を謳うハイレンジIQテストという疑似科学

実は、CAMSがまともな標準化を行わないであろうことは、統計情報公開のずっと前、最初の記事を書いた時点からわかっていました。根拠は、CAMSのIQ測定範囲がIQ115～180sd15と公表されていた点にあります。

既に述べたように、知能検査で重要なのは「普通の基準」の推定であり、この正確な推定なくして正確なIQの推定は不可能です。知能検査における「普通の基準」は中央値、つまりIQ100です。

しかしCAMSでは、そのIQ100が測定範囲に入っていません。まともな標準化、正規分布を利用した偏差型IQの算出を行うのであれば、IQ100が測定できないという事態は絶対にありえません。つまり、IQ100が測定できない知能テストは、まともな知能テストではないと即判断できます。

IQテスト風パズルのジャンルの一つに、「ハイレンジIQテスト」と呼ばれるものがあります。このハイレンジIQテストはどれもIQ160sd15を超えるような高域のIQ測定が可能と主張するIQテストっぽいもので、CAMSもその一種です（CAMSが「高域」知能検査と称するのはこのハイレンジになぞらえたものです）。

しかし、その「標準化」は全て、今回ご紹介したCAMSが行っているのと同じ、他の知能テストの結果を用いた謎の"等化"であり、まともな標準化を行っているものはただの一つもありません。多くのハイレンジテストはCAMSのように「高い推論能力」や「脳の最大出力」を測っていると主張しますが、その検査としての妥当性と信頼性の検証も全く行われていません。

ハイレンジIQテストは1980年代から存在し、それなりの歴史がありますが、これまで知能を含めた心理学研究や、ギフテッドの研究で、全く利用されたことがありません。その理由はもちろん、ここでCAMSを例に説明したように、その知能テストとしての信頼性や妥当性が、まともな標準化と検証によって担保されていないからです。

その証拠に、研究論文などに限定して検索ができるGoogle Scholarで"High range IQ test"と検索してみましょう。引っかかるのは、2019年10月現在、なんとたったの4件。そしてその4件は、どれも査読付き学術論文に掲載されたものではありません。

一方、ただGoogleで"High range IQ test"を検索すると、4万件近くもヒットします。このハイレンジIQテストが、いかに科学の世界で相手にされていないかということが、この数字からハッキリわかると思います。

そもそもCattell CFITの標準化がまともでないという事実

ここまでの情報で、CAMSが知能検査を謳いながらまともにIQを算出していない、疑似科学の産物であることは明らかになったかと思いますが・・・CAMSの信頼性に関してはさらに絶望的な事実があります。CAMSの等化に使われているCattell CFITで算出されるIQ値が、そもそも信頼のおけない数値である可能性が極めて高いのです。

Cattell CFITは現在主流の知能理論であるCHC理論の「最初のC」、キャッテル博士が1960年代に発表した知能テストです。知能を結晶性知能と流動性知能の2因子で説明したキャッテル博士自身の知能理論に基づいて、流動性知能のみを測定することを目標に、知識や文化背景に依存しない（とキャッテル博士は考えたが、後に批判され否定される）図形行列推理を中心に構成されています。

ところが、このCattell CFIT、1960年代に発表され、70年代初頭にマイナーな改訂が行われて以降、一切改訂が行われていません。さらに驚くべきことに、このテストは日本で標準化が行われた形跡が一切ありません。

つまり恐ろしいことに、今日本で実施されているCattell CFITのIQ算出のための標準化データは、50年前（！）にアメリカとイギリスで行われた標準化で作製されたものを、未だに使っていると考えられます。50年前、インターネットも無かった時代のアメリカ人とイギリス人のデータを使って、現代の日本人のIQ値を算出しているということです。それは当然、信頼性のあるスコアにはなり得ません。

実際、ギフテッド児のスクリーニングにおける非言語性知能テストの利用を長年研究しているアイオワ大学のデヴィッド・ローマン博士は、Cattell CFITを” The Culture-Fair Intelligence Test (CFIT; Cattell & Cattell, 1965) is an example of a test with obviously defective norms.”（CFITは標準化データに明らかな欠陥のある検査の一つである）として、ギフテッドスクリーニングにおける利用を批判しています。
https://nrcgt.uconn.edu/wp-content/uploads/sites/953/2015/04/rm05216.pdf
https://www.hmhco.com/~/media/sites/home/hmh-assessments/assessments/cogat/pdf/cogat-cognitively-speaking-v6-winter-2008.pdf?la=en

また、アメリカで2004年に行われたギフテッド児のスクリーニング研究では、Cattell CFITとレーヴン漸進マトリックステスト、そして当時標準化が行われたばかりの言語非依存的知能テストNNAT（Naglieri Nonverbal Abilities Test）の間でスコアの比較を行った結果、Cattell CFITはNNATに比べて平均で17.8ポイントも高いIQ値を出したことが報告されています。
Assessing potentially gifted students from lower socioeconomic status with nonverbal measures of intelligence. - PubMed - NCBI

まとめ

今回の情報公開でも、高IQ者認定支援機構が作成、利用する自称・高域知能検査CAMSは、どんな知能理論に基づくのかという点が明らかにされませんでした。また、その検査内容が人間の知能を測定できているのかとういう信頼性と妥当性の検証も、全くなされていません。

また、以前の記事で既に述べたように、CAMSは図形行列推定課題だけで構成され、良くて知能のほんの一部しか測定していないと考えられます。従って、CAMSは知能理論に基づいて作製されていない、ただの知能テスト風パズルであると考えられます。

さらに、（１）で指摘した通り、CAMSの分析に用いられたサンプルは極端に偏っていて、CAMSの謳う「16歳以上の日本人」の知能を推定するために標準化に用いるサンプルとしては全く妥当性を欠いています。

そして、この記事に書いた通り、CAMSは正規分布を用いたまともな標準化を行っていません。加えてCAMSのスコア算出で利用しているCattell CFITは、50年前からまともに改訂されておらず、日本では正式に標準化された形跡がない知能検査であり、その算出するIQ値の信頼性がそもそも担保されていません。

こうした数々の欠陥を抱えた上で、妥当性皆無の意味のわからない"等化"を経て算出されるCAMSの”IQ”が、何か意味を持つ値になっている可能性は、もはや無いと言ってしまって問題ないと思います。

はっきり言って、CAMSの知能検査としての問題点は、全て紹介しきれていない状態です。人間の知能や知能検査について、ほんの少しでもまともな知識のある人がこの団体にいたならば、これほど杜撰な方法で知能検査を作ってしまうということは、中々考えられません。

やはりこの団体の中には人間の知能や知能検査について、まともな専門知識をもった人はいないということなのでしょう。一般知能gに関するトンデモな記述から、それは明らかでありましたが。

CAMS受検を考える方、そしてこの一般財団法人高IQ者認定支援機構に関わろうとする方は、こうしたことを全てよく吟味の上で、ご検討されることをお勧めします。

最後に

この団体の目的や機構設立の趣旨を読めば、この団体が「高IQ者がこの社会で十分活躍できていない」という問題を既に認識しているのは明らかです。それならば、なぜその認識できている「社会で十分活躍できていない高IQ者」を支援する仕組みづくりに真っ先に取り組まず、頑なにCAMSの実施に固執するのでしょうか？

ここに根拠を示してきた通り、CAMSはその制作段階から欠陥だらけで、正確な高IQの推定などどう頑張っても達成し得ない出来損ないです。IQをまともに算出しないCAMSでは、高IQ者の正確な認定は夢のまた夢であるにも関わらず、どうしてそんな粗悪なテストをわざわざ作成し、受検者から検査料を徴収して実施する必要があるのでしょうか？

どれほどこの団体が高IQ者の支援を声高に叫んだとしても、この現行不一致、活動内容の矛盾に、この一般財団法人高IQ者認定支援機構の本質が表れていると感じます。

それでも、CAMSの吐き出す数値に意味があると信じて、色々な活動を行うのはこの団体の自由です。しかし、それは疑似科学の推進に他なりません。CAMSが算出しているのは、何の意味があるかわからない、まともなIQではない謎の数値です。その数値をIQと称するのは、全く科学的根拠のない、疑似科学以外の何物でもありません。

この団体のCAMSを用いた疑似科学的活動は、IQというもの、ギフテッド、こうした概念が社会に正しく認識されていく上で、妨げになる可能性が危惧されます。今後この団体がどんな活動を行っていくのか、引き続き知能テストモドキCAMSで正確に高IQ者が認定できると主張し、その似非IQを偏差型IQと勘違いさせる現在の方法で疑似科学的活動を進めていくのか、注視していきたいと思います。