コラム

定量的な分析手法について

定量的分析については統計学に関するテキストをはじめ、各種参考資料が存在しています。ここでは、社会的インパクト・マネジメントにおいて活用頻度が高いと思われる4つの例を紹介します。

i カイ二乗検定(独立性の検定)

 クロス集計表に示した2変数間の関連性を検定する方法の1つとして「カイ二乗検定」があります。具体的には、帰無仮説を立て、これを棄却することで統計的に2変数間の関連や差を照明するための方法です。

 例えば「定期的な運動の有無」と「今シーズン風邪をひいたか」の関連をクロス集計表に示した場合の帰無仮説(対立仮説)が次のようになります。

・帰無仮説:定期的な運動の有無と今シーズン風邪をひいたかどうかの間に関連はない(2変数は独立である)

・対立仮説:定期的な運動の有無と今シーズン風邪をひいたかどうかの間には関連がある(2限数の間には何らかの関連がある)

 これについて仮説検定を行い、p値が有意水準以下になれば(一般的には5以下)、帰無仮説を棄却し、対立仮説を採択することができます(つまり、上記の例でいえば、定期的な運動の有無と今シーズン風邪をひいたかどうかの間には何らかの関連があると言えます)。

ⅱ t検定(平均値の比較)

 2つの独立した母集団があり、それぞれの母集団から抽出した標本の平均に差があるかどうかを検定します。これを「2標本t検定」といいます。なお、この「2標本t検定」は「対応のないデータの場合」と「対応があるデータの場合」の2つに区別されます。

(1)対応のないデータの場合

 異なる対象から抽出された2つの標本は「対応のないデータ」です。例えば、100人の対象をA群(50人)とB群(50人)に分けてあるテストを実施し、この2つの群でテストの平均点を比較する場合などはこの「対応のないデータの場合」に該当します。

 例えば、介入(事業実施)群と非介入(コントロール)群の間でアウトカムの達成度合いを比較する場合などが想定できます。

(2)対応のあるデータの場合

 同じ対象から抽出された2つの標本は「対応のあるデータ」です。例えば、100人の対象にあるテストを実施し、一定期間経過後(例えば3か月後など)、同じ対象(同じ100人)に同じテストを実施し、前後比較を行う場合などはこの「対応のあるデータの場合」に該当します。

 例えば、介入(事業実施)前後でのアウトカムの達成度合いを比較する場合などが想定できます。

※ 以上のようにt検定は「2つの標本」を比較する際に用いる分析方法であるため、「3つ以上の標本」を比較したい場合は分散分析・多重比較を用います(これらの説明は割愛させて頂きます)。

ⅲ 相関分析

 例えば「1週間の勉強時間」と「あるテストの点数」といったような2つの変数間の関係性の強さを調べます。なお、相関係数が取り得る値の範囲は-1から+1までで、+1に近いほど正の相関(どちらか一方の変数の値が増えれば、もう一方の変数の値も増える)が強く、-1に近いほど負の相関(どちらか一方の変数の値が増えれば、もう一方の変数の値は減る)が強くなります。

 なお、一般的に相関係数の値と相関関係の強さは次のように示されます。

0.7~1=かなり強い相関がある

0.4~0.7=やや相関がある

0.2~0.4=弱い相関がある

0~0.2=ほとんど相関なし

 例えば、介入(事業実施)度とアウトカム達成度の関係性の強さを調べる場合などが想定できます(Step5のコラム:フィデリティ尺度の分析例を掲載)。

ⅳ 回帰分析

 2つの定量的な変数の関係をy=ax+bで求めます。なお、傾きにあたるaを回帰係数、y=ax+bという式を回帰式といいます。

例えば、勉強時間からテストの点数を予測する式を立てることに対応します。この場合の「勉強時間」のように何かの要因となる変数を「独立変数」、テストの変数のように独立変数に従って変わる変数を「従属変数」といいます(なお、勉強時間(独立変数)が30分長くなるとテストの点数(従属変数)は3点増加する、これを傾きといいます)。

 例えば、介入(事業実施)が及ぼすアウトカムへの影響力を調べる場合などが想定できます。なお、複数の独立変数を設定して行う回帰分析のことを「重回帰分析」といい、分析に投入された複数の独立変数は互いにその影響力を統制(コントロール)し合うことが知られています。そのため、重回帰分析は「性別」や「年齢」といった「介入(事業実施)」以外の要因を統制(コントロール)して「介入(事業実施)が及ぼすアウトカムへの影響」を調べたい場合などに用いられます。

TOPに戻る