生データに対して、異常値や欠損値の処理を行い。
データを分析可能な状態にすること。
PR
・質的な変数を、量的な変数として表現するために用いられる変数
・m個のカテゴリーを持つ質的変数に対して、m-1個の変数
x1 , x2 , xm-1で、i番目のカテゴリーに従するとき、xiのみを1、
他を0とする変数
・相関係数では、2つのデータ群に直線的でない関係がある場合、
相関を調べることができない。
・そこで、データの順番を利ヨして、その相関を調べる方法が、
順位相関係数
・次のようなものがある。
〇 スピアマンの順位相関係数
2つのデータ群について、データの小さい方から順に、同じ順位の
データに対して、相関係数を計算する。
〇 ケンドールの順位相関係数
2つのデータ群から、それぞれのデータを取り出し、その大小関係から
係数を計算する。