CARPESでは、比較データは通常はランキングデータ(値の大きな順に並べる)として扱います。なお、検討ケースによってはヒストグラムを使った分布データとして扱う場合もあります。
図R-1 ランキングデータ
一般に行われているパレート分析も行います。
図R-2 パレート分析
ランキングデータ全体を支配する秩序の特性を明らかにするために、ランキンググラフを両対数グラフに変換します。グラフに現れる
◆直線の数
◆直線の傾き
から、このデータ群の秩序特性を分析します。
注 : 秩序特性の理解に対数の知識は必要ありません!
この例では
◆データ全体を縛り付ける直線があるように見えます。
◆その直線は底辺とのなす角度≒45度となっています。
データ同士に特別な関係があることを示唆しています。
部分的に見ると2本の直線があるようにも見えます。
上位の直線の角度<45度であり、下位とは異なる関係があることを示唆しています。
図R-3 データ秩序特性分析
図R-4は、異なるタイミングでのランキングを同じグラフで並べてみたイメージです。異なる時間断面での変化を考えると、直線は以下の3種の動きの可能性(合成も含む)があることがわかります。
◆平行移動
◆急勾配
◆緩勾配
この動き方から、データ相互の秩序の変化をとらえることができます。
注: 理論的に平行移動と回転運動の合成で変化します。
図R-4 データ秩序特性変化分析
特殊なランキング分析の一種ですが、各データの最高桁数字(例:データが3.14であれば”3”、12,345であれば”1”)の出現頻度に着目した分析です。自然な状態であれば数字の出現頻度は理論的に図R-5のように、”1”が最も出現頻度が高く、”9”が最も低くなります。実データの数字の出現頻度(例:某社の財務諸表データ)は図R-6のようになりますので、理論的出現頻度との差異パターンを評価します。データが操作されていると理論パターンから乖離するので、この分析は、データの信憑性を判断するのに有効です。
注 : この法則をベンフォードの法則といいます。
図R-5 ベンフォード理論値 (横軸:最高桁数字、縦軸:出現頻度)
このデータは粉飾が発覚した某社の財務諸表データの分析です。理論パターンからの乖離が明らかです。
図R-6 実データの数字出現頻度(例)