ランキング分析


ランキングデータ作成

CARPESでは、比較データは通常はランキングデータ(値の大きな順に並べる)として扱います。なお、検討ケースによってはヒストグラムを使った分布データとして扱う場合もあります。

 

図R-1 ランキングデータ

パレート分析

一般に行われているパレート分析も行います。

 

図R-2 パレート分析

データ秩序特性分析

ランキングデータ全体を支配する秩序の特性を明らかにするために、ランキンググラフを両対数グラフに変換します。グラフに現れる

◆直線の数

◆直線の傾き

から、このデータ群の秩序特性を分析します。

 

注 : 秩序特性の理解に対数の知識は必要ありません!

 

データ全体の構造(秩序)

部分的な構造(秩序)


この例では

◆データ全体を縛り付ける直線があるように見えます。

◆その直線は底辺とのなす角度≒45度となっています。

データ同士に特別な関係があることを示唆しています。

部分的に見ると2本の直線があるようにも見えます。

上位の直線の角度<45度であり、下位とは異なる関係があることを示唆しています。


図R-3 データ秩序特性分析

データ秩序特性変化分析

図R-4は、異なるタイミングでのランキングを同じグラフで並べてみたイメージです。異なる時間断面での変化を考えると、直線は以下の3種の動きの可能性(合成も含む)があることがわかります。

◆平行移動

◆急勾配

◆緩勾配

この動き方から、データ相互の秩序の変化をとらえることができます。

 

注: 理論的に平行移動回転運動の合成で変化します。

 

平行移動

急勾配

緩勾配


図R-4 データ秩序特性変化分析

最高桁数字頻度分析(ベンフォード分析)

特殊なランキング分析の一種ですが、各データの最高桁数字(例:データが3.14であれば”3”、12,345であれば”1”)の出現頻度に着目した分析です。自然な状態であれば数字の出現頻度は理論的に図R-5のように、”1”が最も出現頻度が高く、”9”が最も低くなります。実データの数字の出現頻度(例:某社の財務諸表データ)は図R-6のようになりますので、理論的出現頻度との差異パターンを評価します。データが操作されていると理論パターンから乖離するので、この分析は、データの信憑性を判断するのに有効です。

 

注 : この法則をベンフォードの法則といいます。  

理論的数字出現頻度

図R-5 ベンフォード理論値                  (横軸:最高桁数字、縦軸:出現頻度)

実データの数字出現頻度(例)

このデータは粉飾が発覚した某社の財務諸表データの分析です。理論パターンからの乖離が明らかです。

図R-6 実データの数字出現頻度(例)