CARPESでは、データを上図のような3層構造でとらえます。
ランキングデータ : 企業別売上高、商品別利益額などの、あるカテゴリーの比較データ
時系列データ : 個別企業の売上高推移、商品別利益額推移などの、要素別の時系列データ
ネットワークデータ : 企業、商品などの、要素間の関係性を表わすデータ
上記の分類自体は目新しいものではありませんが、通常はそれぞれのデータを独立のデータとして扱っていると思います(図M-2)。しかしそれは誤っているのです。実際はそれぞれのデータは相互に強い関連性を持っており、密接に結合したの階層構造(上図)としてとらえない限り、データを正しく認識することはできないのです。
例えば各企業の売上高データは独立して入るわけではなく、複雑な関係性の中で相互に制約された活動を通した結果、必ずある秩序を持って生成してきます。
3層データモデルでは、
◆1 ランキングデータに接したら、それは関係する多数の時系列データのある時刻までの相互作用の結果として表わされた分布を示していることに注意します。分布データには特有の秩序があります。
◆2 時系列データに接したら、その周りには関係する多数の時系列データが存在し、それらのデータはネットワークから生成されることに注意します。また、ある時刻で多数の時系列データは秩序だった分布となることに注意します。
◆3 ネットワークデータに接したら、そのネットワークの各要素は時系列データを生成し、秩序あるランキングを作ることに注意します。
CARPESでは文章や画像等の非構造化データをそのまま扱うことは出来ません。なんらかの構造化データに変換します。