はじめに
クラスター分析とは、データに基づき、似たようなものを分類するという多変量解析の1つです。
このクラスター分析の例として、都道府県に関して、分析してみました。
分析
データ
データとしては、県民経済計算(2008SNA、平成23年基準計数)の経済活動別県内総生産(実質:連鎖方式)の平成30年度データを用いています。
産業の区分としては、次のような区分で、それぞれで比率をとっています。
・農業
・林業
・水産業
・鉱業
・製造業
・電気業
・ガス・水道・廃棄物処理業
・建設業
・卸売業
・小売業
・運輸・郵便業
・宿泊・飲食サービス業
・通信・放送業
・情報サービス・映像音声文字情報制作業
・金融・保険業
・住宅賃貸業
・その他の不動産業
・専門・科学技術、業務支援サービス業
・公務
・教育
・保健衛生・社会事業
・その他のサービス
結果
ユークリッド距離で、ウォード法にて、計算した結果(デンドログラム)は、次の通りです。
細かな分析はしませんが、例えば、
・東京都・大阪府・福岡県は似ている
など、納得がいくものもあれば、
・北海道・高知県・沖縄県は似ている
というように、意外な感じもする場合もあったりもします。