国勢調査データDLファイルからQGIS用ファイルへの変換
ダウンロードした国勢調査データ
OpenOfficeで扱うデータファイルは、国勢調査データのうちGIS利用にダウンロードしたファイルで、以下の通りです。- (1)境界データ(地図データ)
- (2)統計データ
- 1)男女別人口総数及び世帯総数
- 2)年齢(5歳階級、4区分)別、男女別人口
- その他
OpenOffice利用
Windows10へのアップグレードでMS-Officeが使えなくなったこともあり、フリーソフトのOpenOfficeを使います。 OpenOfficeを使うには、ダウンロードとインストールが必要です。OpenOfficeのダウンロード&インストール
OpenOfficeは、窓の杜や、公式サイトからダウンロードできます。 インストールもこちらのマニュアルに従えば問題なく進められます。国勢調査データ(txt)ファイルの内容
各データファイルは、txtフィルです。これをOpenOfficeで読み込みます。 具体的には、国勢調査データのうちの「年齢(5歳階級、4区分)別、男女別人口」の茨城県でダウンロードしたファイル「tblT000849C08.txt」をOenOffice Calcで読み込みます。 拡張子が「txt」なので、テキストフィルとして読み込めますが、カンマ区切りにもなっているので、csvとしてインポートします。CSVのOpenOfficeへのインポート
OpenOffiece calcで「ファイル」-「開く」で対象ファイルを指定し、ファイルの種類で「テキストCSV(*.csv;*.txt)」を指定すると、CSVファイルの読込み条件の設定画面が開きます。 「区切りのオプション」で、「カンマ」にチェックして「OK」すれば、csvとしてインポートされます。図 OpenOfficeでのCSVインポート画面
2行目までがヘッダー情報で、3行目移行が統計値データになっています。図 tblT000849C08.txtファイル(国勢調査データファイル)
textファイルからCSVへ
QGISへの読み込みのためヘッダーは、一行にします。 カラムA~Gまでが、エリア等に関する情報で、H以降が統計値データになっています。 日本語表示を利用するため、カラムA~Gまでを2行目にコピーし、一行目を削除しました。図 csvファイルへの変換
これを「名前を付けて保存」で「ファイルの種類」をCSVとすれば、CSVファイルで保存できます。 また、保存する際に、「フィルター設定を編集する」にチェックを入れれば、文字コードの変換も可能です。図 CSV出力時の設定
ちなみに、ShapeファイルをそのままQGISに読み込むので、Shapeファイルに合わせるため、文字コードはそのまま(Windows932=ANSI)でOKです。QGISで、GeoJSONを出力する際に、UTF8に変換することができます。CSVTファイル作成
QGISで読み込むため、txtファイルからcsvファイルを作成すると共に、各カラムのデータタイプ情報用ファイルのcsvtファイルを作成します。 estatサイトでダウンロードした際に、合わせてダウンロードできる定義書「T000849.pdf」をみれば、カラム「G」=「T000849001」からカラム「BO」=「T000849036」までが、統計値と分かります。 カラムAからGまでが「string 」、それ以降が「integer」と記載した一行だけのファイルを作し、csv形式で保存し、あとで、拡張子をcsvtに変更します。図 csvtファイル
shpファイル
ダウンロードした、境界に関する地図データは、ESRIのShapeファイル形式です。 「地図で見る統計データ(統計GIS)」-「境界データダウンロード」から、「境界一覧」で「小地域」を選び、「国勢調査」で年度「2015」を指定して、「小地域(町丁・字等別)」から、更に、「データ形式一覧」でShapeファイルを指定して、最後に県などを選択して、ダウンロードしたものです。 Shapeファイルは以下のファイルで構成されています。図 SahpeFileの構成
このうち、dbfファイルは、属性データ用のdBASEファイルなので、OpenOfficeのBASEでインポートして表示可能です。 dbfファイルをダブルクリックすれば、インポート用のウインドウが開き、文字コードを指定すると、ファイルが表示されます。図 Shapeファイルのなかのdbfファイル
このファイルのKEY_CODEと、上記txtファイルから変換したCSVファイルのKEY_CODEが、図形データのKEY_CODEと結合することになります。 なお、dbfの方の、「KEY_CODE,C,11」のなかで、C,11はデータタイプ(char)と桁数のようです。 ちなみにAcccessでインポートすると、このC,11は表示されません。 このままでQGISに読み込めるため、特に手を加える必要はありませんが、OpenOffice 「ファイル」「名前を付けて保存」では、ファイルの種類で「dBASE」を選択できるので、内容の編集もできそうです。
コメント