重要

翻訳は あなたが参加できる コミュニティの取り組みです。このページは現在 96.06% 翻訳されています。

6.4. レッスン: 空間統計

注釈

LinfinitiとS Motala(ケープ半島工科大学)が開発したレッスン

空間統計を使用すると、特定のベクトルデータセットで何が起こっているかを分析して理解できます。 QGISには統計分析のための多くの便利なツールが含まれています。

このレッスンの目標: プロセシングツールボックス 内でQGISの空間統計ツールを使用する方法を知ること。

6.4.1. ★☆☆ (初級レベル) 理解しよう: テストデータセットの作成

ランダムな点群を作成し、作業用のデータセットを取得します。

そのためには、ポイントを作成する領域を定義するポリゴンデータセットが必要になります。

街路でカバーされるエリアを使用します。

  1. 新しいプロジェクトを開始します

  2. roads データセットと、 exercise_data/raster/SRTM/ にある srtm_41_19 (標高データ) を追加します。

    注釈

    SRTM DEMレイヤのCRSは、道路レイヤのCRSとは異なる場合があります。 QGISは両方のレイヤを単一のCRSで再投影しています。次の演習では、この違いは重要ではありませんが、自由に再投影してください(このモジュールの前半で示したように)。

  3. プロセシング ツールボックスを開きます

  4. ベクタジオメトリ ► 最小境界ジオメトリ ツールを使用して ジオメトリタイプ として 凸包 を選択し、すべての道路を囲むエリアを生成します:

    ../../../_images/roads_hull_setup.png

    ご存知のように、出力を指定しない場合、 プロセシング は一時的なレイヤを作成します。レイヤをすぐに、または後の段階で保存するのはあなた次第です。

ランダム点群の作成

  • ベクタ作成 ► レイヤ領域にランダム点群 にあるツールを使って、この領域に最小距離 0.0 のランダムな点を100個作成します:

    ../../../_images/random_points_setup.png

    注釈

    黄色の警告サインは、そのパラメータが距離に関係していることを示しています。アルゴリズムは Bounding geometry レイヤが地理座標系にあることを思い出させているだけです。この例では、このパラメータを使用しないため、無視して構いません。

必要に応じて、生成されたランダム点を凡例の一番上に移動させると見やすくなります:

../../../_images/random_points_result.png

データのサンプリング

ラスタからサンプルデータセットを作成するには、 ラスタ解析 ► ベクタレイヤにラスタ値を付加 アルゴリズムを使用する必要があります。このツールは、ポイントの位置でラスタをサンプリングし、ラスタ内のバンドの数に応じて、新しいフィールドにラスタ値を追加します。

  1. ベクタレイヤにラスタ値を付加 アルゴリズムダイアログを開きます

  2. サンプリングポイントを含むレイヤとして Random_points を選択し、値を取得するバンドとしてSRTMラスタを選択します。新しいフィールドのデフォルト名は rvalue_N です。ここで、 N はラスタバンドの番号です。必要に応じて、プレフィックスの名前を変更できます。

    ../../../_images/sample_raster_dialog.png
  3. 実行 を押します

これで、ラスタファイルからサンプリングされたデータを サンプリングした出力 レイヤの属性テーブルで確認することができます。それらは、選択した名前の新しいフィールドに入ります。

サンプルレイヤはここに示すとおりです:

../../../_images/random_samples_result.png

サンプルポイントは、赤いポイントがより高い高度になるように、「rvalue_1」フィールドを使用して分類されます。

このサンプルレイヤは、残りの統計演習で使用します。

6.4.2. ★☆☆ (初級レベル) 理解しよう: 基本統計

さて、このレイヤに対して基本統計を取得しましょう。

  1. 属性ツールバー にある sum 統計の要約を表示 アイコンをクリックします。新しいパネルがポップアップします。

  2. 表示されたダイアログで、サンプリングした出力 レイヤをソースとして指定します。

  3. フィールドコンボボックスで rvalue_1 フィールドを選択します。このフィールドは、統計情報を計算するフィールドです。

  4. 算出された統計情報で 統計量の出力 パネルが自動的に更新されます:

    ../../../_images/basic_statistics_results.png

    注釈

    editCopy 統計をクリップボードにコピー ボタンをクリックして値をコピーし、結果をスプレッドシートに貼り付けることができます。

  5. 終了したら 統計量の出力 パネルを閉じます

さまざまな統計が用意されています:

個数

サンプル/値の個数

Sum

値を足したもの。

平均値(Mean)

平均(アベレージ)値は、単純に値の合計を値の個数で割ったものです。

中間値

すべての値を最小から最大に並べると、中央値(または、Nが偶数の場合は2つの中央値の平均)が値の中央値になります。

標準偏差(母集団)

標準偏差。値が平均値の周りのどの程度近くに密集しているかの指標を与えます。標準偏差が小さいほど、値が平均値により近づく傾向があります。

最小値

値の最小値です。

最大

値の最大値です。

範囲(Range)

最小および最大値間の差です。

第1四分位

データの第1四分位。

第3四分位

データの第3四分位

欠落(NULL)値

欠落値の個数。

6.4.3. ★☆☆ (初級レベル) 理解しよう: 点間の距離についての統計を計算

  1. 新しい一時的な点レイヤを作成します。

  2. 編集モードに入り、他の点のどこかにある3点をデジタイズします。

    または、先ほどと同じランダム点群生成方法で、3 点だけ指定します。

  3. Save your new layer as distance_points in the format you prefer.

2つのレイヤのポイント間の距離の統計を作成するには:

  1. ベクタ解析 ► 距離行列 ツールを開きます。

  2. 入力レイヤとして distance_points を、ターゲットレイヤとして Sampled Points を選択します。

  3. id フィールドを一意なフィールド参照として設定します

  4. 出力形式 オプションを 距離統計行列 に変更します。

  5. 使用する近傍点の個数 の値を 2 に設定します。

  6. 必要に応じて、出力レイヤをファイルとして保存するか、アルゴリズムを実行して後で一時出力レイヤを保存することができます。

    ../../../_images/distance_matrix_setup.png
  7. 実行 をクリックすると、距離行列レイヤが生成されます。

  8. Open the attribute table of the generated layer: values refer to the distances between the distance_points features and their two nearest points in the Sampled Points layer:

    ../../../_images/distance_matrix_example.png

これらのパラメータにより、距離行列 ツールは、入力レイヤの各ポイントについて、ターゲットレイヤの2つの最も近いポイントとの距離の統計を計算します。出力レイヤのフィールドには、計算された距離の平均、標準偏差、最小値、最大値が格納されます。

さらにテストを行う場合は、出力形式 オプションまたはターゲット点の数を変更するとよいでしょう。

6.4.4. ★☆☆ (初級レベル) 理解しよう: 最近傍解析(レイヤ内)

ポイントレイヤの再近傍解析をするには:

  1. ベクタ解析 ► 最近傍解析 を選びます。

  2. In the dialog that appears, select the Random points layer and click Run.

  3. 結果は、プロセシング 結果ビューア パネルに表示されます。

    ../../../_images/result_viewer.png
  4. 青いリンクをクリックすると、結果の html ページが表示されます:

    ../../../_images/nearest_neighbour_example.png

6.4.5. ★☆☆ (初級レベル) 理解しよう: 加重平均座標

データセットの平均座標を取得するために:

  1. ベクタ解析 ► 加重平均座標(重心の平均)

  2. In the dialog that appears, specify Random points as Input layer, and leave the optional choices unchanged.

  3. 実行 をクリックします。

ランダムサンプルを作成する際に使用したポリゴンの中心座標と比較してみましょう。

  1. ベクタジオメトリ ► 重心

  2. 表示されたダイアログで、入力レイヤとして Bounding geometry を選択します。

ご覧のように、平均座標(ピンクの点)と調査地域の中心(緑の点)は必ずしも一致していません。

図心はレイヤの重心(正方形の重心は正方形の中心)であり、平均座標はすべてのノード座標の平均を表します。

../../../_images/polygon_centroid_mean.png

6.4.6. ★☆☆ (初級レベル) 理解しよう: 画像ヒストグラム

データセットのヒストグラムは、その値の分布を示しています。 QGISでこれを示す最も簡単な方法は、画像ヒストグラムを使用することです。これは、任意の画像レイヤ(ラスタデータセット)の レイヤプロパティ ダイアログで利用できます。

  1. レイヤ パネルで srtm_41_19 レイヤを右クリックします

  2. プロパティ を選びます

  3. ヒストグラム タブを選択します。グラフィックを生成するには、 ヒストグラムの計算 ボタンをクリックする必要がある場合があります。ラスタ値の度数分布を示すグラフが表示されます。

    ../../../_images/histogram_export.png
  4. グラフは fileSave プロットの保存 ボタンで画像としてエクスポートすることができます

  5. レイヤに関するより詳細な情報は、 情報 タブで見ることができます(平均値と最大値は推定値であり、正確でない可能性があります)。

平均値は「332.8」(推定324.3)、最大値は「1699」(推定1548)!ヒストグラムを拡大できます。値が「0」のピクセルがたくさんあるため、ヒストグラムは垂直方向に圧縮されたように見えます。ズームインして「0」のピーク以外のすべてをカバーすると、詳細が表示されます:

../../../_images/histogram_export_zoom.png

注釈

平均値と最大値が上記と同じでない場合は、最小値/最大値の計算が原因である可能性があります。 シンボロジ タブを開き、 最小 / 最大値設定 メニューを展開します。 radioButtonOn 最小/最大 を選択し、 適用 をクリックします。

ヒストグラムは、値の分布を示すものであり、必ずしもすべての値がグラフ上に表示されるわけではないことに留意してください。

6.4.7. ★☆☆ (初級レベル) 理解しよう: 空間補間

Let's say you have a collection of sample points from which you would like to extrapolate data. For example, you might have access to the Sampled points dataset we created earlier, and would like to have some idea of what the terrain looks like.

  1. まず、 プロセシングツールボックス にある GDAL ► ラスタ解析 ► グリッド(最近傍探索IDW) ツールを起動します。

  2. 入力レイヤ(点)Sampled points を選びます

  3. 重み付けの累乗`を ``5.0` に設定します

  4. 詳細パラメータ で、 内挿するZ値の属性(フィールド)rvalue_1 に設定します

  5. 最後に 実行 をクリックし、処理が終了するまで待ちます

  6. ダイアログを閉じます

これは、元のデータセット(左)とサンプルポイントから構築されたデータセット(右)の比較です。サンプルポイントの位置がランダムであるため、見た目が異なる場合があります。

../../../_images/interpolation_comparison.png

ご覧のとおり、地形の詳細な印象を得るには、100個のサンプルポイントでは十分ではありません。これは非常に一般的な考え方ですが、誤解を招く可能性もあります。

6.4.8. ★★☆ (中級レベル) 自分でやってみよう: 補間方法の違い

  1. 上記の手順を使用して、10000個のランダムな点のセットを作成します

    注釈

    点の個数が多い場合、処理に時間がかかることがあります。

  2. これらの点を利用して、オリジナルのDEMをサンプリングします

  3. このデータセットには Grid (IDW with nearest neighbor searching) ツールを使用します。

  4. 累乗スムージング をそれぞれ 5.02.0 に設定します。

結果(ランダムな点の位置に応じて)多かれ少なかれ、このようになります。

../../../_images/interpolation_comparison_10000.png

これは、サンプルポイントの密度が高いため、地形をより適切に表現できます。サンプルが大きいほど良い結果が得られることを忘れないでください。

6.4.9. 結論

QGISには、データセットの空間統計プロパティを分析するためのツールがいくつかあります。

6.4.10. 次は?

ベクタ解析について説明しましたが、次はラスタで何ができるかを見てみましょう。これが次のモジュールで行うことです!