ポイント クラスターの検索ツールは、空間分布に基づき周辺ノイズからポイント フィーチャのクラスターを検索します。
例
このツールには、次のような使用例があります。
- 害虫によって媒介される特定の病気を調査している組織が、分析範囲内で害虫の処理と駆除を開始する場所を特定したいと考えています。 分析範囲内で感染している世帯と感染していない世帯を表すポイント データセットがあります。 アナリストは、ポイント クラスターの検索ツールを使用して、感染した世帯の最大クラスターを特定します。
- 自然災害発生後、災害対策機関は救助と避難のためのリソースを配置する場所を決定する必要があります。 アナリストは、ポイント クラスターの検索ツールを使用して、イベントをメンションしている地理位置付きツイートのクラスターを特定します。 組織では、クラスターのサイズと場所をもとに影響を受けているエリアをマッピングし、救助活動に役立てます。
使用上の注意
ポイント クラスターの検索ツールには、入力フィーチャ、クラスターの設定、結果レイヤーの構成が含まれています。
入力フィーチャ
[入力フィーチャ] グループには [入力レイヤー] パラメーターがあります。これは、空間分布に基づいてクラスターにグループ化するポイント フィーチャを含むレイヤーです。
レイヤー名の下にフィーチャの数が表示されます。 この数には、フィルターを使用して削除されたフィーチャを除く、レイヤー内のすべてのフィーチャが含まれます。 [処理範囲] などの環境設定は、フィーチャの数に反映されません。
注意:
Web メルカトルは空間解析に適切な投影法ではありません。 入力レイヤーの空間参照系が WGS 1984 Web メルカトル (球体補正) の場合、解析で弦距離を使用するため、データは地理座標系に変換されます。
クラスター設定
[クラスター設定] グループには、次のパラメーターがあります。
- [クラスタリング方法] は、クラスターの特定に使用する方法を指定します。
- [指定距離 (DBSCAN)] - 指定した検索距離内を検索し、クラスターを特定します。 この方法は、すべての意味のあるクラスターが類似する密度を持っている場合に適しています。
- [自己調整 (HDBSCAN)] - 距離の範囲を使用して、さまざまな密度のクラスターを疎なノイズから分離します。 この方法は、最もデータを必要とするクラスタリング方法のため、検索距離は必要ありません。
- [マルチスケール (OPTICS)] - 近傍間の距離と到達可能性プロットを使用してクラスターを特定します。 この方法では、はじめに、すべてのポイントの最小到達可能性距離を決定します。 最小到達可能性距離とは、あるポイントから、検索で未確認の最近傍までの距離のことです。 すべてのポイントの最小到達可能性距離を決定後、ツールは到達可能性プロットを作成します。 到達可能性プロットは、各ポイントの到達可能性の順序およびその到達可能性距離をプロットし、ポイントのクラスタリング構造を明らかにします。 その後、この方法では [クラスター感度] 値を使用してクラスターを特定します。 HDBSCAN 法と同じように、OPTICS 法でもさまざまな密度のクラスターを特定できます。
- [クラスターあたりの最小ポイント数] は、ポイントのグループをクラスターと見なすために使用するポイントの最小数です。 一般的に、値が小さいほど、より多くのクラスターが検出されます。 この値は、レイヤー内のポイント数以下である必要があります。 サポートされる最小値は 2 です。
- [検索距離] は、考慮する各ポイント周辺の最大距離を指定します。 [クラスタリング方法] 値が [指定距離 (DBSCAN)] の場合、[検索距離] 値は、クラスターに含まれるポイントを検索するための、クラスター内の各ポイント フィーチャ周辺の最大距離になります。 ポイントの最小数が、特定のポイントの検索距離の範囲内にある場合は、そのポイントはコア ポイントとして見なされます。 ポイントの最小数が特定のポイントの検索距離の範囲内にないものの、ポイントがコア ポイントの検索距離の範囲内にある場合は、そのポイントは境界ポイントとして見なされます。 クラスターは、コア ポイントと境界ポイントの両方で構成されます。 [クラスタリング方法] 値が [マルチスケール (OPTICS)] の場合、[検索距離] は到達可能性距離を割り当てるポイントを検索する、各ポイント周辺の最大距離になります。 到達可能性距離とは、あるポイントから、検索で未確認の最近傍までの距離のことです。 ポイントの中心距離内にあるポイントには、到達可能性距離として、その中心距離が割り当てられます。 ポイントの中心距離は、各ポイントから、定義された最小数のフィーチャまで移動するために必要になる距離の計測値です。
- [検索距離単位] は、[検索距離] 値の単位です。
- [時間フィールド] は、各フィーチャのタイムスタンプを含む入力レイヤーのフィールドです。 このパラメーターは、[クラスター分析手法] 値が [指定距離 (DBSCAN)] か [マルチスケール (Optics)] である場合に使用できます。 [時間フィールド] の値が指定されている場合、[検索距離] と [検索距離単位] 値も指定する必要があります。
- [検索時間間隔] は、フィーチャが時空間クラスターを形成するかどうかを決定するために使用される時間間隔です。 検索時間間隔は各フィーチャの時間の前後にまたがります。たとえば、フィーチャの前後 3 日間の検索時間間隔を設定すると、そのフィーチャの時間の 3 日前から 3 日後までのすべてのフィーチャが含まれます。
- [検索時間単位] は、[検索時間間隔] の単位です。
- [クラスター感度] は、到達可能性プロット内のピークの形状 (傾斜角および高さの両方) がクラスターの分離にどのように使用されるかを決定します。 到達可能性プロットは、ポイントの到達可能性の順序およびその到達可能性距離をプロットします。 非常に高い (100 に近い) [クラスター感度] は、到達可能性プロットの最小のピークでさえ、クラスター間の分離として扱います。 非常に低い (0 に近い) [クラスター感度] は、到達可能性プロットの最も急勾配の最高のピークのみを、クラスター間の分離として扱います。 空白のままにすると、ツールは Kullback-Leibler Divergence を使用して感度値を見つけます。
結果レイヤー
[結果レイヤー] グループには次のパラメーターがあります。
- [出力名] は、作成されマップに追加されるレイヤーの名前を決定します。 名前は、一意でなければなりません。 組織内に同じ名前のレイヤーがすでに存在する場合、ツールは失敗し、別の名前を指定するよう求められます。
- [フォルダーに保存] は、結果を保存する [マイ コンテンツ] 内のフォルダーの名前を指定します。
環境
解析環境設定は、ツールの結果に影響する追加パラメーターです。 ツールの解析環境設定には、[環境設定] パラメーター グループからアクセスできます。
このツールでは次の解析環境が適用されます。
出力
ツールはポイント レイヤーを出力します。 [クラスター分析方法] パラメーター値が [自己調整 (HDBSCAN)] または [マルチスケール (OPTICS)] の場合、ツールはチャートを出力します。 すべての [クラスタリング方法] オプションの出力レイヤーには、Cluster ID、Source ID、Color ID フィールドが含まれます。 Cluster ID フィールドは、各ポイントが属するクラスターを特定します。 ノイズ ポイントの値は -1 になります。 Source ID フィールド値は、一意識別子です。 Color ID フィールド値は、ポイントとそのクラスターに割り当てられた色を表します。 出力レイヤーに 9 つ以上のクラスターが含まれる場合は、各色に複数のクラスターが割り当てられます。 ただし、視覚的に区別できるよう、隣接するクラスターには別の色が割り当てられます。 [クラスタリング方法] パラメーター値が [自己調整 (HDBSCAN)] である場合、出力ポイント レイヤーには次の追加フィールドも含まれます。
- Probability は 0 から 1 の間の値で、ポイントが割り当てられたクラスターに存在する可能性を示します。 ノイズ ポイントの値は 0 になります。
- Outlier は 0 から 1 の間の値で、ポイントが自身のクラスター内で外れ値である可能性を示します。 ノイズ ポイントは 1 つのクラスターと見なされます。 値が高いほど、ポイントが外れ値である可能性が高いことを示しています。
- Exemplar は 0 から 1 の間の値で、ポイントがクラスターの最も代表的なポイントであるかどうかを示します。
- Stability は、さまざまな縮尺における各クラスターの持続性を表す値です。 値が大きいほど、より広範な距離縮尺においてクラスターが持続できることを示しています。
[クラスタリング方法] パラメーター値が [マルチスケール (OPTICS)] である場合、出力レイヤーには次の追加フィールドも含まれます。
- Reachability order 解析に対する入力フィーチャの順序を指定します
- Reachability distance 各ポイントと、最も近い未確認の最近傍までの距離です
[クラスター分析方法] パラメーター値が [自己調整 (HDBSCAN)] または [マルチスケール (OPTICS)] の場合、ツールはチャートを出力します。 [マルチスケール (OPTICS)] は、各クラスターの密度を評価する際に使用できる到達可能性プロットを出力します。 [自己調整 (HDBSCAN)] は、フィーチャが割り当てられたクラスターに存在する可能性の分布を表示する、メンバーシップの確率分布チャートを出力します。 チャートを表示するには、[コンテンツ] ツールバーの [チャート] をクリックします。
[時間フィールド] 値が指定されると、出力には、各時空間クラスターの期間を表示するクラスターあたりの期間チャートが含まれます。 チャートを表示するには、[コンテンツ] ツールバーの [チャート] をクリックします。 出力レイヤーには、各ポイントが属するクラスターの期間を集計する、以下のフィールドも含まれます。
- [開始時間] は、フィーチャが属するクラスターの開始時間です。
- [終了時間] は、フィーチャが属するクラスターの終了時間です。
- [平均時間] は、フィーチャが属するクラスターの平均時間です。
- 時間強調
解析に関するその他の詳細については、出力レイヤーのアイテム ページで確認できます。 レイヤーのアイテム ページにアクセスするには、[設定] ツールバーの [解析] をクリックします。 [履歴] をクリックし、ツールの正常な実行を検索してクリックします。 解析の詳細が [結果] タブに表示されます。 出力レイヤーの横にあるオプション ボタンをクリックし、[詳細の表示] をクリックします。
ライセンス要件
このツールには、次のライセンスと構成が必要です。
- Creator または GIS Professional ユーザー タイプ
- 公開者もしくは管理者ロール、またはそれと同等のカスタム ロール
リソース
詳細については、次のリソースをご参照ください。
- ArcGIS Pro の密度ベースのクラスター分析
- ArcGIS REST API のポイント クラスターの検索
- ArcGIS API for Python の find_point_clusters