ヒストグラム

ヒストグラムでは、特定の値がデータセット内に表示される頻度を計測して、連続数値変数の分布を視覚的に集約します。 ヒストグラムの X 軸は、数値範囲 (ビン) に分割された数値ラインです。 ビンごとにバーが描画され、バーの幅はビンの範囲を表し、バーの高さはその範囲内にあるデータ ポイントの数を表します。 データの分布を理解することは、データ探索プロセスにおける重要な足掛かりになります。

次のヒストグラムは、2016 年の米国大統領選挙における投票率の分布を視覚化します。

  • [数値] - 投票率
  • [オーバーレイ] - 平均、正規分布
2016 年の米国大統領選挙における投票率のヒストグラム

データ

[データ] の構成には、ヒストグラムの作成、ビンの数、チャートに表示する統計情報に使用する変数が含まれます。

変数

ヒストグラムでは、X 軸上に 1 つの連続 [数値] 変数が必要です。

解析手法には、データが正規分布していることを必要とするものもあります。 データが偏っている (分布が不均衡) 場合は、データを変換して、正規化できます。 [変換] パラメーターを使用して、チャートに変換を適用できます。 対数変換または平方根変換のいずれかを使用できます。

ヒント:

参考として、[オーバーレイ][正規分布] を選択すると、正規分布オーバーレイをヒストグラムに追加できます。

対数変換

対数変換は、データの分布が正に偏り、大きい値がいくつかある場合によく使用されます。 これらの大きな値がデータセット内にある場合、対数変換を使用して、分散をより一定にし、データを正規化できます。

以下の例は、2016 年の米国大統領選挙の総投票数の分布を示しています。 1 つ目の画像は正に偏っており、変換は適用されていません。 2 つ目の画像は対数変換が適用され、正規分布に近づいたヒストグラムになっています。

対数変換前後の総投票数のヒストグラム

画像変換
画像 1

なし

画像 2

対数

注意:

対数変換は、0 より大きい数値にのみ適用できます。

平方根変換

平方根変換は、データセットの右の歪度を減らした対数変換に似ています。 対数変換とは異なり、平方根変換は 0 に適用できます。

注意:

平方根変換は、0 以上の数値にのみ適用できます。

ビン

ビンのデフォルト数は 32 です。 このデフォルト数は、[データ] タブで [ビン] の値を変更することで調整できます。 クラスを変更すると、データの構造の詳細または概要を確認できます。

[ビンの色] の横にあるカラー パッチを使用し、ヒストグラムのビンの色を変更できます。

オーバーレイ

以下の記述統計が計算され、ヒストグラムの線として表示されます。

  • [正規分布] - データを正規分布と比較するために使用される釣鐘型の曲線
  • [平均] - データセットの平均値を示す 1 本の縦線
  • [中央値] - データセットの中央値を示す 1 本の縦線
  • [標準偏差] - 平均の上下の 1 つの標準偏差の値を示す 2 本の垂直線

オーバーレイをクリックして、オンとオフを切り替えます。 統計の横にあるカラー パッチを使用し、ラインの色を変更できます。

[データ ラベルの表示] パラメーターを使用してラベルをオンにできます。 ラベルは、各ビンの値の数を示します。

統計

選択した数値フィールドには、以下の統計情報が一覧表示されます。

  • 平均
  • 標準偏差
  • 個数
  • 最小
  • 最大
  • 合計
  • Null

[軸] の構成を使用して、X 軸と Y 軸の仕様を変更します。

小数点以下の表示桁数や、桁区切り記号の表示を指定して、X 軸および Y 軸に数値を表示する方法を書式設定できます。

デフォルトの Y 軸範囲は、Y 軸上に表示されるデータ値の範囲に基づいています。 これらの値は、[上限] に値を入力することでカスタマイズできます。 Y 軸の境界を設定すると、チャートの縮尺を一定に保つことができ、値を比較する際に役立ちます。 [リセット] ボタンをクリックすると、軸境界がデフォルト値に戻ります。

ガイド

参照または重要な値をハイライト表示する方法として、ガイドのラインまたは範囲を追加できます。 [ガイドの追加] ボタンをクリックすると、ガイドが Y 軸に追加されます。

ガイドのラインを作成するには、ラインが描画される [開始] 値を入力します。 ガイドの範囲を作成するには、[開始] 値と [終了] 値を入力します。 ガイドのラインまたは範囲の外観を変更することもできます。 ラインの場合、スタイル、幅、色を更新できます。 範囲の場合、塗りつぶし色を更新できます。

必要に応じて、[ガイド名] パラメーターを使用してガイドの名前を変更したり、[ガイドのラベル] パラメーター ([中央値] など) を使用してテキストをガイドに追加したりできます。

[レンダリング] パラメーターの [上] および [下] ボタンを使用すると、ガイドがチャートの上または下のいずれにレンダリングされるかを選択できます。

形式

テキスト エレメントやシンボル エレメントを書式設定することでと、チャートの外観を設定することができます。 チャートの書式設定オプションには次のものがあります。

  • [テキスト エレメント] - チャートのタイトル、X 軸のタイトル、Y 軸のタイトル、凡例のタイトル、説明テキスト、凡例テキスト、軸ラベル、およびデータ ラベルに使用されるフォントのサイズ、色、およびスタイル。 Ctrl キーを押しながらクリックしてエレメントを選択すると、複数のエレメントの形式を一度に変更できます。
  • [シンボル エレメント] - グリッド線および軸線の色、幅、スタイル ([実線][点線][破線]) と、チャートの背景色。

一般

チャートおよび軸のデフォルトのタイトルは、変数名およびチャート タイプに基づいています。 タイトルは、[一般] タブで編集したりオフにしたりできます。 [凡例のタイトル] パラメーターにタイトルを、[説明] パラメーターにチャートの説明を入力することもできます。 説明は、チャート ウィンドウの下部に表示される一連のテキストです。

リソース

チャートについてより詳しく学習するには、次のリソースをご利用ください。