Гистограмма

Гистограмма визуально представляет распределение непрерывной числовой переменной, при котором измеряется частота появления в наборе данных сходных значений. По оси х откладываются числовые значения, которые разбиты на диапазоны или интервалы. Каждому диапазону соответствует столбец гистограммы; ширина столбца соответствует величине интервала, а высота представляет собой количество элементов в наборе данных, значения которых попадают в этот интервал. Понимание распределения данных – это важный момент в процессе их изучения.

Пример

На гистограмме ниже показано распределение явки избирателей на выборах 2016 года в США.

  • Число—Явка избирателей
  • Наложения—Среднее, нормальное распределение
Гистограмма явки избирателей на выборах 2016 года в США.

Данные

Настройки вкладки Данные Данные включают переменные, используемые для создания диаграммы, число бинов и статистику, отображаемую на диаграмме.

Переменная

Для построения гистограммы необходима одна непрерывная Числовая переменная по оси x.

Некоторые аналитические методы интерполяции требуют нормального распределения данных. Если данные сдвинуты (распределение несимметрично), вы можете преобразовать данные к нормальному распределению. Преобразования также можно применить к диаграмме с помощью параметра С преобразованиями. Преобразования могут быть логарифмические или квадратного корня.

Подсказка:

Для сравнения вы можете добавить график нормального распределения поверх гистограммы, выбрав Нормальное распределение в разделе Наложения.

Логарифмическое преобразование

Логарифмическое преобразование часто используется, когда данные имеют положительно искаженное распределение и есть несколько больших значений. Если в вашем наборе данных есть эти большие значения, вы можете использовать логарифмическое преобразование, чтобы сделать дисперсию более постоянной и приблизить распределение данных к нормальному.

Приведенные ниже примеры показывают распределение общего числа голосов на выборах в США в 2016 году. Первое изображение имеет положительную асимметрию и не имеет никакого преобразования. На втором изображении применено логарифмическое преобразование, которое дает гистограмме более нормальное распределение.

Гистограммы общего числа голосов с логарифмическим преобразованием и без него

ИзображениеПреобразование
Изображение 1

Нет

Изображение 2

Логарифмическое

Примечание:

Логарифмическое преобразование можно применять только к значениям больше нуля.

Преобразование по методу квадратного корня

Преобразование по методу квадратного корня похоже на логарифмическое тем, что уменьшает правое смещение набора данных. В отличие от логарифмических преобразований, преобразования по методу квадратного корня могут применяться к нулевым значениям.

Примечание:

Преобразование преобразование по методу квадратного корня можно применять только к значениям больше или равно нулю.

Бины

По умолчанию число бинов равно 32. Это можно настроить, изменив значение Бины на вкладке Данные. Изменение количества столбцов позволяют увидеть более или менее детальную структуру ваших данных.

Цвет бинов гистограммы можно изменить с помощью палитры цветов рядом с разделом Цвет бина.

Наложения

Следующие описательные статистические данные вычисляются и отображаются в виде линий на гистограммах:

  • Нормальное распределение - Колоколообразная кривая, используемая для сравнения данных с нормальным распределением.
  • Среднее - Одна вертикальная линия, показывающая среднее значение набора данных.
  • Медиана - Одна вертикальная линия, показывающая медианное значение набора данных.
  • Среднеквадратическое отклонение - Две вертикальные линии, обозначающие значения одного среднеквадратического отклонения выше и ниже среднего значения.

Щелкните наложение, чтобы включить или выключить его. Цвет линии можно изменить с помощью палитры цветов рядом с разделом статистики.

Подписи можно включить при помощи параметра Показать подписи к данным. Надписи указывают количество значений для каждого бина.

Статистика

Для выбранного числового поля перечислены следующие статистические показатели:

  • Среднее
  • Средняя
  • Среднеквадратическое отклонение
  • Строки
  • Количество
  • Минимум
  • Максимум
  • Сумма
  • Значения NULL

Оси

Настройка вкладки Оси Оси используется для изменения характеристик для осей x и y.

Вы можете отформатировать способ отображения числовых значений осей x и y, указав число знаков после запятой и выбрав, нужно ли использовать разделитель разрядов.

Границы по оси Y устанавливаются в соответствии с диапазоном данных по оси Y. Эти значения можно настроить, введя значение Максимальных границ. Задание границы оси y можно использовать для сохранения масштаба вашей диаграммы, подходящего для сравнения. Щелкнув кнопку Сброс, вы вернете ось обратно к значению по умолчанию.

Направляющие

Настройки вкладки Направляющие Направляющие используются для добавления направляющих или диапазонов направляющих на диаграмму.

Направляющие или диапазоны могут быть добавлены на диаграммы для ориентировки или как способ выделить важнейшие значения. Направляющие можно добавить для оси Y, щелкнув кнопку Добавить направляющую.

Чтобы создать направляющую линию, введите значение Начало там, где вы собираетесь ее нарисовать. Чтобы задать диапазон направляющей, укажите значения Начало и Конец. Вы также можете изменить оформление направляющей линии или диапазона. Для линий можно обновить стиль, ширину и цвет. Для диапазонов можно обновить цвет заливки.

Дополнительно вы можете изменить название направляющей с помощью параметра Имя направляющей и добавить текст к направляющей с помощью параметра Надпись направляющей (например, Медиана).

Вы можете выбрать, будет ли направляющая отображаться поверх диаграммы или под диаграммой, используя кнопки Наверху и Внизу в параметре Отображение.

Формат

Настройки вкладки Формат Формат используются для изменения внешнего вида диаграммы путем форматирования текста и символов.

К параметрам форматирования диаграмм относятся следующие:

  • Элементов текста - размер, цвет и стиль шрифта, используемого для заголовка диаграммы, заголовков осей, подписей осей, текста описания, заголовка легенды, текста легенды и подписей данных. Можно изменить формат сразу нескольких элементов, использовав для выбора элементов комбинацию Ctrl+щелчок мыши.
  • Элементы символа - цвет и стиль (Сплошная, Точечная или Штриховка) для линий сетки и осей и цвет фона диаграммы.

Общие

Настройки вкладки Общие Общие используются для обновления заголовков диаграммы, осей и легенды.

Диаграммам и осям присваивается название по умолчанию на основе имен переменных и типа диаграммы. Можно редактировать и выключать заголовки на вкладке Общие. Можно также указать заголовок в параметре Заголовок легенды. Выравнивание легенды можно настроить Справа, Слева, Сверху или Снизу. Вы также можете добавить описание диаграммы в параметре Описание. Описание - это блок текста, появляющийся в нижней части окна диаграммы.

Ресурсы

Изучите следующие ресурсы, чтобы узнать больше о диаграммах: