Гистограмма пример
МИБИФ и Ивановский региональный центр информатизации Высшей школы, http://www.mibif.ru
Графики и схемы
Гистограмма
Что такое гистограмма?
Гистограмма, которую также называют распределением частот, — это визуальное изображение распределения данных (например, рост 36 служащих в дюймах). Информация на гистограмме изображается с помощью серии прямоугольников или полос одинаковой ширины. Высота этих полос указывает количество данных в каждом классе.
Частотность событий указывается по вертикальной оси, а группа данных, или классы, указываются по горизонтальной оси. Чтобы провести оценку гистограммы, мы должны знать центральную тенденцию, а также рассеивание данных.
Измерение центральной тенденции
- Середина (среднее значение) — сумма всех измеренных или подсчитанных данных, разделенная на общее количество данных; например, складываем все данные, получаем 2482, делим на 36 и получаем 68.9 дюймов.
- Значение, наиболее часто повторяющееся в необработанных данных. В нашем примере это 70 дюймов. Если данные представлены в виде групповой частотности, то мы говорим о модальном классе. Модальный класс — это интервал с наиболее высокой частотностью. В данном примере модальный класс составляет 68.5 — 71.5.
- Медиана — середина всех измеренных или подсчитанных данных (если четное количество данных, то медиана будет дробной); например, в нашем примере с 36 измерениями значением медианы является среднее значение тех измерений, которые находятся в середине (69+70=139, делим на 2, получаем 69.5 дюймов).
Измерение рассеивания
- Диапазон — максимальное значение минус минимальное значение.
- Стандартное отклонение (СО) — измерение, которое показывает на сколько широко рассеялся какой-то набор данных от середины. К стандартному отклонению относятся все данные. Оно намного менее восприимчиво к добавлению других данных, чем диапазон, и поэтому, это более надежный способ измерения отклонения.
Высота служащих для составления гистограммы
Служащий | высота (дюйм) | Служащий | высота (дюйм) | Служащий | высота (дюйм) |
ТК | 64 | СТ | 69 | ШП | 68 |
ВШ | 63 | РМ | 71 | РС | 72 |
ТК | 66 | СТ | 73 | ШП | 75 |
ВШ | 73 | РМ | 62 | РС | 76 |
ТК | 60 | СТ | 70 | ШП | 69 |
ВШ | 67 | РМ | 65 | РС | 70 |
ТК | 68 | СТ | 72 | ШП | 72 |
ВШ | 70 | РМ | 63 | РС | 70 |
ТК | 65 | СТ | 73 | ШП | 76 |
ВШ | 61 | РМ | 74 | РС | 73 |
ТК | 66 | СТ | 70 | ШП | 65 |
ВШ | 76 | РМ | 66 | РС | 69 |
Чем полезна гистограмма?
Не всегда легко просмотреть измеренные данные и определить образцы или проанализировать то, что нам сообщают эти данные. Гистограмма может предоставить информацию о степени разнородности данных и указать образец распределения. Рисуя кривую линию по верхушкам полосок гистограммы, мы можем получить общую картину.
Рассеивание данных может привести к большому разнообразию гистограмм, в зависимости от того процесса или объекта, по которому вы собрали данные. Далее предлагаются некоторые типичные виды гистограмм.
Виды гистограмм
![]() |
![]() |
![]() |
![]() |
- Симметричная (пример А)
Большинство значений находятся по обе стороны от центра распределения (центральной тенденции) с отклонением, сбалансированным по обе стороны от центра. - С наклоном (пример Б)
Большинство значений находятся слева от центральной тенденции. Такой тип распределения данных может произойти, если есть естественное препятствие, или в случаях сортировки данных (товары, которые не соответствуют определенному стандарту, удаляются из набора данных). - Асимметричная (пример В)
На таком графике имеется длинный «хвост» по одну сторону от центральной тенденции. По одну сторону имеется больше отклонений, чем по другую, указывая на то, что в течение процесса произошел сдвиг некоторых переменных значений. - Двухмодальная (пример Г)
В двух модальном типе имеется две вершины. Это обычно происходит, когда смешиваются две различные группы данных (категория невысоких людей смешивается с категорией очень высоких людей). В действительности, мы имеем две гистограммы, объединенные вместе.
Как построить гистограмму?
Чтобы построить гистограмму, нарисуйте горизонтальную и вертикальную оси. Горизонтальная ось (Х) отображает интервалы; вертикальная ось (Y), отображает частоты. Нарисуйте полоску, представляющую собой частотность данных в каждом классе. Полоски должны соприкасаться друг с другом.
Ширина класса (H) используется для подсчет аширины полос. Она подсчитывается делением диапазона на класс. |
H=R/K |
H=16/6 H=2.6 округленно = 3 |
||
Чтобы начать построение гистограммы, установите начальную точку для первого класса. Она подсчитывается вычитанием из минимальной единицы данных одного измерения, поделенного на 2. |
Единица измерения (М) min=M/2 |
60-1/2=59.5 |
||
Теперь, когда установлено ограничение для первого класса, постройте таблицу частотности с тремя колонками. |
Границы класса |
Опознава- |
Частот- |
|
Чтобы заполнить первую колонку, прибавьте к начальной точке класса ширину класса (H) |
59.5+М |
59.5+3 ширина класса — 59.5 – 62.5 62.5 – 65.5, и т.д. |
Чтобы заполнить вторую колонку, вернитесь к первоначальному набору данных. Присвойте опознавательный ярлык тем данным, которые попадают в границы каждого класса. Введите общую частотность в третью колонку. |
Границы класса |
Опознава- |
Частот- |
|
59.5 – 62.5 |
||||
62.5 – 65.5 |
||||
65.5 – 68.5 |
||||
68.5 – 71.5 |
||||
71.5 – 74.5 |
||||
74.5 – 77.5 |
Когда использовать гистограмму?
Гистограмму можно использовать в этапе «Текущая ситуация» в главе «Изложение УК», когда мы хотим получить точную картину рассеивания или распространения данных.
Версия для печати
Добавить комментарий