Описательные статистики. Статистика

Дата проведения __________

Тема урока: Среднее арифметическое, размах и мода.

Цели урока: повторить понятия таких статистических характеристик, как среднее арифметическое, размах и мода, формировать умение находить средние статистические характеристики различных рядов; развить логическое мышление, память и внимание; воспитать в детях исполнительность, дисциплинированность, усидчивость, аккуратность; развить в детях интерес к математике.

Ход урока

    Организация класса

    Повторение ( Уравнение и его корни)

Дайте определение уравнения с одной переменной.

Что называют корнем уравнения?

Что значит решить уравнение?

Решить уравнение:

6х + 5 =23 -3х 2(х - 5) + 3х =11 -2х 3х - (х - 5) =14 -2х

    Актуализация знаний повторить понятия таких статистических характеристик, как среднее арифметическое, размах, мода и медиана.

Статистика - это наука, занимающаяся сбором, обработкой, анализом количественных данных о разнообразных массовых явлениях, происходящих в природе и обществе.

Среднее арифметическое - это сумма всех чисел разделенная на их количество. (Среднее арифметическое называют средним значением числового ряда.)

Размах ряда чисел – это разность между наибольшим и наименьшим из этих чисел.

Мода ряда чисел – это число, которое встречается в данном ряду чаще других.

Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а с четным числом членов называется среднее арифметическое двух чисел, записанных посередине.

Слово статистика переводится с латинского языка status- состояние, положение вещей.

Статистические характеристики: среднее арифметическое, размах, мода, медиана.

    Усвоение нового материала

Задание №1: 12 семиклассников попросили отметить время (в минутах) затраченное на выполнение домашнего задания по алгебре. Получили следующие данные: 23,18,25,20,25,25,32,37,34,26,34,25. Сколько минут в среднем учащиеся потратили на выполнение домашнего задания?

Решение: 1) найдем среднее арифметическое:

2) найдем размах ряда: 37-18=19 (мин)

3) мода 25.

Задание №2: В городе Счастливом ежедневно измеряли в 18 00 температуру воздуха (в градусах Цельсия в течении 10 дней в результате чего была заполнена таблица:

Т ср = 0 С,

Размах = 25-13=12 0 С,

Задание №3: Найти размах чисел 2, 5, 8, 12, 33.

Решение: Наибольшее число здесь 33, наименьшее 2. Значит, размах составляет: 33 – 2 = 31.

Задание №4: Найдите моду ряда распределения:

а) 23 25 27 23 26 29 23 28 33 23 (мода 23);

б) 14 18 22 26 30 28 26 24 22 20 (моды: 22 и 26);

в) 14 18 22 26 30 32 34 36 38 40 (моды нет).

Задание №5 : Найти среднее арифметическое, размах и моду ряда чисел 1, 7, 3, 8, 7, 12, 22, 7, 11,22,8.

Решение: 1) Чаще всего в этом ряде чисел встречается число 7 (3 раза). Оно и является модой данного ряда чисел.

    Решение упражнений

А) Найдите среднее арифметическое, медиану, размах и моду ряда чисел:

1) 32, 26, 18, 26, 15, 21, 26;

2) 21, 18, 5, 25, 3, 18, 5, 17, 9;

3) 67,1 68,2 67,1 70,4 68,2;

4) 0,6 0,8 0,5 0,9 1,1.

Б) Среднее арифметическое ряда, состоящего из десяти чисел, равно 15. К этому ряду приписали число 37. Чему равно среднее арифметическое нового ряда чисел.

В) В ряду чисел 2, 7, 10, __, 18, 19, 27 одно число оказалось стертым. Восстановите его, зная, что среднее арифметическое этого ряда чисел равно 14.

Г) Каждый из 24 участников соревнований по стрельбе произвел по десять выстрелов. Отмечая всякий раз число попаданий в цель, получили следующий ряд данных: 6, 5, 5, 6, 8, 3, 7, 6, 8, 5, 4, 9, 7, 7, 9, 8, 6, 6, 5, 6, 4, 3, 6, 5. Найдите для этого ряда размах и моду. Что характеризует каждый из этих показателей.

    Подведение итогов

Что такое среднее арифметическое? Мода? Медиана? Размах?

    Домашнее задание:

164(задание на повторение), стр36-39 читать

167(а,б), №177, 179

Среднее арифметическое

Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых.

Определить сколько деталей в среднем изготовили рабочие за смену:

(23+20+25+20+23+25+35+37+34+23+30+29):12=324:12=27(мин)

27 -среднее арифметическое рассматриваемого ряда.

Размах

Размахом ряда чисел называется разность между наибольшим и наименьшим из этих чисел.

Размах = наибольшее число – наим еньшее число

Наибольшее количество деталей 37

Наименьшее – 20 деталей

Размах = 37 – 20 = 17 деталей.

Мода

Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.

23; 20; 25; 20; 23; 25; 35; 37; 34; 23; 30; 29

Часто встречается число - 23

23 – мода рассматриваемого ряда.

Медиана – число, которое разделяет набор чисел на две части, одинаковые по численности.

Алгоритм нахождения медианы набора чисел:

Упорядочить числовой набор (составить ранжированный ряд).

Одновременно зачеркиваем “самое большое” и “самое маленькое” числа данного набора чисел до тех пор, пока не останется одно число или два числа.

Если осталось одно число, то оно и есть медиана.

Если осталось два числа, то медианой будет среднее арифметическое двух оставшихся чисел.

23; 20; 25; 20; 23; 25; 35; 37; 34; 23; 30; 29

20; 20 ; 23 ; 23 ; 23 ; 25; 25; 29 ; 30 ; 34 ; 35; 37

Медиана этого ряда: (25+25): 2=25.

Среднее арифметическое, размах и мода, медиана.

Проведя учет деталей, изготовленных за смену рабочими одной бригады, получили такой ряд данных:

23; 20; 25; 20; 23; 25; 35; 37; 34; 23; 30; 29

Задания для самостоятельного решения

Записан рост (в сантиметрах) пяти учащихся: 158, 166, 134, 130, 132. На сколько отличается среднее арифметическое этого набора чисел от его медианы?

В течение четверти Ира получила следующие отметки по математике: три «двойки», две «тройки», десять «четверок» и пять «пятерок». Найдите сумму среднего арифметического и медианы ее оценок.

Записан рост (в сантиметрах) пяти учащихся: 149, 136, 163, 152, 145. Найдите разность среднего арифметического этого набора чисел и его медианы?

Записан возраст (в годах) семи сотрудников: 25, 37, 42, 24, 33, 50, 27. На сколько

отличается среднее арифметическое этого набора чисел от его медианы?

Курс доллара в течение недели: 30,48; 30,33; 30,45; 30,28; 30,37; 30,29; 30,34. Найдите медиану этого ряда.

Каждые полчаса гидролог замеряет температуру воды в водоеме и получает

следующий ряд значений: 12,8; 13,1; 12,7; 13,2; 12,7; 13,3; 12,6; 12,9; 12,7; 13; 12,7. Найдите медиану этого ряда.

Стоимость мясных блюд в кафе представляет ряд: 198; 214; 222; 224; 229; 173; 189. Найдите разницу между средним арифметическим и медианой этого ряда.

Учащимися класса за контрольную работу по алгебре были получены оценки:

3; 4; 4; 4; 2; 5; 5; 5; 3; 3; 4; 3; 3; 5; 4. Найдите разницу между средним арифметическим и медианой этого ряда.

Температура воздуха в Москве в течение недели представляла ряд 23, 25, 27, 24, 21, 28, 27 градусов ниже нуля. Найдите сумму медианы и размаха этого ряда чисел.

На соревнованиях по стрельбе учащимися 9 класса были показаны результаты,

представляющие ряд 82, 49, 61, 77, 58, 42 очков. Найдите среднее арифметическое этого ряда чисел.

Продажа фруктов в магазине за неделю представляет ряд 345, 229, 456, 358, 538, 649, 708 кг в день. Найдите разницу между медианой и средним арифметическим этого ряда чисел.

Повышение цен на некоторые продукты представляет собой ряд 3,4; 6,5; 2,8; 3,7; 5,1; 4,1; 5,9 процентов. Найдите разницу между медианой и размахом этого ряда чисел.

В транспортном агентстве в течение 6 дней фиксировалось количество заказов на доставку груза. Получили следующий ряд данных: 40, 41, 39, 36, 41, 31. На сколько отличается мода этого набора чисел от его среднего арифметического?

Игрок в боулинг сделал 5 бросков и выбил 8, 9, 7, 10, 6 кеглей. Найдите среднее

арифметическое этого ряда чисел.

Средняя температура в январе –18 градусов, в феврале –15 градусов, в марте –7 градусов, в апреле +12 градусов. Найдите среднее арифметическое этого ряда чисел.

Ответы

7,85

30,34

12,8

0,2

61,5

0,4

При изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определённый день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25. При изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определённый день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.


Среднее арифметическое ряда. Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых. Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых.():12=27


Размах ряда. Размахом ряда называется разность между наибольшим и наименьшим из этих чисел. Размахом ряда называется разность между наибольшим и наименьшим из этих чисел. Наибольший расход времени равен 37 мин, а наименьший – 18 мин. Найдём размах ряда: 37 – 18 = 19(мин)


Мода ряда. Модой ряда чисел называется число, которое встречается в данном ряду чаще других. Модой ряда чисел называется число, которое встречается в данном ряду чаще других. Модой нашего ряда является число – 25. Модой нашего ряда является число – 25. Ряд чисел может иметь более одной моды, а может не иметь. 1) 47,46,50,47,52,49,45,43,53,53,47,52 – две моды 47 и 52. 2) 69,68,66,70,67,71,74,63,73,72 – моды нет.


Среднее арифметическое, размах и мода, находят применение в статистике – науке, которая занимается получением, обработкой и анализом количественных данных о разнообразных массовых явлениях, происходящих в природе и обществе. Среднее арифметическое, размах и мода, находят применение в статистике – науке, которая занимается получением, обработкой и анализом количественных данных о разнообразных массовых явлениях, происходящих в природе и обществе. Статистика изучает численность отдельных групп населения страны и её регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и т. п. Статистика изучает численность отдельных групп населения страны и её регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и т. п.


1. Найдите среднее арифметическое и размах ряда чисел: а) 24,22,27,20,16,37; б)30,5,23,5,28, Найдите среднее арифметическое, размах и моду ряда чисел: а)32,26,18,26,15,21,26; б)-21,-33,-35,-19,-20,-22; б)-21,-33,-35,-19,-20,-22; в) 61,64,64,83,61,71,70; в) 61,64,64,83,61,71,70; г) -4,-6, 0, 4, 0, 6, 8, -12. г) -4,-6, 0, 4, 0, 6, 8, В ряду чисел 3, 8, 15, 30, __, 24 пропущено одно число, Найдите его, если: а) среднее арифметическое ряда равно 18; а) среднее арифметическое ряда равно 18; б) размах ряда равен 40; б) размах ряда равен 40; в) мода ряда равна 24. в) мода ряда равна 24.


4. В аттестате о среднем образовании у четырёх друзей – выпускников школы – оказались следующие оценки: Ильин: 4,4,5,5,4,4,4,5,5,5,4,4,5,4,4; Ильин: 4,4,5,5,4,4,4,5,5,5,4,4,5,4,4; Семёнов: 3,4,3,3,3,3,4,3,3,3,3,4,4,5,4; Семёнов: 3,4,3,3,3,3,4,3,3,3,3,4,4,5,4; Попов: 5,5,5,5,5,4,4,5,5,5,5,5,4,4,4; Попов: 5,5,5,5,5,4,4,5,5,5,5,5,4,4,4; Романов: 3,3,4,4,4,4,4,3,4,4,4,5,3,4,4. Романов: 3,3,4,4,4,4,4,3,4,4,4,5,3,4,4. С каким средним баллом окончил школу каждый из этих выпускников? Укажите наиболее типичную для каждого из них оценку в аттестате. Какие статистические характеристики вы использовали при ответе? С каким средним баллом окончил школу каждый из этих выпускников? Укажите наиболее типичную для каждого из них оценку в аттестате. Какие статистические характеристики вы использовали при ответе?


Самостоятельная работа Вариант 1. Вариант Дан ряд чисел: 35, 44, 37, 31, 41, 40, 31, 29. Найдите среднее арифметическое, размах и моду рада. 2. В ряду чисел 4, 9, 16, 31, _, 25 4, 9, 16, 31, _, 25 пропущено одно число. пропущено одно число. Найдите его, если: Найдите его, если: а) среднее арифметичес- а) среднее арифметичес- кое равно 19; кое равно 19; б) размах ряда – 41. б) размах ряда – 41. Вариант Дан ряд чисел: 38, 42, 36, 45, 48, 45,45, 42. Найдите среднее арифметическое, размах и моду рада. 2. В ряду чисел 5, 10, 17, 32, _, 26 пропущено одно число. Найдите его, если: а) среднее арифметичес- кое равно 19; б) размах ряда – 41.


Медианой упорядоченного ряда чисел с нечётным числом чисел называется число, записанное посередине, а медианой упорядоченного ряда чисел с чётным числом чисел называется среднее арифметическое двух чисел, записанных посередине. Медианой упорядоченного ряда чисел с нечётным числом чисел называется число, записанное посередине, а медианой упорядоченного ряда чисел с чётным числом чисел называется среднее арифметическое двух чисел, записанных посередине. В таблице показан расход электроэнергии в январе жильцами девяти квартир: В таблице показан расход электроэнергии в январе жильцами девяти квартир: Номерквартиры Расходэлектро-энергии


Составим упорядоченный ряд: 64, 72, 72, 75, 78, 82, 85, 91,93. 64, 72, 72, 75, 78, 82, 85, 91, – медиана данного ряда. 78 – медиана данного ряда. Дан упорядоченный ряд: Дан упорядоченный ряд: 64, 72, 72, 75, 78, 82, 85, 88, 91, 93. ():2 = 80 – медиана. ():2 = 80 – медиана.


1. Найдите медиану ряда чисел: а) 30, 32, 37, 40, 41, 42, 45, 49, 52; а) 30, 32, 37, 40, 41, 42, 45, 49, 52; б) 102, 104, 205, 207, 327, 408, 417; б) 102, 104, 205, 207, 327, 408, 417; в) 16, 18, 20, 22, 24, 26; в) 16, 18, 20, 22, 24, 26; г) 1,2, 1,4, 2,2, 2,6, 3,2, 3,8, 4,4, 5,6. г) 1,2, 1,4, 2,2, 2,6, 3,2, 3,8, 4,4, 5,6. 2. Найдите среднее арифметическое и медиану ряда чисел: а) 27, 29, 23, 31,21,34; а) 27, 29, 23, 31,21,34; б) 56, 58, 64, 66, 62, 74; б) 56, 58, 64, 66, 62, 74; в) 3,8, 7,2, 6,4, 6,8, 7,2; в) 3,8, 7,2, 6,4, 6,8, 7,2; г) 21,6, 37,3, 16,4, 12, 6. г) 21,6, 37,3, 16,4, 12, 6.


3. В таблице показано число посетителей выставки в разные дни недели: Найдите медиану указанного ряда данных. В какие дни недели число посетителей выставки было больше медианы? Днинедели Пн Пн Вт Вт Ср Ср Чт Чт Пт Пт Сб Сб Вс Вс Число посетите лей


4.Ниже указана среднесуточная переработка сахара (в тыс.ц) заводами сахарной промышленности некоторого региона: (в тыс.ц) заводами сахарной промышленности некоторого региона: 12,2, 13,2, 13,7, 18,0, 18,6, 12,2, 18,5, 12,4, 12,2, 13,2, 13,7, 18,0, 18,6, 12,2, 18,5, 12,4, 14, 2, 17,8. 14, 2, 17,8. Для представленного ряда найдите среднее арифметическое, моду, размах и медиану. Для представленного ряда найдите среднее арифметическое, моду, размах и медиану. 5. В организации вели ежедневный учёт поступивших в течение месяца писем. В результате получили такой ряд данных: 39, 43, 40, 0, 56, 38, 24, 21, 35, 38, 0, 58, 31, 49, 38, 25, 34, 0, 52, 40, 42, 40, 39, 54, 0, 64, 44, 50, 38, 37, 43, 40, 0, 56, 38, 24, 21, 35, 38, 0, 58, 31, 49, 38, 25, 34, 0, 52, 40, 42, 40, 39, 54, 0, 64, 44, 50, 38, 37, 32. Для представленного ряда найдите среднее арифметическое, моду, размах и медиану. Для представленного ряда найдите среднее арифметическое, моду, размах и медиану.


Домашнее задание. На соревнованиях по фигурному катанию выступление спортсмена было оценено следующими баллами: На соревнованиях по фигурному катанию выступление спортсмена было оценено следующими баллами: 5,2; 5,4; 5,5; 5,4; 5,1; 5,1; 5,4; 5,5; 5,3. 5,2; 5,4; 5,5; 5,4; 5,1; 5,1; 5,4; 5,5; 5,3. Для полученного ряда чисел найдите среднее арифметическое, размах и моду. Для полученного ряда чисел найдите среднее арифметическое, размах и моду.



Пусть Х 1 , Х 2 ... X n - выборка независимых случайных величин.

Упорядочим эти величины по возрастанию, иными словами, построим вариационный ряд:

Х (1) < Х (2) < ... < X (n) , (*)

где Х (1) = min (Х 1 , Х 2 ... X n),

Х (n) = max (Х 1 , Х 2 ... X n).

Элементы вариационного ряда (*) называются порядковыми статистиками.

Величины d (i) = X (i+1) - X (i) называются спейсингами или расстояниями между порядковыми статистиками.

Размахом выборки называется величина

R = X (n) - X (1)

Иными словами, размах это расстояние между максимальным и минимальным членом вариационного ряда.

Выборочное среднее равно: = (Х 1 + Х 2 + ... + X n) / n

Среднее арифметическое

Вероятно, большинство из вас использовало такую важную описательную статистику, как среднее .

Среднее - очень информативная мера "центрального положения" наблюдаемой переменной, особенно если сообщается ее доверительный интервал. Исследователю нужны такие статистики, которые позволяют сделать вывод относительно популяции в целом. Одной из таких статистик является среднее.

Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее популяции.

Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p =.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции.

Если вы установите больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот.

Хорошо известно, например, что чем "неопределенней" прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным. Заметим, что ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки.

Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок.

При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.

Довольно трудно «ощутить» числовые измерения, пока данные не будут содержательно обобщены. Диаграмма часто полезна в качестве отправной точки. Мы можем также сжать информацию, используя важные характеристики данных. В частности, если бы мы знали, из чего состоит представленная величина, или если бы мы знали, насколько широко рассеяны наблюдения, то мы бы смогли сформировать образ этих данных.

Среднее арифметическое, которое очень часто называют просто «среднее», получают путем сложения всех значений и деления этой суммы на число значений в наборе.

Это можно показать с помощью алгебраической формулы. Набор n наблюдений переменной X можно изобразить как X 1 , X 2 , X 3 , ..., X n . Например, за X можно обозначить рост индивидуума (см), X 1 обозначит рост 1 -го индивидуума, а X i — рост i -го индивидуума. Формула для определения среднего арифметического наблюдений (произносится «икс с чертой»):

= (Х 1 + Х 2 + ... + X n) / n

Можно сократить это выражение:

где (греческая буква «сигма») означает «суммирование», а индексы внизу и вверху этой буквы означают, что суммирование производится от i = 1 до i = n . Это выражение часто сокращают еще больше:

Медиана

Если упорядочить данные по величине, начиная с самой маленькой величины и заканчивая самой большой, то медиана также будет характеристикой усреднения в упорядоченном наборе данных.

Медиана делит ряд упорядоченных значений пополам с равным числом этих значений как выше, так и ниже ее (левее и правее медианы на числовой оси).

Вычислить медиану легко, если число наблюдений n нечетное . Это будет наблюдение номер (n + 1)/2 в нашем упорядоченном наборе данных.

Например, если n = 11 , то медиана - это (11 + 1)/2 , т. е. 6-е наблюдение в упорядоченном наборе данных.

Если n четное , то, строго говоря, медианы нет. Однако обычно мы вычисляем ее как среднее арифметическое двух соседних средних наблюдений в упорядоченном наборе данных (т. е. наблюдений номер (n/2) и (n/2 + 1) ).

Так, например, если n = 20 , то медиана - это среднее арифметическое наблюдений номер 20/2 = 10 и (20/2 + 1) = 11 в упорядоченном наборе данных.

Мода

Мода - это значение, которое встречается наиболее часто в наборе данных; если данные непрерывные, то мы обычно группируем их и вычисляем модальную группу.

Некоторые наборы данных не имеют моды, потому что каждое значение встречается только 1 раз. Иногда бывает более одной моды; это происходит тогда, когда 2 значения или больше встречаются одинаковое число раз и встречаемость каждого из этих значений больше, чем любого другого значения.

Как обобщающую характеристику моду используют редко.

Среднее геометрическое

При несимметричном распределении данных сред­нее арифметическое не будет обобщающим показа­телем распределения.

Если данные скошены вправо, то можно создать более симметричное распределе­ние, если взять логарифм (по основанию 10 или по основанию е ) каждого значения переменной в наборе данных. Среднее арифметическое значений этих логарифмов - характеристика распределения для преобразованных данных.

Чтобы получить ме­ру с теми же единицами измерения, что и первона­чальные наблюдения, нужно осуществить обратное преобразование - потенцирование (т. е. взять анти­логарифм) средней логарифмированных данных; мы называем такую величину среднее геометрическое.

Если распределение данных логарифма приблизитель­но симметричное, то среднее геометрическое подобно медиане и меньше, чем среднее необработанных дан­ных.

Взвешенное среднее

Взвешенное среднее используют тогда, когда не­которые значения интересующей нас переменной x более важны, чем другие. Мы присоединяем вес w i к каждому из значений x i в нашей выборке для то­го, чтобы учесть эту важность.

Если значения x 1 , x 2 ... x n имеют соответствующий вес w 1 , w 2 ... w n , то взвешенное арифметическое среднее выглядит следующим образом:

Например, предположим, что мы заинтересованы в определении средней продолжительности госпита­лизации в каком-либо районе и знаем средний реа­билитационный период больных в каждой больнице. Учитываем количество информации, в первом при­ближении принимая за вес каждого наблюдения число больных в больнице.

Взвешенное среднее и среднее арифметическое идентичны, если каждый вес равен единице.

Размах (интервал изменения)

Размах - это разность между максимальным и минимальным значениями переменной в наборе данных; этими двумя величинами обозначают их разность. Обратите внимание, что размах вводит в заблуждение, если одно из значений есть выброс (см. раздел 3).

Размах, полученный из процентилей

Что такое процентили

Предположим, что мы расположим наши данные упорядоченно от самой маленькой величины перемен­ной X и до самой большой величины. Величина X , до которой расположен 1% наблюдений (и выше которой расположены 99% наблюдений), называется первым процентилем .

Величина X , до которой находится 2% наблюдений, называется 2-м процентилем , и т. д.

Величины X , которые делят упорядоченный набор значений на 10 равных групп, т. е. 10-й, 20-й, 30-й,..., 90 и процентили, называются децилями . Величины X , которые делят упорядоченный набор значений на 4 равные группы, т.е. 25-й, 50-й и 75-й процентили, называются квартилями . 50-й процентиль - это ме­диана .

Применение процентилей

Мы можем добиться такой формы описания рас­сеяния, на которую не повлияет выброс (аномальное значение), исключая экстремальные величины и определяя размах остающихся наблюдений.

Межквартильный размах - это разница между 1-м и 3-м квартилями, т.е. между 25-м и 75-м процентилями. В него входят центральные 50% наблюдений в упорядоченном наборе, где 25% наблюдений находятся ниже центральной точки и 25% - выше.

Интердецильный размах содержит в себе центральные 80% наблюдений, т. е. те наблю­дения, которые располагаются между 10-м и 90-м процентилями.

Мы часто используем размах, который содержит 95% наблюдений, т.е. он исключает 2,5% наблюдений снизу и 2,5% сверху. Указание такого интервала актуально, например, для осуществления диагностики болезни. Такой интервал называется референтный интервал , референтный размах или нормальный размах .

Дисперсия

Один из способов измерения рассеяния данных за­ключается в том, чтобы определить степень отклоне­ния каждого наблюдения от средней арифметической. Очевидно, что чем больше отклонение, тем больше изменчивость, вариабельность наблюдений.

Однако мы не можем использовать среднее этих отклонений как меру рассеяния, потому что положительные от­клонения компенсируют отрицательные отклонения (их сумма равна нулю). Чтобы решить эту проблему, мы возводим в квадрат каждое отклонение и находим среднее возведенных в квадрат отклонений; эта величина называется вариацией , или дисперсией .

Возьмем n наблюдений x 1 , x 2 , х 3 , ..., x n , среднее которых равняется .

Вычисляем дисперсию:

В случае, если мы имеем дело не с генеральной совокупностью, а с выборкой, то вычисляется выборочная дисперсия:

Теоретически можно показать, что полу­чится более точная дисперсия по выборке, если разделить не на n , а на (n-1).

Единицы измерения (размерность) вариации - это квадрат единиц измерения первоначальных на­блюдений.

Например, если измерения производятся в килограммах, то единица измерения вариации будет килограмм в квадрате.

Среднеквадратическое отклонение, стандартное отклонение выборки

Среднеквадратическое отклоне­ние - это положительный квадратный корень из .

Стандартное отклонение выборки - корень из выборочной дисперсии.