Как рассчитать среднее арифметическое. Расчет среднего значения в программе Microsoft Excel

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике , варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее можно говорить о среднемесячной заработной плате работников разных отраслей экономики . Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимопогашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:

  • качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что исчисление средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;
  • исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;
  • при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показа-телъ (свойство), на который она должна быть ориентирована.

Определяющий показатель может выступать в виде суммы значений осредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения осредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, - групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

  • степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
  • структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины - средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй - 7, третий - 4, четвертый - 10, пятый- 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек , возраст которых варьируется от 18 до 22 лет, где xi - варианты осредняемого признака, fi - частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины - средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, - как Σ fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi - отдельные варианты; n - число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая - при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где - средняя величина; - индивидуальное значение; n - число единиц изучаемой совокупности; k - показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние - мода (Мо) и медиана (Ме).

Мода - величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; fm_ 1 - частота предшествующего интервала; fm+ 1 - частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; f - число членов ряда;

∫m-1 - сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили - на 10 равных частей. Квартилей насчитывается три, а децилей - девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


Абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (σ 2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


Наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

У этого термина существуют и другие значения, см. среднее значение.

Сре́днее арифмети́ческое (в математике и статистике) множества чисел - сумма всех чисел, делённая на их количество. Является одной из наиболее распространённых мер центральной тенденции.

Предложена (наряду со средним геометрическим и средним гармоническим) ещё пифагорейцами.

Частными случаями среднего арифметического являются среднее (генеральной совокупности) и выборочное среднее (выборки).

Введение

Обозначим множество данных X = (x 1 , x 2 , …, x n ), тогда выборочное среднее обычно обозначается горизонтальной чертой над переменной (x ¯ {\displaystyle {\bar {x}}} , произносится «x с чертой»).

Для обозначения среднего арифметического всей совокупности используется греческая буква μ. Для случайной величины, для которой определено среднее значение, μ есть вероятностное среднее или математическое ожидание случайной величины. Если множество X является совокупностью случайных чисел с вероятностным средним μ, тогда для любой выборки x i из этой совокупности μ = E{x i } есть математическое ожидание этой выборки.

На практике разница между μ и x ¯ {\displaystyle {\bar {x}}} в том, что μ является типичной переменной, потому что видеть можно скорее выборку, а не всю генеральную совокупность. Поэтому, если выборку представлять случайным образом (в терминах теории вероятностей), тогда x ¯ {\displaystyle {\bar {x}}} (но не μ) можно трактовать как случайную переменную, имеющую распределение вероятностей на выборке (вероятностное распределение среднего).

Обе эти величины вычисляются одним и тем же способом:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}={\frac {1}{n}}(x_{1}+\cdots +x_{n}).}

Если X - случайная переменная, тогда математическое ожидание X можно рассматривать как среднее арифметическое значений в повторяющихся измерениях величины X . Это является проявлением закона больших чисел. Поэтому выборочное среднее используется для оценки неизвестного математического ожидания.

В элементарной алгебре доказано, что среднее n + 1 чисел больше среднего n чисел тогда и только тогда, когда новое число больше чем старое среднее, меньше тогда и только тогда, когда новое число меньше среднего, и не меняется тогда и только тогда, когда новое число равно среднему. Чем больше n , тем меньше различие между новым и старым средними значениями.

Заметим, что имеется несколько других «средних» значений, в том числе среднее степенное, среднее Колмогорова, гармоническое среднее, арифметико-геометрическое среднее и различные средне-взвешенные величины (например, среднее арифметическое взвешенное, среднее геометрическое взвешенное, среднее гармоническое взвешенное).

Примеры

  • Для трёх чисел необходимо сложить их и разделить на 3:
x 1 + x 2 + x 3 3 . {\displaystyle {\frac {x_{1}+x_{2}+x_{3}}{3}}.}
  • Для четырёх чисел необходимо сложить их и разделить на 4:
x 1 + x 2 + x 3 + x 4 4 . {\displaystyle {\frac {x_{1}+x_{2}+x_{3}+x_{4}}{4}}.}

Или проще 5+5=10, 10:2. Потому что мы складывали 2 числа, а значит, сколько чисел складываем, на столько и делим.

Непрерывная случайная величина

Для непрерывно распределённой величины f (x) {\displaystyle f(x)} среднее арифметическое на отрезке [ a ; b ] {\displaystyle } определяется через определённый интеграл:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x {\displaystyle {\overline {f(x)}}_{}={\frac {1}{b-a}}\int _{a}^{b}f(x)dx}

Некоторые проблемы применения среднего

Отсутствие робастности

Основная статья: Робастность в статистике

Хотя среднее арифметическое часто используется в качестве средних значений или центральных тенденций, это понятие не относится к робастной статистике, что означает, что среднее арифметическое подвержено сильному влиянию «больших отклонений». Примечательно, что для распределений с большим коэффициентом асимметрии среднее арифметическое может не соответствовать понятию «среднего», а значения среднего из робастной статистики (например, медиана) может лучше описывать центральную тенденцию.

Классическим примером является подсчёт среднего дохода. Арифметическое среднее может быть неправильно истолковано в качестве медианы, из-за чего может быть сделан вывод, что людей с большим доходом больше, чем на самом деле. «Средний» доход истолковывается таким образом, что доходы большинства людей находятся вблизи этого числа. Этот «средний» (в смысле среднего арифметического) доход является выше, чем доходы большинства людей, так как высокий доход с большим отклонением от среднего делает сильный перекос среднего арифметического (в отличие от этого, средний доход по медиане «сопротивляется» такому перекосу). Однако, этот «средний» доход ничего не говорит о количестве людей вблизи медианного дохода (и не говорит ничего о количестве людей вблизи модального дохода). Тем не менее, если легкомысленно отнестись к понятиям «среднего» и «большинство народа», то можно сделать неверный вывод о том, что большинство людей имеют доходы выше, чем они есть на самом деле. Например, отчёт о «среднем» чистом доходе в Медине, штат Вашингтон, подсчитанный как среднее арифметическое всех ежегодных чистых доходов жителей, даст на удивление большое число из-за Билла Гейтса. Рассмотрим выборку (1, 2, 2, 2, 3, 9). Среднее арифметическое равно 3.17, но пять значений из шести ниже этого среднего.

Сложный процент

Основная статья: Окупаемость инвестиций

Если числа перемножать , а не складывать , нужно использовать среднее геометрическое, а не среднее арифметическое. Наиболее часто этот казус случается при расчёте окупаемости инвестиций в финансах.

Например, если акции в первый год упали на 10 %, а во второй год выросли на 30 %, тогда некорректно вычислять «среднее» увеличение за эти два года как среднее арифметическое (−10 % + 30 %) / 2 = 10 %; правильное среднее значение в этом случае дают совокупные ежегодные темпы роста, по которым годовой рост получается только около 8,16653826392 % ≈ 8,2 %.

Причина этого в том, что проценты имеют каждый раз новую стартовую точку: 30 % - это 30 % от меньшего, чем цена в начале первого года, числа: если акции в начале стоили $30 и упали на 10 %, они в начале второго года стоят $27. Если акции выросли на 30 %, они в конце второго года стоят $35.1. Арифметическое среднее этого роста 10 %, но поскольку акции выросли за 2 года всего на $5.1, средний рост в 8,2 % даёт конечный результат $35.1:

[$30 (1 - 0.1) (1 + 0.3) = $30 (1 + 0.082) (1 + 0.082) = $35.1]. Если же использовать таким же образом среднее арифметическое значение 10 %, мы не получим фактическое значение: [$30 (1 + 0.1) (1 + 0.1) = $36.3].

Сложный процент в конце 2 года: 90 % * 130 % = 117 % , то есть общий прирост 17 %, а среднегодовой сложный процент 117 % ≈ 108.2 % {\displaystyle {\sqrt {117\%}}\approx 108.2\%} , то есть среднегодовой прирост 8,2 %.

Направления

Основная статья: Статистика направлений

При расчёте среднего арифметического значений некоторой переменной, изменяющейся циклически (например, фаза или угол), следует проявлять особую осторожность. Например, среднее чисел 1° и 359° будет равно 1 ∘ + 359 ∘ 2 = {\displaystyle {\frac {1^{\circ }+359^{\circ }}{2}}=} 180°. Это число неверно по двум причинам.

  • Во-первых, угловые меры определены только для диапазона от 0° до 360° (или от 0 до 2π при измерении в радианах). Таким образом, ту же пару чисел можно было бы записать как (1° и −1°) или как (1° и 719°). Средние значения каждой из пар будут отличаться: 1 ∘ + (− 1 ∘) 2 = 0 ∘ {\displaystyle {\frac {1^{\circ }+(-1^{\circ })}{2}}=0^{\circ }} , 1 ∘ + 719 ∘ 2 = 360 ∘ {\displaystyle {\frac {1^{\circ }+719^{\circ }}{2}}=360^{\circ }} .
  • Во-вторых, в данном случае, значение 0° (эквивалентное 360°) будет геометрически лучшим средним значеним, так как числа отклоняются от 0° меньше, чем от какого-либо другого значения (у значения 0° наименьшая дисперсия). Сравните:
    • число 1° отклоняется от 0° всего на 1°;
    • число 1° отклоняется от вычисленного среднего, равного 180°, на 179°.

Среднее значение для циклической переменной, рассчитанное по приведённой формуле, будет искусственно сдвинуто относительно настоящего среднего к середине числового диапазона. Из-за этого среднее рассчитывается другим способом, а именно, в качестве среднего значения выбирается число с наименьшей дисперсией (центральная точка). Также вместо вычитания используется модульное расстояние (то есть, расстояние по окружности). Например, модульное расстояние между 1° и 359° равно 2°, а не 358° (на окружности между 359° и 360°==0° - один градус, между 0° и 1° - тоже 1°, в сумме - 2°).

4.3. Средние величины. Сущность и значение средних величин

Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчете на единицу качественно однородной совокупности. В экономической практике используется широкий круг показателей, вычисленных в виде средних величин.

Например, обобщающим показателем доходов рабочих акционерного общества (АО) служит средний доход одного рабочего, определяемый отношением фонда заработной платы и выплат социального характера за рассматриваемый период (год, квартал, месяц) к численности рабочих АО.

Вычисление среднего - один из распространенных приемов обобщения; средний показатель отражает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнори­рует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Там, где возникает потребность обобщения, расчет таких характе­ристик приводит к замене множества различных индивидуальных зна­чений признака средним показателем, характеризующим всю совокуп­ность явлений, что позволяет выявить закономерности, присущие мас­совым общественным явлениям, незаметные в единичных явлениях.

Средняя отражает характерный, типичный, реальный уровень изу­чаемых явлений, характеризует эти уровни и их изменения во времени и в пространстве.

Средняя - это сводная характеристика закономерностей процесса в тех условиях, в которых он протекает.

4.4. Виды средних и способы их вычисления

Выбор вида средней определяется экономическим содержанием определенного показателя и исходных данных. В каждом конкретном случае применяется, одна из средних величин: арифметическая, гар­ моническая, геометрическая, квадратическая, кубическая и т.д. Пере­численные средние относятся к классу степенных средних.

Помимо степенных средних в статистической практике использу­ются средние структурные, в качестве которых рассматриваются мода и медиана.

Остановимся подробнее на степенных средних.

Средняя арифметическая

Наиболее распространенным видом средних является средняя арифметическая. Она применяется в тех случаях, когда объем варьиру­ющего признака для всей совокупности является суммой значений при­знаков отдельных ее единиц. Для общественных явлений характерна аддитивность (суммарность) объемов варьирующего признака, этим определяется область применения средней арифметической и объяс­няется ее распространенность как обобщающего показателя, например: общий фонд заработной платы - это сумма заработных плат всех ра­ботников, валовый сбор урожая - сумма произведенной продукции со всей посевной площади.

Чтобы исчислить среднюю арифметическую, нужно сумму всех зна­чений признаков разделить на их число.

Средняя арифметическая применяется в форме простой средней и взвешенной средней. Исходной, определяющей формой служит про­стая средняя.

Средняя арифметическая простая равна простой сумме от­дельных значений осредняемого признака, деленной на общее число этих значений (она применяется в тех случаях, когда имеются несгруппированные индивидуальные значения признака):

где
- индивидуальные значения варьирующего (варианты);м - число единиц совокупности.

Далее пределы суммирования в формулах указываться не будут. Например, требуется найти среднюю выработку одного рабочего (слесаря), если известно, сколько деталей изготовил каждый из 15 рабочих, т.е. дан ряд индивидуальных значений признака, шт.:

21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

Средняя арифметическая простая рассчитывается по формуле (4.1),1 шт.:

Средняя из вариантов, которые повторяются различное число раз, или, как говорят, имеют различный вес, называется взвешенной. В качестве весов выступают численности единиц в разных группах совокупности (в группу объединяют одинаковые варианты).

Средняя арифметическая взвешенная - средняя сгруппиро­ванных величин , - вычисляется по формуле:

, (4.2)

где
- веса (частоты повторения одинаковых признаков);

- сумма произведений величины признаков на их частоты;

- общая численность единиц совокупности.

Технику вычисления средней арифметической взвешенной проил­люстрируем на рассмотренном выше примере. Для этого сгруппируем исходные данные и поместим их в табл. 4.1.

Таблица 4.1

Распределение рабочих по выработке деталей

По формуле (4.2) средняя арифметическая взвешенная равна, шт.:

В отдельных случаях веса могут быть представлены не абсолютными величинами, а относительными (в процентах или долях единицы). Тог­да формула средней арифметической взвешенной будет иметь вид:

где
- частность, т.е. доля каждой частоты в общей сумме всех

Если частоты подсчитывают в долях (коэффициентах), то
= 1,и формула средней арифметически взвешенной имеет вид:

Вычисление средней арифметической взвешенной из групповых средних осуществляется по формуле:

,

где f -число единиц в каждой группе.

Результаты вычисления средней арифметической из групповых средних представлены в табл. 4.2.

Таблица 4.2

Распределение рабочих по среднему стажу работы

В этом примере вариантами являются не индивидуальные данные о стаже работы отдельных рабочих, а средние по каждому цеху . Весами f являются численности рабочих в цехах. Отсюда средний стаж работы рабочих по всему предприятию составит, лет:

.

Расчет средней арифметической в рядах распределения

Если значения осредняемого признака заданы в виде интервалов («от - до»), т.е. интервальных рядов распределения, то при расчете средней арифметической величины в качестве значений признаков в группах принимают середины этих интервалов, в результате чего образуется дискретный ряд. Рассмотрим следующий пример (табл. 4.3).

От интервального ряда перейдем к дискретному путем замены интервальных значений их средними значениями/(простая средняя

Таблица 4.3

Распределение рабочих АО по уровню ежемесячной оплаты труда

Группы рабочих по

Число рабочих,

Середина интервала,

оплате труда, руб.

чел., f

руб., х

900 и более

величины открытых интервалов (первый и последний) условно приравни­ваются к интервалам, примыкающим к ним (второй и предпоследний).

При таком исчислении средней допускается некоторая неточность, поскольку делается предположение о равномерности распределения единиц признака внутри группы. Однако ошибка будет тем меньше, чем уже интервал и чем больше единиц в интервале.

После того как найдены середины интервалов, вычисления дела­ют так же, как и в дискретном ряду, - варианты умножают на частоты (веса) и сумму произведений делят на сумму частот (весов), тыс. руб.:

.

Итак, средний уровень оплаты труда рабочих АО составляет 729 руб. в месяц.

Вычисление средней арифметической часто сопряжено с большими затратами времени и труда. Однако в ряде случаев процедуру расчета средней можно упростить и облегчить, если воспользоваться ее свойствами. Приведем (без доказательства) некоторые основные свойства средней арифметической.

Свойство 1. Если все индивидуальные значения признака (т.е. все варианты) уменьшить или увеличить в i раз, то среднее значение нового признака соответственно уменьшится или увеличится в i раз.

Свойство 2. Если все варианты осредняемого признака умень шить или увеличить на число А, то средняя арифметическая соответ ственно уменьшится или увеличится на это же число А.

Свойство 3. Если веса всех осредняемых вариантов уменьшить или увеличить в к раз, то средняя арифметическая не изменится.

В качестве весов средней вместо абсолютных показателей можно использовать удельные веса в общем итоге (доли или проценты). Тем самым достигается упрощение расчетов средней.

Для упрощения расчетов средней идут по пути уменьшения зна­чений вариантов и частот. Наибольшее упрощение достигается, когда в качестве А выбирается значение одного из центральных вариантов, обладающего наибольшей частотой, в качестве / - величина интервала (для рядов с одинаковыми интервалами). Величина Л называется нача­лом отсчета, поэтому такой метод вычисления средней называется «способом отсчета от условного нуля» или «способом моментов».

Допустим, что все варианты х сначала уменьшены на одно и то же число А, а затем уменьшены в i раз. Получим новый вариационный ряд распределения новых вариантов .

Тогда новые варианты будут выражаться:

,

а их новая средняя арифметическая , -момент первого порядка -формулой:

.

Она равна средней из первоначальных вариантов, уменьшенной сначала на А, а затем в i раз.

Для получения действительной средней надо момент первого по­рядка m 1 , умножить на i и прибавить А:

.

Данный способ вычисления средней арифметической из вариа­ционного ряда называют «способом моментов». Применяется этот спо­соб в рядах с равными интервалами.

Расчет средней арифметической по способу моментов ил­люстрируется данными табл. 4.4.

Таблица 4.4

Распределение малых предприятий региона по стоимости основных производственных фондов (ОПФ) в 2000 г.

Группы предпри­ятий по стоимости ОПФ, тыс. руб.

Число пред­приятий,f

Середины интервалов, x

14-16 16-18 18-20 20-22 22-24

Находим момент первого порядка

.

Затем, принимая А = 19 и зная, что i = 2, вычисляем х, тыс. руб.:

Виды средних величин и методы их расчета

На этапе статистической обработки могут быть поставлены самые различные задачи исследования, для решения которых нужно выбрать соответствующую среднюю. При этом необходимо руководствоваться следующим правилом: величины, которые представляют собой числитель и знаменатель средней, должны быть логически связаны между собой.

  • степенные средние ;
  • структурные средние .

Введем следующие условные обозначения:

Величины, для которых исчисляется средняя;

Средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений;

Частота (повторяемость индивидуальных значений признака).

Различные средние выводятся из общей формулы степенной средней:

(5.1)

при k = 1 - средняя арифметическая; k = -1 - средняя гармоническая; k = 0 - средняя геометрическая; k = -2 - средняя квадратическая.

Средние величины бывают простые и взвешенные. Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность, в связи с чем каждый вариант приходится умножать на эту численность. Иными словами, «весами» выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту f называют статистическим весом или весом средней .

Средняя арифметическая - самый распространенный вид средней. Она используется, когда расчет осуществляется по несгруппированным статистическим данным, где нужно получить среднее слагаемое. Средняя арифметическая - это такое среднее значение признака, при получении которого сохраняется неизменным общий объем признака в совокупности.

Формула средней арифметической (простой ) имеет вид

где n - численность совокупности.

Например, средняя заработная плата работников предприятия вычисляется как средняя арифметическая:

Определяющими показателями здесь являются заработная плата каждого работника и число работников предприятия. При вычислении средней общая сумма заработной платы осталась прежней, но распределенной как бы между всеми работниками поровну. К примеру, необходимо вычислить среднюю заработную плату работников небольшой фирмы, где заняты 8 человек:

При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным. В этом случае речь идет об использовании средней арифметической взвешенной , которая имеет вид

(5.3)

Так, нам необходимо рассчитать средний курс акций какого-то акционерного общества на торгах фондовой биржи. Известно, что сделки осуществлялись в течение 5 дней (5 сделок), количество проданных акций по курсу продаж распределилось следующим образом:

1 - 800 ак. - 1010 руб.

2 - 650 ак. - 990 руб.

3 - 700 ак. - 1015 руб.

4 - 550 ак. - 900 руб.

5 - 850 ак. - 1150 руб.

Исходным соотношением для определения среднего курса стоимости акций является отношение общей суммы сделок (ОСС) к количеству проданных акций (КПА).

Наиболее распространенной формой статистических показателей, используемых в социально-экономических исследованиях, является средняя величина, представляющая собой обобщенную количественную характеристику признака статистической совокупности. Средние величины являются как бы «представителями» всего ряда наблюдений. Определить среднюю можно во многих случаях через исходное соотношение средней (ИСС) или ее логическую формулу: . Так, например, для расчета средней заработной платы работников предприятия необходимо общий фонд заработной платы разделить на число работников: Числитель исходного соотношения средней представляет собой ее определяющий показатель. Для средней заработной платы таким определяющим показателем является фонд заработной платы. Для каждого показателя, используемого в социально-экономическом анализе, можно составить только одно истинное исходное соотношение для расчета средней. Следует еще добавить, что для того, чтобы более точно оценить стандартное отклонение для малых выборок (с числом элементов менее 30), в знаменателе выражения под корнем надо использовать не n , а n- 1.

Понятие и виды средних величин

Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой. Существует 2 класса средних величин: степенные и структурные. К структурным средним относятсямода имедиана , но наиболее часто применяютсястепенные средние различных видов.

Степенные средние величины

Степенные средние могут быть простыми и взвешенными .

Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле средней степенной (при различной величине k (m)):

Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:

Где x - средняя величина исследуемого явления; x i – i -й вариант усредняемого признака ;

f i – вес i -го варианта.

Где X – значения отдельных статистических величин или середин группировочных интервалов;
m - показатель степени, от значения которого зависят следующие виды степенных средних величин:
при m = -1 средняя гармоническая;
при m = 0 средняя геометрическая;
при m = 1 средняя арифметическая;
при m = 2 средняя квадратическая;
при m = 3 средняя кубическая.

Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида, которые будут далее подробно рассмотрены.

Средняя арифметическая

Средняя арифметическая – начальный момент первого порядка, математическое ожидание значений случайной величины при большом числе испытаний;

Средняя арифметическая - это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:

или

Где X - значения величин, для которых необходимо рассчитать среднее значение; N - общее количество значений X (число единиц в изучаемой совокупности).

Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической простой: (3+4+4+5)/4 = 16/4 = 4. Средняя арифметическая взвешенная имеет следующий вид:

Где f - количество величин с одинаковым значением X (частота). >Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической взвешенной: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4. Если значения X заданы в виде интервалов, то для расчетов используют середины интервалов X, которые определяются как полусумма верхней и нижней границ интервала. А если у интервала X отсутствует нижняя или верхняя граница (открытый интервал), то для ее нахождения применяют размах (разность между верхней и нижней границей) соседнего интервала X. Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Тогда рассчитаем средний стаж работников по формуле средней арифметической взвешенной, приняв в качестве X середины интервалов стажа (2, 4 и 6 лет): (2*10+4*20+6*5)/(10+20+5) = 3,71 года.

Функция СРЗНАЧ

Эта функция вычисляет среднее (арифметическое) своих аргументов.

СРЗНАЧ(число1; число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее.

Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются.

Функция СРЗНАЧА

Вычисляет среднее арифметическое значений, заданных в списке аргументов. Помимо чисел в расчете могут участвовать текст и логические значения, такие как ИСТИНА и ЛОЖЬ.

СРЗНАЧА(значение1,значение2,...)

Значение1, значение2,... - это от 1 до 30 ячеек, интервалов ячеек или значений, для которых вычисляется среднее.

Аргументы должны быть числами, именами, массивами или ссылками. Массивы и ссылки, содержащие текст, интерпретируются как 0 (ноль). Пустой текст ("") интерпретируется как 0 (ноль). Аргументы, содержащие значение ИСТИНА, интерпретируются как 1, Аргументы, содержащие значение ЛОЖЬ, интерпретируются как 0 (ноль).

Средняя арифметическая применяется чаще всего, но бывают случаи, когда необходимо применение других видов средних величин. Рассмотрим такие случаи далее.

Средняя гармоническая

Средняя гармоническая для определения средней суммы обратных величин;

Средняя гармоническая применяется, когда исходные данные не содержат частот f по отдельным значениям X, а представлены как их произведение Xf. Обозначив Xf=w, выразим f=w/X, и, подставив эти обозначения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:

Таким образом, средняя гармоническая взвешенная применяется тогда, когда неизвестны частоты f, а известно w=Xf. В тех случаях, когда все w=1, то есть индивидуальные значения X встречаются по 1 разу, применяется формула средней гармонической простой: или Например, автомобиль ехал из пункта А в пункт Б со скоростью 90 км/ч, а обратно - со скоростью 110 км/ч. Для определения средней скорости применим формулу средней гармонической простой, так как в примере дано расстояние w 1 =w 2 (расстояние из пункта А в пункт Б такое, же как и из Б в А), которое равно произведению скорости (X) на время (f). Средняя скорость = (1+1)/(1/90+1/110) = 99 км/ч.

Функция СРГАРМ

Возвращает среднее гармоническое множества данных. Среднее гармоническое - это величина, обратная к среднему арифметическому обратных величин.

СРГАРМ(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Среднее гармоническое всегда меньше среднего геометрического, которое всегда меньше среднего арифметического.

Средняя геометрическая

Средняя геометрическая для оценки средних темпов роста случайной величин, нахождения значения признака, равноудаленного от минимального и максимального значения;

Средняя геометрическая применяется при определении средних относительных изменений. Геометрическая средняя величина дает наиболее точный результат осреднения, если задача стоит в нахождении такого значения X, который был бы равноудален как от максимального, так и от минимального значения X. Например, в период с 2005 по 2008 годы индекс инфляции в России составлял: в 2005 году - 1,109; в 2006 - 1,090; в 2007 - 1,119; в 2008 - 1,133. Так как индекс инфляции - это относительное изменение (индекс динамики), то рассчитывать среднее значение нужно по средней геометрической: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, то есть за период с 2005 по 2008 ежегодно цены росли в среднем на 11,26%. Ошибочный расчет по средней арифметической дал бы неверный результат 11,28%.

Функция СРГЕОМ

Возвращает среднее геометрическое значений массива или интервала положительных чисел. Например, функцию СРГЕОМ можно использовать для вычисления средних темпов роста, если задан составной доход с переменными ставками.

СРГЕОМ (число1; число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее геометрическое. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Средняя квадратическая

Средняя квадратическая – начальный момент второго порядка.

Средняя квадратическая применяется в тех случая, когда исходные значения X могут быть как положительными, так и отрицательными, например при расчете средних отклонений. Главной сферой применения квадратической средней является измерение вариации значений X.

Средняя кубическая

Средняя кубическая – начальный момент третьего порядка.

Средняя кубическая применяется крайне редко, например, при расчете индексов нищеты населения для развивающихся стран (ИНН-1) и для развитых (ИНН-2), предложенных и рассчитываемых ООН.


Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя величина это:

1) наиболее типичное для совокупности значение признака;

2) объем признака совокупности, распределенный поровну между единицами совокупности.

Признак, для которого рассчитывается средняя величина, в статистике называется «осредняемый».

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Важно отметить, что в процессе осреднения совокупное значение уровней признака или конечное его значение (в случае расчета средних уровней в ряду динамики) должно оставаться неизменным. Другими словами, при расчете средней величины объем исследуемого признака не должен быть искажен, и выражения, составляемые при расчетах средней, обязательно должны иметь смысл.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.

1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.

2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.

3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.

4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

,

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;

m – показатель степени средней;

f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Виды степенных средних

Вид степенной
средней

Показатель
степени (m)

Формула расчета

Простая

Взвешенная

Гармоническая

Геометрическая

Арифметическая

Квадратическая

Кубическая

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым. Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,…, i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×…×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда



Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;

h Me – его величина;

(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);

S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;

m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

,

где Х Mo – нижнее значение модального интервала;

m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);

m Mo-1 – то же для интервала, предшествующего модальному;

m Mo+1 – то же для интервала, следующего за модальным;

h – величина интервала изменения признака в группах.

ЗАДАЧА 1

Имеются следующие данные по группе промышленных предприятий за отчетный год


предприятия

Объем продукции, млн. руб.

Среднесписочное число работников, чел.

Прибыль, тыс. руб.

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

Требуется выполнить группировку предприятий по обмену продукции, приняв следующие интервалы:

    до 200 млн. руб.

    от 200 до 400 млн. руб.

  1. от 400 до 600 млн. руб.

    По каждой группе и по всем вместе определить число предприятий, объем продукции, среднесписочное число работников, среднюю выработку продукции на одного работника. Результаты группировки представить в виде статистической таблицы. Сформулировать вывод.

    РЕШЕНИЕ

    Произведем группировку предприятий по обмену продукции, расчет числа предприятий, объема продукции, среднесписочного числа работников по формуле простой средней. Результаты группировки и расчетов сводим в таблицу.

    Группы по объему продукции


    предприятия

    Объем продукции, млн. руб.

    Среднегодовая стоимость основных средств, млн. руб.

    Среднеспи

    сочное число работников, чел.

    Прибыль, тыс. руб.

    Средняя выработка продукции на одного работника

    1 группа

    до 200 млн. руб.

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    Средний уровень

    198,3

    24,9

    2 группа

    от 200 до 400 млн. руб.

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    Средний уровень

    282,3

    37,6

    1530

    64,0

    3 группа

    от 400 до

    600 млн.

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    Средний уровень

    512,9

    34,4

    1421

    120,9

    Всего по совокупности

    5314,2

    419,4

    17131

    1113,4

    0,31

    В среднем по совокупности

    379,6

    59,9

    1223,6

    79,5

    Вывод. Таким образом, в рассматриваемой совокупности наибольшее число предприятий по объему продукции попало в третью группу – семь, или половина предприятий. Величина среднегодовой стоимости основных средств также в данной группе, как и большая величина среднесписочного числа работников – 9974 человек, наименее прибыльны предприятия первой группы.

    ЗАДАЧА 2

    Имеются следующие данные по предприятиям фирмы

    Номер предприятия, входящего в фирму

    I квартал

    II квартал

    Выпуск продукции, тыс. руб.

    Отработано рабочими человеко-дней

    Средняя выработка на одного рабочего в день, руб.

    59390,13

Начиная рассуждать о средних величинах, чаще всего вспоминают, как заканчивали школу и поступали в учебное заведение. Тогда по аттестату рассчитывался средний балл: все оценки (и хорошие, и не очень) складывали, полученную сумму делили на их количество. Так вычисляется самый простой вид средней, которая называется средняя арифметическая простая. На практике в статистике применяются различные виды средних величин: арифметическая, гармоническая, геометрическая, квадратическая, структурные средние. Тот или иной их вид используется в зависимости от характера данных и целей исследования.

Средняя величина является наиболее распространенным статистическим показателем, с помощью которого дается обобщающая характеристика совокупности однотипных явлений по одному из варьирующих признаков. Она показывает уровень признака в расчете на единицу совокупности. С помощью средних величин проводится сравнение различных совокупностей по варьирующим признакам, изучаются закономерности развития явлений и процессов общественной жизни.

В статистике применяются два класса средних: степенные (аналитические) и структурные. Последние используются для характеристики структуры вариационного ряда и будут рассмотрены далее в гл. 8.

К группе степенных средних относят среднюю арифметическую, гармоническую, геометрическую, квадратическую. Индивидуальные формулы для их вычисления можно привести к виду, общему для всех степенных средних, а именно

где m - показатель степенной средней: при m = 1 получаем формулу для вычисления средней арифметической, при m = 0 - средней геометрической, m = -1 - средней гармонической, при m = 2 - средней квадратической;

x i - варианты (значения, которые принимает признак);

f i - частоты.

Главным условием, при котором можно использовать степенные средние в статистическом анализе, является однородность совокупности, которая не должна содержать исходных данных, резко различающихся по своему количественному значению (в литературе они носят название аномальных наблюдений).

Продемонстрируем важность этого условия на следующем примере.

Пример 6.1. Вычислим среднюю заработную плату сотрудников малого предприятия.

Таблица 6.1. Заработная плата работников
№ п/п Заработная плата, руб. № п/п Заработная плата, руб.
1 5 950 11 7 000
2 6 790 12 5 950
3 6 790 13 6 790
4 5 950 14 5 950
5 7 000 5 6 790
6 6 790 16 7 000
7 5 950 17 6 790
8 7 000 18 7 000
9 6 790 19 7 000
10 6 790 20 5 950

Для расчета среднего размера заработной платы необходимо просуммировать заработную плату, начисленную всем работникам предприятия (т.е. найти фонд заработной платы), и разделить на число работающих:


А теперь добавим в нашу совокупность всего лишь одного человека (директора этого предприятия), но с окладом в 50 000 руб. В таком случае вычисляемая средняя будет совсем другая:

Как видим, она превышает 7000 руб., т.д. она больше всех значений признака за исключением одного-единственного наблюдения.

Для того чтобы таких случаев не происходило на практике, и средняя не теряла бы своего смысла (в примере 6.1 она уже не выполняет роль обобщающей характеристики совокупности, которой должна быть), при расчете средней следует аномальные, резко выделяющиеся наблюдения либо исключить из анализа и тем самым сделать совокупность однородной, либо разбить совокупность на однородные группы и вычислить средние значения по каждой группе и анализировать не общую среднюю, а групповые средние значения.

6.1. Средняя арифметическая и ее свойства

Средняя арифметическая вычисляется либо как простая, либо как взвешенная величина.

При расчете средней заработной платы по данным таблицы примера 6.1 мы сложили все значения признака и поделили на их количество. Ход наших вычислений запишем в виде формулы средней арифметической простой

где х i - варианты (отдельные значения признака);

п - число единиц в совокупности.

Пример 6.2. Теперь сгруппируем наши данные из таблицы примера 6.1, т.д. построим дискретный вариационный ряд распределения работающих по уровню заработной платы. Результаты группировки представлены в таблице.

Запишем выражение для вычисления среднего уровня заработной платы в более компактной форме:

В примере 6.2 была применена формула средней арифметической взвешенной

где f i - частоты, показывающие, сколько раз встречается значение признака х i y единиц совокупности.

Расчет средней арифметической взвешенной удобно проводить в таблице, как это показано ниже (табл. 6.3):

Таблица 6.3. Расчет средней арифметической в дискретном ряду
Исходные данные Расчетный показатель
заработная плата, руб. численность работающих, чел. фонд заработной платы, руб.
x i f i x i f i
5 950 6 35 760
6 790 8 54 320
7 000 6 42 000
Итого 20 132 080

Следует отметить, что средняя арифметическая простая используется в тех случаях, когда данные не сгруппированы или сгруппированы, но все частоты равны между собой.

Часто результаты наблюдения представляют в виде интервального ряда распределения (см. таблицу в примере 6.4). Тогда при расчете средней в качестве x i берут середины интервалов. Если первый и последний интервалы открыты (не имеют одной из границ), то их условно "закрывают", принимая за величины данного интервала величину примыкающего интервала, т.д. первый закрывают исходя из величины второго, а последний - по величине предпоследнего.

Пример 6.3. По результатам выборочного обследования одной из групп населения рассчитаем размер среднедушевого денежного дохода.

В приведенной таблице середина первого интервала равна 500. Действительно, величина второго интервала - 1000 (2000-1000); тогда нижняя граница первого равна 0 (1000-1000), а его середина - 500. Аналогично поступаем с последним интервалом. За его середину принимаем 25 000: величина предпоследнего интервала 10 000 (20 000-10 000), тогда его верхняя граница - 30 000 (20 000 + 10 000), а середина, соответственно, - 25 000.

Таблица 6.4. Расчет средней арифметической в интервальном ряду
Среднедушевой денежный доход, руб. в месяц Численность населения к итогу, % f i Середины интервалов x i x i f i
До 1 000 4,1 500 2 050
1 000-2 000 8,6 1 500 12 900
2 000-4 000 12,9 3 000 38 700
4 000-6 000 13,0 5 000 65 000
6 000-8 000 10,5 7 000 73 500
8 000-10 000 27,8 9 000 250 200
10 000-20 000 12,7 15 000 190 500
20 000 и выше 10,4 25 000 260 000
Итого 100,0 - 892 850

Тогда среднедушевой размер месячного дохода составит