Большая энциклопедия нефти и газа. Точность измерения

Под качеством измерений понимают совокупность свойств, обусловливающих получение результатов с требуемыми точностными характеристиками и в необходимом виде.

Качество измерений характеризуется такими показателями, как точность, правильность, достоверность, сходимость и воспроизводимость результатов.

Точность измерения – качество измерения, отражающее близость его результата к истинному значению измеряемой величины. Количественно точность может быть выражена величиной, обратной относительной погрешности, взятой по модулю.

Правильность измерений – это характеристика качества измерений, отражающая близость к нулю систематической погрешности результатов измерений.

Достоверность измерений определяется степенью доверия к результату измерения и характеризуется вероятностью того, что истинное значение измеряемой величины находится в указанных пределах.

Сходимость результата измерений – характеристика качества измерений, отражающая близость друг к другу результатов измерений одной и той же величины, выполняемых повторно одними и теми же методами т средствами измерений и в одних и тех же условиях.

Воспроизводимость результатов измерений – характеристика качества измерений, отражающая близость друг к другу результатов измерений одной и той же величины, полученных в разных местах, разными методами и средствами измерений, разными операторами, но приведенных к одним и тем же условиям.

  1. Классификация измерений

Измерения классифицируются по нескольким признакам.

а) По зависимости измеряемой величины от времени:

    статические (измеряемая величина остается постоянной во времени в процессе измерения);

    динамические (измеряемая величина изменяется в процессе измерения).

б) По сложившимся совокупностям измеряемых величин:

    электрические ;

    механические ;

    теплотехнические ;

    физико-химические ;

    радиационные ;

    и т.д .

в) По условиям, определяющим точность результата:

    измерения максимально возможной точности , достижимой при современном уровне техники. Это измерения, связанные с созданием и воспроизведением эталонов, а также измерения универсальных физических констант;

    контрольно-поверочные измерения , погрешности которых не должны превышать заданного значения. Такие измерения осуществляются государственными и ведомственными метрологическими службами;

    технические измерения , в которых погрешность результата определяется характеристиками средств измерений. Технические измерения являются наиболее распространенными и выполняются во всех отраслях хозяйства и науки. К ним, в частности, относятся и технологические измерения.

г) По числу измерений (наблюдений), выполняемых для получения результата:

    измерения с однократным наблюдением (обыкновенные );

    измерения с многократными наблюдениями (статистические ).

Под наблюдением при измерении в данном случае понимают экспериментальную операцию, выполняемую в процессе измерения, в результате которой получают одно значение из группы значений величины, подлежащих совместной обработке для получения результатов измерения.

д) По способу получения результата (по виду уравнения измерения):

    прямые измерения – измерения, при которых искомое значение величины находят непосредственно из опытных данных. В процессе прямого измерения объект измерения приводится во взаимодействие со средством измерений и по показаниям последнего, отсчитывают значение измеряемой величины или указанные измерения умножаются на постоянный коэффициент для определения значения измеряемой величины. Математически прямое измерение можно описать выражением (2). Примером прямых измерений могут служить: измерение длины линейкой, массы с помощью весов, температуры термометром и т.д. К прямым измерениям относят измерения подавляющего большинства параметров химико-технологических процессов.

    косвенные измерения - измерения, при которых искомое значение величины находят на основании известной зависимости между этой величиной и величинами, подвергаемыми прямым измерениям.

Примером косвенных измерений могут служить измерения: плотности однородного тела по его массе и объему, электрического сопротивления по падению напряжения и силе тока и т.д.

В современных микропроцессорных измерительных приборах очень часто вычисления искомой измеряемой величины производятся “внутри” прибора. Измерения, проводимые такого рода средствами измерений, относятся к прямым измерениям. К косвенным измерениям относятся только такие измерения, при которых расчет осуществляется в ручную или автоматически, но после получения результатов прямых измерений. При этом может быть учтена отдельно погрешность расчета.

    совокупные измерения – проводимые одновременно измерения нескольких одноименных величин, при которых искомые значения величины находят решением системы уравнений, получаемых при прямых измерениях различных сочетаний этих величин.

Пример . Нахождение сопротивлений двух резисторов по результатам измерения их сопротивлений при последовательном и параллельном включении резисторов.

R2= (R 1 *R 2)/ (R 1 +R 2)

    совместные измерения – проводимые одновременно измерения двух или нескольких не одноименных величин для нахождения зависимости между ними.

Например . При определении зависимости сопротивления резистора от температуры используют известное выражение:

где R t – сопротивление резистора при некоторой температуре t; R 20 – сопротивление резистора при температуре 20 о С; α и β – температурные коэффициенты. Искомые значения R 20 , α и β находят решением системы трех уравнений, составленной для трех различных значений температуры. Здесь сопротивление R t и температура t измеряются прямым способом.

Кроме приведенных выше признаков классификации измерений для конкретных случаев при необходимости могут быть использованы и другие. Например, измерения можно подразделить в зависимости от места выполнения на лабораторные и промышленные; в зависимости от процедуры выполнения во времени – на непрерывные и периодические; в зависимости от формы представления результатов – на абсолютные и относительные и т.д.

Качество результатов измерений характеризуется точностью, достоверностью, правильностью, сходимостью и воспроизводимостью измерений, а также размером допускаемых погрешностей.

Точность – качество измерений, отражающее близость их результатов к истинному значению измеряемой величины. Её количественно оценивают обратной величиной модуля относительной погрешности. Например, если погрешность составляет 10 - 6 , тогда точность будет равна 10 6 .

Достоверность измерений характеризует степень доверия к результатам измерений. Эту достоверность определяют на основе законов теории вероятности и математической статистики.

Правильность измерений – качество измерений, отражающее близость к нулю систематических погрешностей в результатах измерений.

Сходимость – качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в одинаковых условиях; также отражает влияние случайных погрешностей.

Воспроизводимость – такое качество измерений, которое отражает близость друг к другу результатов измерений, выполняемых в различных условиях, в различное время, в различных местах, различными методами и средствами.

Особое внимание следует уделить элементам теории погрешностей

Погрешность – отклонение результата измерения от истинного (действительного) значения измеряемой величины.

Погрешность средства измерения (СИ) – разность между показанием средства измерения и истинным (действительным) значением измеряемой ФВ. Она характеризует точность результатов измерений, проводимых данным средством.

Эти два понятия близки друг другу и классифицируются по одинаковым признакам (рис. 3).

По способу выражения различают абсолютную, относительную и приведенную погрешности.

Абсолютная погрешность описывается формулой:

где Х – результат измерения,

Q – истинное (действительное) значение измеряемой величины. Абсолютная погрешность выражается в тех же единицах измерения, что и сама измеряемая величина. Однако она не может служить в полной мере показателем точности измерений, так как одно и то же ее значение, например, Δ = 0,05 мм при Х= 100 мм соответствует высокой точности, а при Х = 2 мм – низкой. Поэтому вводится понятие относительной погрешности. Относительной погрешностью называется отношение абсолютной погрешности измерения к истинному значению измеряемой величины:

.

Ее выражают в относительных единицах или процентах. Эта характеристика точности результата измерения не годится для нормирования погрешности средства измерений, так как при измерении значений Q принимает различные значения вплоть до бесконечности при Q = 0. В связи с этим для указания и нормирования погрешности СИ используется еще одна разновидность погрешностей – приведенная.

Приведенная погрешность – это относительная погрешность, в которой абсолютная погрешность СИ отнесена к условно принятому значению Q N ,постоянному во всем диапазоне измерений или его части:

.

Условно принятое значение Q N называют нормирующим . Чаще всего за него принимают верхний предел измерений данного СИ, применительно к которым и используется главным образом понятие «приведенная погрешность».

По характеру проявления погрешности делятся на случайные, систематические, прогрессирующие и грубые (промахи).

В литературе встречаются и другие, более точные признаки по данному типу классификации погрешностей: причина возникновения, способы выявления и возможность устранения.

Погрешность представляет собой сумму целого ряда составляющих, каждая из которых имеет свою причину.

Надо отметить, что обязательными составляющими погрешности являются случайная и систематическая погрешности, которые характерны лишь для стационарных случайных процессов. Однако могут быть и нестационарные случайные процессы, где в силу уже вступает прогрессирующая (дрейфовая) погрешность – непредсказуемая погрешность, медленно меняющаяся во времени. Прогрессирующая погрешность, как и грубая (промах) не всегда входит в результат измерения.

Можно выделить следующие причины возникновения составляющих погрешности:

1) связана с операцией настройки СИ или состояние смещением уровня настройки СИ во время эксплуатации;

2) связана с установкой объекта измерения на измерительную позицию;

3) связана с процессом получения, преобразования и выдачи информации в измерительной цепи СИ (касается тщательности измерения);

4) связана с внешними воздействиями на средство и объект измерения (изменение температуры, вибрация и др.);

5) связана со свойствами измеряемого объекта;

6) связана с квалификацией и состоянием рабочего.

Способы выявления и возможность устранения для каждого вида погрешностей подбираются индивидуально.

Случайная погрешность является составляющей погрешности измерений, изменяющейся случайным образом (по знаку и значению) при повторных измерениях одной и той же величины, проведенных с одинаковой тщательностью в одних и тех же условиях. Случайные погрешности неизбежны, неустранимы и всегда присутствуют в результате измерения. Описание случайных погрешностей возможно только на основе теории случайных процессов и математической статистики. В отличие от систематических случайные погрешности нельзя исключить из результатов измерений путем введения поправки, однако их можно существенно уменьшить путем увеличения числа наблюдений. Случайную погрешность выявляют путем повтора измерения не менее трех раз.

ПОГРЕШНОСТИ

Рис. 3. Классификации погрешностей

Систематическая погрешность – это составляющая погрешности результата измерений, которая всегда остается постоянной или закономерно меняется при повторных измерениях одной и той же величины. Отличительный признак данной погрешности заключается в том, что они могут быть предсказаны, обнаружены и благодаря этому почти полностью устранены введением соответствующей поправки.

Прогрессирующая погрешность может быть скорректирована поправками только в данный момент времени, а далее вновь непредсказуемо меняться. Поэтому для описания изменения прогрессирующих погрешностей во времени необходимы уточнения (оговорки) даже в рамках хорошо разработанной теории.

Грубая погрешность (промах – это случайная погрешность результата отдельного наблюдения, входящего в ряд изменений, которая для данных условий резко отличается от остальных результатов этого ряда. К промахам относят: ошибки оператора (его психофизиологическое состояние), неверный отсчет, ошибки записи, вычисления, неправильность включения, кратковременные резкие изменения условий проведения измерения (вибрация, поступление холодного воздуха, толчки прибора). Если промахи обнаруживаются в процессе измерений, то результаты, их содержащие, отбрасывают. Однако чаще всего промахи выявляют только при окончательной обработке результатов измерений с помощью специальных критериев, которые рассмотрены во второй главе (п. 2.7).

В зависимостиот влияния характера изменения измеряемых величин погрешности делят на статические и динамические.

Статическая погрешность – погрешность, независящая от скорости изменения измеряемой величины во времени, а зависящая от условий и режимов измерений. Например: приборная погрешность – погрешность СИ.

Динамическая погрешность – погрешность, зависящая от скорости изменения измеряемой величины во времени, то есть когда погрешность изменяется прямо пропорционально измеряемой величине или находится в какой-нибудь возрастающей закономерности. Данная погрешность обусловлена несоответствием реакции СИ на скорость (частоту) изменения измеряемого сигнала. Примером такой погрешности может быть погрешность спидометра, увеличивающаяся с ростом скорости автомобиля.

В зависимости от места возникновения различают инструментальные, методические и субъективные погрешности.

Инструментальная погрешность обусловлена погрешностью применяемого СИ (иногда эту погрешность называют аппаратурной ).

Методическая погрешность измерения обусловлена:

· расхождениями в принятой модели объекта измерения и моделью, приближенной к реальности;

· влиянием способов использования СИ. (например, влияние внутреннего сопротивления вольтметра зависит от варианта включения в электрическую схему);

· влиянием алгоритмов (формул), по которым производятся расчеты результатов измерений;

· влиянием других факторов, не связанных со свойствами используемых средств измерений (наложение шумового фона, например, грозы на измерение уровня шума, производимого самолетом; влияние электромагнитных полей при измерении электромагнитных характеристик поля, создаваемого определенным объектом).

В отличие от инструментальной (аппаратурной) методическая погрешность не указывается в нормативно-технической документации СИ, так как она от него не зависит, а возникает исключительно от методических ошибок оператора и уровня развития научно-технической базы.

Субъективная (личная) погрешность измерения обусловлена погрешностью отсчета оператором показаний по шкалам СИ, диаграммам регистрирующих приборов. Она вызывается состоянием оператор, его положением во время работы, несовершенством органов чувств, эргономическими свойствами СИ. Характеристики личной погрешности определяют на основе нормированной номинальной цены деления шкалы измерительного прибора (или диаграммной бумаги регистрирующего прибора) с учетом способности «среднего оператора» к интерполяции в пределах деления шкалы.

По зависимости абсолютной погрешности от значений измеряемой величины различают погрешности (рис. 4):

· аддитивные (Δ а), не зависящие от измеряемой величины;

· мультипликативные (Δ м), которые прямо пропорциональны измеряемой величине;

· нелинейные (Δ н), имеющие нелинейную зависимость от измеряемой величины.

Данные виды погрешностей применяют в основном для описания метрологических характеристик СИ. Разделение погрешностей на аддитивную, мультипликативную и нелинейную является существенным при решении вопроса о нормировании и математическом описании погрешностей СИ.

САНКТ-ПЕТЕРБУРГСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ СЕРВИСА И ЭКОНОМИКИ

по дисциплине: «Метрология, стандартизация, сертификация»

на тему: «Погрешность измерений. Точность и достоверность результатов измерений»

Выполнила:

Курс: 3, заочное отделение

Специальность: Экономика и управление на предприятии (здравоохранения)

Санкт-Петербург, 2008

Введение 3

Погрешность измерений 4

Точность и достоверность результатов измерений 9

Заключение 11

Список использованной литературы 12

Введение

Метрология как наука и область практической деятельности человека зародилась в глубокой древности. На всем пути развития человеческого общества измерения были основой взаимоотношений людей между собой, с окружающими предметами, с природой. При этом вырабатывались определенные представления о размерах, формах, свойствах предметов и явлений, а также правила и способы их сопоставления.

С течением времени и развитием производства ужесточились требования к качеству метрологической информации, что привело в итоге к созданию системы метрологического обеспечения деятельности человека.
В данной работе мы рассмотрим одно из направлений метрологического обеспечения - метрологическое обеспечение деятельности по сертификации и стандартизации продукции в Российской Федерации.

Погрешность измерений

Метрология – наука об измерениях, методах средствах обеспечения их единства и способах достижения требуемой точности.

Измерение – нахождение значения физической величины опытным путем с помощью спец тех средств.

Значение физической величины это - количественная оценка, т.е. число, выраженное в определенных единицах, принятых для данной величины. Отклонение результата измерения от истинного значения физической величины называют погрешностью измерения:

где А – измеренное значение, А0 – истинное.

Так как истинное значение неизвестно, то погрешность измерения оценивают исходя из свойств прибора, условий эксперимента, анализа полученных результатов.

Обычно объекты исследования обладают бесконечным множеством свойств. Такие свойства называют существенными или основными. Выделение существенных свойств называют выбором модели объекта. Выбрать модель - значит установить измеряемые величины, в качестве которых принимают параметры модели.

Идеализация, присутствующая при построении модели, обуславливает несоответствие между параметром модели и реальным свойством объекта. Это приводит к погрешности. Для измерений необходимо, чтобы погрешность была меньше допустимых норм.

Виды, методы и методики измерений.

В зависимости от способа обработки экспериментальных данных различают прямые, косвенные, совокупные и совместные измерения.

Прямые - измерение, при котором искомое значение величины находят непосредственно из опытных данных (измерение напряжения вольтметром).

Косвенные - измерение, при котором искомое значение величины вычисляется по результатам прямых измерений других величин (коэффициент усиления усилителя вычисляют по измеренным значениям входного и выходного напряжений).

Результат, полученный в процессе измерения физической величины на некотором временном интервале - наблюдением. В зависимости от свойств исследуемого объекта, свойств среды, измерительного прибора и других причин измерения выполняют с однократным или многократным наблюдениями. В последнем случае для получения результата измерения требуется статистическая обработка наблюдений, а измерения называют статистическими.

В зависимости от точности оценки погрешности различают измерения с точным или с приближенным оцениванием погрешности. В последнем случае учитывают нормированные данные о средствах и приближенно оценивают условия измерений. Таких измерений большинство. Метод измерения – совокупность средств и способов их применения.

Числовое значение измеряемой величины определяют путем её сравнения с известной величиной - мерой.

Методика измерений - установленная совокупность операций и правил, выполнение которых обеспечивает получение результата измерений в соответствии с выбранным методом.

Измерение – единственный источник информации о свойствах физических объектов и явлений. Подготовка к измерениям включает:

· анализ поставленной задачи;

· создание условий для измерений;

· выбор средств и методов измерений;

· подготовку оператора;

· опробование средств измерений.

Достоверность результатов измерений зависит от условий, в которых выполнялись измерения.

Условия – это совокупность величин, влияющих на значение результатов измерения. Влияющие величины разделяются на следующие группы: климатические, электрические и магнитные (колебания электрического тока, напряжения в сети), внешние нагрузки (вибрации, ударные нагрузки, внешние контакты приборов). Для конкретных областей измерений устанавливают единые нормальные условия. Значение физической величины, соответствующее нормальному, называют номинальным. При выполнении точных измерений применяют специальные средства защиты, обеспечивающие нормальные условия.

Организация измерений имеет большое значение для получения достоверного результата. Это в значительной мере зависит от квалификации оператора, его технической и практической подготовки, проверки средств измерений до начала измерительного процесса, а также выбранной методики проведения измерений. Во время выполнения измерений оператору необходимо:

· соблюдать правила по технике безопасности при работе с измерительными приборами;

· следить за условиями измерений и поддерживать их в заданном режиме;

· тщательно фиксировать отсчеты в той форме, в которой они получены;

· вести запись показаний с числом цифр после запятой на две больше, чем требуется в окончательном результате;

· определять возможный источник систематических погрешностей.

Принято считать, что погрешность округления при снятии отсчета оператором не должна изменять последнюю значащую цифру погрешности окончательного результата измерений. Обычно ее принимают равной 10 % от допускаемой погрешности окончательного результата измерений. В противном случае число измерений увеличивают настолько, чтобы погрешность округления удовлетворяла указанному условию. Единство одних и тех же измерений обеспечивается едиными правилами и способами их выполнения.

Выполнение измерений.

Слагаемые делят на погрешность меры, погрешность преобразования, погрешность сравнения, погрешность фиксации результата. В зависимости от источника возникновения могут быть:

· погрешности метода (из-за неполного соответствия принятого алгоритма математическому определению параметра);

· инструментальные погрешности (из-за того, что принятый алгоритм не может быть точно реализован практически);

· внешние ошибки - обусловлены условиями, в которых проводятся измерения;

· субъективные ошибки - вносятся оператором (неправильный выбор модели, ошибки отсчитывания, интерполяции и т.д.).

В зависимости от условий применения средств выделяют:

· основную погрешность средства, которая имеет место при нормальных условиях (температура, влажность, атмосферное давление, напряжение питания и т.д.), оговоренных ГОСТ;

· дополнительную погрешность, которая возникает при отклонении условий от нормальных.

В зависимости от характера поведения измеряемой величины различают:

· статическую погрешность - погрешность средства при измерении постоянной величины;

· погрешность средства измерения в динамическом режиме. Она возникает при измерении переменной во времени величины, из-за того, что время установления переходных процессов в приборе больше интервала измерения измеряемой величины. Динамическая погрешность определяется как разность между погрешностью измерения в динамическом режиме и статической погрешностью.

По закономерности проявления различают:

· систематическую погрешность - постоянную по величине и знаку, проявляющуюся при повторных измерениях (погрешность шкалы, температурная погрешность и т.д.);

· случайную погрешность - изменяющуюся по случайному закону при повторных измерениях одной и той же величины;

· грубые погрешности (промахи) следствие небрежности или низкой квалификации оператора, неожиданных внешних воздействий.

По способу выражения различают:

· абсолютную погрешность измерения, определяемую в единицах измеряемой величины, как разность между результатом измерения А и истинным значением А 0:

· относительную погрешность - как отношение абсолютной погрешности измерения к истинному значению:

Так как А 0 =А n , то на практике в вместо А 0 подставляют А п.

Абсолютную погрешность измерительного прибора

Δ n =A n -A 0 ,

где А п - показания прибора;

Относительную погрешность прибора:

Приведенную погрешность измерительного прибора

где L - нормирующее значение, равное конечному значению рабочей части шкалы, если нулевая отметка находится на краю шкалы; арифметической сумме конечных значений шкалы (без учета знака), если нулевая отметка находится внутри рабочей части шкалы; всей длине логарифмической или гиперболической шкалы.

Точность и достоверность результатов измерений

Точность измерений - степень приближения измерения к действительному значению величины.

Достоверность – это характеристика знаний как обоснованных, доказанных, истинных. В экспериментальном естествознании достоверными знаниями считаются те, которые получили документальное подтверждение в ходе наблюдений и экспериментов. Наиболее полным и глубоким критерием достоверности знаний является общественно-историческая практика. Достоверные знания следует отличать от вероятностных знаний, соответствие которых действительности утверждается только в качестве возможной характеристики.

Сущность этого метода заключается в том, что по некоторой выборке устанавливается интервал, в котором с заданной вероятностью содержится значение исследуемого параметра генеральной совокупности.

Вероятность Р,признаннаядостаточной для уверенного суждения об исследуемом параметре генеральной совокупности на основании выборочных показателей,называетсядоверительной . Выбор того или иного значения доверительной вероятности осуществляется исходя из практических соображений и той ответственности, с которой делаются выводы о параметрах генеральной совокупности. В особенно ответственных медицинских экспериментах выбирают P= 0,999; в остальных случаях P= 0,95.

Алгоритм данного метода заключается в выполнении следующих операций:

1. Определяют по формуле (1) среднее арифметическое результатов измерений исследуемой выборки.

2. По формуле (2) находят среднее квадратическое отклонение s отдельного результата измерения.

3. Определяют по формуле (3) стандартную ошибку m.

4. Вычисляют точность измерения (доверительные пределы ошибки):

(4)

где t n , p - критерий Стьюдента, зависящий от числа степеней свободы n = n - 1 и выбранной доверительной вероятности P=0,95; 0,99 или 0,999. Критерий Стьюдента находят по таблице 1 (см. стр.14).

5. Определяют доверительный интервал, в котором с наперед заданной доверительной вероятностью P находится результат измеряемой величины X:

(5)

Выражение (5) означает, что значение исследуемого параметра Х с выбранной доверительной вероятностью P не выйдет за пределы интервала [ - Dm , + Dm], т.е.

Задание № 1 .

При анализах крови больного, взятых за 10 дней, получены следующие показатели гемоглобина:

X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 X 9 X 10
11,4 11,8 12,0 10,8 8,4 10,6 10,0 8,2 9,8 11,8

Необходимо найти:

· среднее арифметическое этих показателей;

· среднее квадратическое отклонение s;

· стандартную ошибку m;

· критерий Стьюдента t n , p при доверительной вероятности P=0,95;

· доверительный интервал, в котором находится истинное значение показателя.

СРАВНЕНИЕ ДВУХ ВЫБОРОК

Типовой задачей анализа данных в медико-биологических исследованиях является установление совпадений или различий характеристик экспериментальной и контрольной группы. Например, необходимо сравнить значения каких-то параметров до и после лечения, в процессе старения организма и т.п. Используя данный метод, можно установить, вызваны ли отличия двух независимых выборок случайными факторами или они обусловлены определённым воздействием, в том числе лечебным.

Для этого формулируются статистические гипотезы :

Гипотеза об отсутствии различий (так называемая нулевая гипотеза );

Гипотеза о значимости различий (так называемая альтернативная гипотеза ).

Для принятия решений о том, какую из гипотез (нулевую или альтернативную) следует принять, используют решающие правила – статистические критерии 35. То есть, на основании информации о результатах наблюдений (характеристиках членов экспериментальной и контрольной группы) вычисляется число, называемое эмпирическим значением критерия. Это число сравнивается с известным (например, заданным таблично) эталонным числом,

называемым критическим значением критерия.

Критические значения приводятся, как правило, для нескольких уровней значимости. Уровнем значимости называется вероятность ошибки, заключающейся в отклонении (не принятии) нулевой гипотезы, когда она верна, то есть вероятность того, что различия сочтены существенными, а они на самом деле случайны.

Обычно используют уровни значимости (обозначаемые a), равные 0,05, 0,01 и 0,001. В медико-биологических экспериментальных исследованиях обычно ограничиваются значением 0,05, то есть, грубо говоря, допускается не более чем 5%-ая возможность ошибки.

Если полученное исследователем эмпирическое значение критерия оказывается меньше или равно критическому, то принимается нулевая гипотеза – считается, что на заданном уровне значимости (то есть при том значении a, для которого рассчитано критическое значение критерия) характеристики экспериментальной и контрольной групп совпадают. В противном случае, если эмпирическое значение критерия оказывается строго больше критического, то нулевая гипотеза отвергается и принимается альтернативная гипотеза – характеристики экспериментальной и контрольной группы считаются различными с достоверностью различий 1 – a. Например, если a = 0,05 и принята альтернативная гипотеза, то достоверность различий равна 0,95 или 95%. То есть, достоверность различия характеристик – это дополнение до единицы уровня значимости при проверке гипотезы о совпадении характеристик двух независимых выборок. Другими словами, чем меньше эмпирическое значение критерия (чем левее оно находится от критического значения), тем больше степень совпадения характеристик сравниваемых объектов. И наоборот, чем больше эмпирическое значение критерия (чем правее оно находится от критического значения), тем сильнее различаются характеристики сравниваемых объектов.

В дальнейшем мы ограничимся уровнем значимости a = 0,05, поэтому, если эмпирическое значение критерия оказывается меньше или равно критическому, то можно сделать вывод, что «характеристики экспериментальной и контрольной групп совпадают на уровне значимости 0,05». Если эмпирическое значение критерия оказывается строго больше критического, то можно сделать вывод, что «достоверность различий характеристик экспериментальной и контрольной групп равна 95%».

Рассмотрим алгоритм сравнения 2-ух выборок при помощи критерия Стьюдента:

1. Определяют средние арифметические значения для первой и второй группы:

5. Вычисляют среднюю ошибку разности:


7. Находят число степеней свободы по формуле:


8. Из таблицы 1 для числа степеней свободы n находят значения трех стандартных критериев Стьюдента t st , соответствующих трем порогам достоверности: 0,95; 0,99 и 0,999.

9. Сравнивают критерий достоверности разности t d с табличными значениями критериев Стьюдента tst 0,95 , tst 0,99 , tst 0,999 .

Если расчётное значение t d будет больше стандартного tst, то различия между выборками считаются значимыми c определённой вероятностью, иначе говоря, если окажется, что:

· t d ³ tst 0,999 , то выборочная разность d достоверна с вероятностью Р = 0,999;

· tst 0,99 £ t d < tst 0,999 , то выборочная разность d достоверна с вероятностью Р =0,99;

· tst 0,95 £ t d < tst 0,99 , то выборочная разность d достоверна с вероятностью Р= 0,95;

· t d < tst 0,95 , то выборочная разность недостоверна, т.е. различия в выборках случайны и для дальнейшего исследования необходимы дополнительные измерения с большим n.

Однако для проверки гипотезы о совпадении характеристик двух групп целесообразно использование либо критерия Крамера-Уэлча (Критерий Крамера-Уэлча является более эффективным «заменителем» такого известного в физике и технике критерия как t-критерий (критерий Стьюдента), либо критерия Вилкоксона-Манна-Уитни .

Критерий Крамера-Уэлча . Эмпирическое значение данного критерия рассчитывается на основании информации об объемах N и М выборок x и y , выборочных средних x и y и выборочных дисперсиях s x 2 и s y 2 сравниваемых выборок (эти значения могут быть вычислены вручную по формулам или с помощью Microsoft Excel для Windows) по следующей формуле:

Алгоритм определения достоверности совпадений и различий характеристик сравниваемых выборок для экспериментальных данных, измеренных в шкале отношений, с помощью критерия Крамера-Уэлча заключается в следующем:

1. Вычислить для сравниваемых выборок Tэмп – эмпирическое значение критерия Крамера-Уэлча по формуле.

2. Сравнить это значение с критическим значением T 0.05 = 1,96: если T эмп ≤ 1,96, то сделать вывод: «характеристики сравниваемых выборок совпадают на уровне значимости 0,05»; если T эмп > 1,96, то сделать вывод «достоверность различий характеристик сравниваемых выборок составляет 95%».

Отметим, что мы не рассматриваем вопрос о том, «в какую сторону» экспериментальная группа отличается от контрольной, то есть, улучшились или ухудшились (с содержательной точки зрения, не имеющей отношения к статистическим методам и являющейся прерогативой биологии и медицины) исследуемые характеристики.

Задание № 2 .

Имеется две выборки результатов измерений скорости кровотока 10 пациентов до и после наркоза:

До наркоза

Необходимо установить: влияет ли наркоз на скорость кровотока? Оцените различие двух выборок критериями Стьюдента и Крамера-Уэлча.

ИССЛЕДОВАНИЕ ЗАВИСИМОСТЕЙ

Рассмотренные в предыдущих разделах описательная статистика и статистические критерии позволяли, соответственно, компактно представлять полученные результаты и определять сходства и различия, то следующим этапом анализа данных обычно является исследование зависимостей. Для этих целей применяются корреляционный анализ и дисперсионный анализ (для установления факта наличия/отсутствия зависимости между переменными), а также регрессионный анализ (для нахождения количественной зависимости между переменными).

Корреляционный анализ

Вообще, в природе, и в медицине в частности, существуют вполне определённые связи признаков. Например, связь между строением тела и предрасположенностью к тем или иным заболеваниям, связь между телосложением и темпераментом.

Наиболее простым видом связи между величинами является функциональная зависимость, когда какая-либо величина определяется как однозначная функция другой или нескольких других величин. Иными словами, функциональная связь – это такая связь между переменными, при которой каждому значению одной величины соответствуют строго определённые значения другой. Например, к функциональной относится зависимость между высотой местности и насыщением гемоглобина кислородом.

Однако, нередко встречаются и такие связи между величинами, которые нельзя отнести к функциональным зависимостям. К ним, например, относятся связи между урожаем и количеством осадков или между ростом отцов и сыновей. Известно, что между ростом и массой тела человека существует положительная связь, т.е. более высокие люди обычно имеют большую массу, но бывают и исключения.

Если связь между показателями проявляется не в каждом случае, а заметна лишь при многократном сопоставлении рассматриваемых признаков, то её называют корреляционной (от лат. correlatio – связь, соответствие).

Корреляция (Correlation) – связь между двумя или более переменными (в последнем случае корреляция называется множественной). Цель корреляционного анализа – установление наличия или отсутствия этой связи.

Корреляционная зависимость характеризуется тем, что каждому значению одной величины соответствует множество возможных значений другой величины. Например, при росте человека 170 см масса тела может быть 70 кг, 65 кг, 72 кг и т.д. Случайный разброс этих возможных значений объясняется влиянием большого числа дополнительных факторов, от которых отвлекаются, изучая связь между данными величинами.

Пусть сделаны измерения двух признаков Х и У: Х 1 , Х 2 ,...,Х n и У 1 , У 2 ,...,У n .

Необходимо установить,существует ли связь между изменениями признаков Х и У и, если эта связь существует, то определить её тип, глубину и достоверность.

Для качественной оценки связи между признаками строят график.

Экспериментальные графики для величин Х и У, находящихся в корреляционной зависимости, состоят из ряда точек, не укладывающихся на какую-либо определённую кривую. Каждая точка (x,y) на плоскости отображает результат одного измерения. Такой точечный график называют корреляционным полем . По корреляционному полю можно качественно оценить наличие или отсутствие зависимости и указать положительна она или отрицательна. Количественная оценка. В случае, когда имеются две переменных, значения которых измерены в цифровой шкале отношений (единицы измерений при этом не важны – например, масса тела может быть измерена в граммах, килограммах, тоннах – они не влияют на значение коэффициента корреляции), используется коэффициент линейной корреляции Пирсона r, который принимает значения от -1 до +1 (нулевое его значение свидетельствует об отсутствии корреляции.

Рис. 3. Величины коэффициента линейной корреляции в различных

ситуациях

Проанализировав знак коэффициента корреляции, определяют тип корреляционной связи:

если r > o, то связь прямая (положительная), т.е. при возрастании одной величины другая в среднем тоже возрастает;

если r < o, то связь обратная (отрицательная), т.е. при возрастании одной величины другая имеет тенденцию в среднем убывать.

Если статистическая связь между признаками отсутствует, то r = 0.

Величина коэффициента корреляции показывает глубину линейной связи между двумя выборками, т.е. характеризует степень близости зависимости величин X и Y к линейной функциональной зависимости. Графически это выражается теснотой или разбросанностью точек корреляционного поля.

Глубина корреляционной связи определяется, исходя из следующих критериев:

если 0< |r| £0,3, то связьслабая;

если 0,3< |r| £0,5, то связь умеренная;

если 0,5< |r| £0,7, то связь значительная;

если 0,7< |r| £0,9, то связь сильная;

если 0,9< |r| <1, то связь очень сильная.

При |r| =1 связь между величинами функциональная.

Таким образом, чем ближе абсолютная величина r к единице, тем сильнее связь между признаками и теснее расположены точки на графике.

Однако, для обоснованного вывода о наличии связи не достаточно анализа величины коэффициента корреляции; необходимо проверить его достоверность. Иными словами, требуется ответить на вопрос: является ли вычисленный по данным наблюдений коэффициент корреляции значимым, т.е. можно ли верить полученному значению коэффициента, учитывая случайный характер выборок значений исследуемых величин.

Значимость корреляционной связи при определённом уровне доверительной вероятности можно проверить с помощью критерия Стьюдента.

В случаелинейной корреляции между признаками Х и У алгоритм расчетов по данному методу следующий:

1. Вычисляют средние арифметические значения обоих признаков:


3. Вычисляют отклонения каждого значения y i от у:


5. Вычисляют произведение сумм квадратов отклонений:


7. Оценивают тип и глубину корреляционной связи между признаками Х и У.

8. Вычисляют среднюю ошибку коэффициента корреляции:


10. Из таблицы 1 для числа степеней свободы n = n - 2 определяют стандартные значения критериев Стьюдента, соответствующие трем порогам достоверности: 0,95; 0,99; 0,999.

11. Сравнивают критерий достоверности t r со стандартными значениями критериев Стьюдента и делают вывод о достоверности коэффициента корреляции:

· если t r ³ tst 0,999 , то достоверность коэффициента корреляции 99,9%;

· если t r ³ tst 0,99 , то достоверность коэффициента корреляции 99%;

· если t r ³ tst 0,95 , то достоверность коэффициента корреляции 95%;

· если t r < tst 0,95 , то коэффициент корреляции недостоверен, доверять ему нельзя.

Задание № 3 .

В ходе обследования 9 пациентов среди прочих показателей измеряли их рост и вес. Результаты измерений приведены в таблице:

X i Рост, см
Y i Вес, кг

Необходимо провести корреляционный анализ между весом и ростом пациентов. Построить корреляционное поле.

Коэффициент корреляции Пирсона также может быть вычислен в программе Excel: «Сервис\Анализ данных\Корреляция». Отметим, что коэффициент корреляции Пирсона симметричен, то есть не зависит от перестановки переменных: r (x0, x ) = r (x, x0 ).

Универсальных рецептов установления корреляции между немонотонно и нелинейно связанными переменными на сегодняшний день не существует.

Отметим, что большое (близкое к плюс единице или к минус единице) значение коэффициента корреляции говорит о связи переменных, но ничего не говорит о причинно-следственных отношениях между ними. Так, например, из высокой корреляции температуры воздуха за окном и времени суток нельзя делать вывод о том, что движение солнца обусловлено изменениями температуры воздуха.

Итак, корреляционный анализ позволяет устанавливать наличие или отсутствие зависимости между переменными. Другим инструментом, дающим ответ на этот вопрос, является дисперсионный анализ, который не является предметом рассмотрения данной работы.

Регрессионный анализ

Если корреляционный и дисперсионный анализ дают ответ на вопрос, существует ли взаимосвязь между переменными, то регрессионный анализ предназначен для того, чтобы найти «явный вид» этой зависимости.

Цель регрессионного анализа – найти функциональную зависимость между переменными. Для этого предполагается, что зависимая переменная (иногда называемая откликом ) определяется известной функцией (иногда говорят – моделью ), зависящей от зависимой переменной или переменных (иногда называемых факторами ) и некоторого параметра. Требуется найти такие значения этого параметра, чтобы полученная зависимость (модель) наилучшим образом описывала имеющиеся экспериментальные данные.

Рассмотрим геометрическую интерпретацию этого вопроса. Перенесём имеющийся набор экспериментальных точек на плоскость, и, тем самым, построим корреляционное поле. Нам необходимо провести линию, которая наилучшим образом отображает закон размещения опытных точек. Эта линия должна проходить как можно ближе по отношению ко всем точкам корреляционного поля. Называют её линией регрессии . Поскольку здесь мы рассматриваем самый простой вид корреляционной зависимости – линейную корреляцию, то линией регрессии будет прямая, а уравнение прямой, как известно, можно записать в виде Y=AX+B.



Рис. 4. Корреляционное поле с линией регрессии.

Например, в простой линейной регрессии предполагается, что зависимая переменная y является линейной функцией y = a x + b от независимой переменной x . Требуется найти значения параметров a и b , при которых прямая a x + b будет наилучшим образом описывать (аппроксимировать) экспериментальные точки (x 1 , y 1 ), (x 2 , y 2 ), …, (x n , y n ).Для поиска параметров обычно используют метод наименьших квадратов – ищут такие значения параметров, чтобы сумма по всем экспериментальным точкам квадратов расстояний (по вертикали) от них до построенной зависимости была минимальной. Линейной регрессионной моделью для двух случайных величин X и Y будем называть уравнение вида Y=AX+B, где A и B – коэффициенты регрессии, которые определяются по выборке наблюдений случайных величин X и Y.

Используя один из математических методов, было доказано, что коэффициенты регрессии вычисляются по формулам:


где x i и y i - элементы выборок (i=1,...,n).

Регрессионный анализ, помимо того, что он позволяет количественно описывать зависимость между переменными, дает возможность прогнозировать значения зависимых переменных – подставляя в найденную формулу значения независимых переменных, можно получать прогноз значений зависимых.

Задание №4 .

Имеются данные измерений роста X (см) и веса Y (кг) новорождённых:

X i
Y i 3,2 2,9 3,3 2,6 3,1 3,5 3,0 3,7 3,8 3,4 4,1 3,5 4,0 3,7 3,6

Проведите регрессионный анализ: составьте уравнение линейной регрессии и таблицу наилучшего соответствия веса для роста: 50, 51 и 52 см. Оцените вес ребенка ростом 55 см.

Простая линейная регрессия может быть построена и в программе Excel для Windows («Сервис\Анализ данных\Регрессия»).

Можно использовать полиномиальную регрессию , в которой предполагается, что зависимая переменная является полиномом некоторой степени от независимой переменной (напомним, что линейная зависимость является полиномом первой степени). Например, полиномом второй степени будет зависимость вида

y = a x2 + b x + c и задачей регрессии будет нахождение коэффициентов a, b и c .

При этом следует помнить, что построенная модель «локальна», то есть, получена для некоторых вполне конкретных значений переменных. Экстраполяция результатов модели на более широкие области значений переменных может привести к ошибочным выводам. Например, если моделировать эндотоксикоз путем повреждения ткани поджелудочной железы, то к токсическому компоненту присоединится банальный протеолитический компонент от ферментов разрушающейся железы. Соответствующие крайне высокие значения прогнозироваться данной моделью на основе регрессионного анализа, естественно, не будут. При хроническом токсическом процессе необратимые изменения в печени и почках по-иному будут воздействовать на формирование пула, занижая значения показателя, предсказанные формулой регрессии.


Таблица 1

Граничные значения t - критерия Стьюдента

Число степеней свободы Доверительная вероятность
n P=0,95 P=0,99 P=0,999
12,706 63,657 636,619
4,303 9,925 31,598
3,182 5,841 12,941
2,776 4,604 8,610
2,571 4,032 6,859
2,447 3,707 5,959
2,365 3,499 5,405
2,306 3,355 5,041
2,262 3,250 4,781
2,228 3,169 4,587
2,201 3,106 4,487
2,179 3,055 4,318
2,160 3,012 4,221
2,145 2,977 4,140
2,131 2,947 4,073
2,120 2,921 4,015
2,110 2,898 3,965
2,101 2,878 3,922
2,093 2,861 3,883
2,086 2,845 3,850
2,080 2,831 3,819
2,074 2,819 3,792
2,069 2,807 3,767
2,064 2,797 3,745
2,060 2,787 3,725
2,056 2,779 3,707
2,052 2,771 3,690
2,048 2,763 3,674
2,045 2,756 3,659
2,042 2,750 3,646
31-34 2,0 2,7 3,6
35-42 2,0 2,7 3,6
43-62 2,0 2,7 3,5
63-175 2,0 2,6 3,4
более 175 2,0 2,6 3,3
a=0,05 a=0,01 a=0,001
Уровень значимости

Таблица даёт значения введённой Стьюдентом величины t для уровней значимости a, наиболее часто применяющихся при нахождении критериев значимости и границ доверительного интервала.

Доверительная вероятность P=1- a.


Похожая информация.