Как определить что перед тобой данные систематической погрешности
Статистические методы выявления систематической погрешности
Выявить отсутствие или наличие систематической ( и не только систематической ) погрешности на стадии анализа результатов помогают специальные статистические методы. В каждом из этих методов используется определенный критерий (обозначим его в общем случае символом φ). При этом могут возникнуть следующие ошибки.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Будем далее рассматривать ошибки первого рода. Вероятность q такой ошибки называется уровнем значимости. Соответственно, вероятность P принятия правильной гипотезы называется доверительной вероятностью, при этом q = 1 ‑ Р.
Заметим, что если признаком правильности выбранной гипотезы является неравенство φ φкр,то с увеличением доверительной вероятности Р величина φкр также увеличивается. Таким образом, чем больше доверительная вероятность, тем строже должно быть неравенство.
Рассмотрим следующие статистические методы.
а) Способ последовательных разностей (критерий Аббе) – для обнаружения изменяющейся во времени систематической погрешности (при числе измерений до 20).
Пусть имеется выборка из n измерений Х1, Х2, …Хn некоторого параметра Х и среднее его значение .
Определяют дисперсию выборки по формуле:
. (3.3)
Кроме того, вычисляют функцию суммы квадратов разности соседних по времени измерений по формуле:
. (3.4)
Если со временем происходило смещение центра группирования измерений, т.е. имела место переменная систематическая погрешность, очевидно, величина s 2 (Х) дает преувеличенную оценку дисперсии.
Действительно, допустим, что среднее значение измеряемой величины Х дрейфует со временем, принимая текущие значения , т.е. присутствует систематическая погрешность.
В то же время на величину Q 2 (Х) дрейф средней величины сказывается незначительно, поскольку мы оперируем с соседними по времени измерениями.
Отношение n= Q 2 (Х)/ s 2 (Х) и есть критерий обнаружения систематической, изменяющейся во времени погрешности (так называемый критерий Аббе). Чем меньше n, тем более вероятно наличие систематической погрешности. Попадание значения n в критическую область (n 2 (Х)=2,0.
.
Для всех табличных уровней значимости n > nкр., что означает отсутствие систематической погрешности.
2. Имеется ряд результатов измерения параметра Х:
Требуется выяснить наличие систематической погрешности.
Статистическая обработка данных дает следующие результаты:
= 32; s 2 (Х) = 4,4; Q 2 (Х) = 1,5.
.
Зададимся двумя значениями уровня значимости и найдем по таблице соответствующие критерии:
Это означает, что при уровне значимости q=0,05 (nкр=0,445), т.е. с вероятностью 0,95 можно утверждать, что присутствует систематическая погрешность, но с вероятностью 0,99 (nкр=0,281) этого утверждать нельзя.
б) Способ дисперсионного анализа (критерий Фишера)
В практике измерений часто бывает необходимо проверить наличие систематической погрешности вследствие влияния какого-либо фактора.
Например, при проведении испытаний мостов в процессе работы погодные условия могут меняться, и это отражается на результатах измерений.
Для выявления систематической погрешности весь массив измерений разбивают на группы по принципу различного влияния исследуемого фактора. Например, при проведении измерений некоторого параметра для выяснения, влияет ли на них температура воздуха, можно выделить в отдельные группы утренние, дневные, ночные измерения.
Пусть мы имеем всего n измерений, разбитых на s групп, и ni измерений в i-ой группе.
В каждой группе должно иметь место нормальное распределение результатов измерений. Это означает, что разброс результатов в каждой группе обусловлен лишь случайными погрешностями. Определим для каждой группы среднее арифметическое и дисперсию.
, (3.5)
где i – средний результат измерений i –ой группы,
Хi,j – результат j-го измерения в i-ой группе.
Рассеивание средних i по различным группам результатов обусловлено не только случайными погрешностями, но и систематическим воздействием фактора, по различным проявлениям которого сформированы группы. Поэтому, если мы вычислим дисперсию массива средних значений ( i), то она будет отражать различие между группами, обусловленное систематическими причинами. Такую дисперсию называют межгрупповой:
DМГ = ( i— )2, (3.6)
где — общее среднее значение по всем n результатам.
Графическое представление разбиения массива на группы и определения межгрупповой и внутригрупповой дисперсий приводится ниже на примере (рис.3.3).
Отношение F=DМГ/DВГ выражает соотношение влияния на разброс систематической и случайной погрешности. Величину F называют дисперсионным критерием Фишера.
По аналогии с критерием Аббе определены границы критических областей для критерия Фишера (Fкр) при различных значениях Р доверительной вероятности, массива результатов n, числа групп s (табл.2 приложения).
Рис 3.3. Разбиение массива на однородные группы
для определения критерия Фишера
В течение суток в разное время проведено 30 измерений провиса металлического пролетного строения, в том числе по 10 измерений – в 5 часов, 12 часов и 19 часов.
Внутригрупповая дисперсия составила 0,05 см 2 ;
Выявить, была ли систематическая погрешность, вызванная разным нагревом конструкции на протяжении суток.
Расчетное значение критерия Фишера F=0,2/0,05=4.
Табличное значение критерия Фишера:
Таким образом, в первом случае, т.е. с вероятностью 0,95, можно говорить о систематической погрешности, а во втором, т.е. с вероятностью 0,99, этого сказать нельзя.
Исправление выявленных систематических погрешностей при обработке результатов может быть выполнено путем введения поправок, нейтрализующих влияние факторов, вызывающих погрешность.
Контрольные вопросы:
1. Что такое систематическая погрешность?
2. Назовите условия уменьшения возможности появления систематической погрешности.
3. Можно ли устранить систематическую погрешность многократными измерениями?
4. Назовите известные Вам способы устранения систематической погрешности статистическими методами.
5. Объясните существо способа последовательных разностей (критерий Аббе).
6. Объясните существо способа дисперсионного анализа (критерий Фишера).
Случайные погрешности
Случайная погрешность – это составляющая погрешности измерения, которая изменяется случайным образом в серии повторных измерений одного и того же размера физической величины, проведенных с одинаковой тщательностью в одних и тех же условиях.
Случайные погрешности неизбежны, неустранимы и их можно описать и ограничить только приемами математической статистики.
При этом необходимо решить две задачи:
— установить закон распределения вероятностей случайной погрешности и убедиться, что массив измерений соответствует этому закону;
— получить интервальную оценку истинного значения измеряемой физической величины.
Применительно к исследованию свойств строительных материалов и конструкций можно утверждать, что в большинстве случаев случайные погрешности имеют вероятностную основу, подчиняющуюся нормальному закону распределения, который описывает случайные величины, зависящие от многих незначительных случайных факторов.
Поэтому в настоящем курсе мы ограничимся рассмотрением именно этого распределения. Познакомиться с другими законами распределения читатель может в специальной литературе по теории вероятностей, математической статистики, теоретической метрологии.
Итак, нормальным называется распределение вероятностей случайной величины х, подчиняющееся закону:
; (4.1)
. (4.2)
Математическое ожидание M(x) при этом равно α: среднеквадратическое отклонение (стандарт) – s.
Как видно из приведенных формул, нормальное распределение симметрично относительно математического ожидания. Путем замены переменных t = (x-a)/s это распределение можно привести к нормированного виду, для которого M (t)=0 и s (t)=1, т.е.:
; (4.1’)
— (функция Лапласа). (4.2’)
Для плотности и функции нормированного нормального распределения составлены таблицы (табл. 1 и 2 приложения).
ОПРЕДЕЛЕНИЕ СИСТЕМАТИЧЕСКИХ ПОГРЕШНОСТЕЙ.
1. Исключение известных систематических погрешностей из результатов наблюдений или измерений выполняем введением поправок к этим результатам.
Поправки по абсолютному значению равны этим погрешностям и противоположны им по знаку.
2. Введением поправок исключаем:
погрешность, возникающую из-за отклонений действительной температуры окружающей среды при измерении от нормальной;
погрешность, возникающую из-за отклонений атмосферного давления при измерении от нормального;
погрешность, возникающую из-за отклонений относительной влажности окружающего воздуха при измерении от нормальной;
погрешность, возникающую из-за отклонений относительной скорости движения внешней среды при измерении от нормальной;
погрешность, возникающую вследствие искривления светового луча (рефракции);
погрешность шкалы средства измерения;
погрешность, возникающую вследствие несовпадения направлений линии измерения и измеряемого размера.
3. Поправки по указанным погрешностям вычисляем в соответствии с указаниями таблицы.
Поправки для исключения систематических погрешностей
Продолжение таблица № 15
Обозначения, принятые в таблице:
— номинальная длина мерного прибора, мм;
— действительная длина мерного прибора, мм;
— температура средства измерения и объекта, °С;
4. Поправки могут не вноситься, если действительная погрешность измерения не превышает предельной.
Пример.
Определить систематические погрешности и записать результат с учетом различных параметров.
Решение
1. Поправка на температуру окружающей среды
мм.
Действительную длину xi фермы с учетом поправки на температуру окружающей среды принимаем равной
= 24003 + 7,7 = 24010,7 мм.
2. Поправка на относительную скорость внешней среды
мм.
мм.
Действительную длину xi фермы с учетом поправки на относительную скорость внешней среды принимаем равной
= 24003 + 2,22 = 24002,22 мм.
3. Поправка на длину шкалы средства измерения
мм.
мм.
мм.
мм.
Действительную длину xi фермы с учетом поправки на длину шкалы средства измерения принимаем равной
= 24003 + 16,002 = 24019,002 мм.
4. Поправка на несовпадение направлений линии измерения и измеряемого размера
мм.
мм.
Действительную длину xi фермы с учетом поправки несовпадение направлений линии измерения и измеряемого размера принимаем равной
= 24003 + 0,025 = 24003,025 мм.
Действительную длину xi фермы с учетом всех поправок принимаем равной
= 24003 + 7,7 + 2,22 + 16,002 + 0,025 = 24028,9 мм.
Задание
Определить систематические погрешности и записать результат с учетом различных параметров.
Данные результатов измерений приведены в таблице №16
Задача 3
А) ПРЕДВАРИТЕЛЬНАЯ ОЦЕНКА ВИДА РАСПРЕДЕЛЕНИЯ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЯ
Для предварительной оценки вида распределения по полученным данным строят гистограмму распределений или полигон распределения. В начале производится группирование – разделение данных от наименьшего xmin до наибольшего xmax на r интервалов. Для количества измерений от 30 до 100 рекомендуемое число интервалов – от 7 до 9. Ширину интервала выбирают постоянной для всего ряда данных, при этом следует иметь в виду, что ширина интервала должна быть больше погрешности округления при записи данных. Ширину интервала вычисляют по формуле
Вычисленное значение h обычно округляют. Например при h = 0,0187 это значение округляют до h = 0,02. Установив границы интервалов, подсчитывают число результатов измерений, попавших в каждый интервал. При построении гистограммы или полигона распределения масштаб этих графиков рекомендуется выбирать так, чтобы высота графика относилась к его основанию примерно как 3 к 5.
Пример
Построить гистограмму и полигон распределения по полученным экспериментальным данным, приведенным в табл. 17.
Результаты измерений
Определяем ширину интервала
Строим гистограмму распределений (рис. 1), подсчитав число экспериментальных данных, попавших в каждый интервал.
Рис.1. Гистограмма распределений результатов измерений
Далее, строим полигон распределения (рис. 2), который представляет собой кусочно-линейную аппроксимацию искомой функции плотности распределения результатов измерения.
Рис. 2. Полигон распределения результатов измерения
Б) ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ
Нормальный закон распределения, называемый часто распределением Гаусса описывается зависимостью
где σ – параметр рассеивания распределения, равный среднему квадратическому отклонению.
Широкое использование нормального распределения на практике объясняется теоремой теории вероятностей, утверждающей, что распределение случайных погрешностей будет близко к нормальному всякий раз, когда результаты наблюдений формируются под действием большого числа независимо действующих факторов, каждый из которых оказывает лишь незначительное действие по сравнению с суммарным действием всех остальных.
При количестве измерений n * – смещенное СКО;
Гипотеза о нормальности подтверждается, если
где процентные точки распределения значений d, которые находятся по табл. 18.
Значения процентных точек q для распределения d
Критерий 2. Гипотеза о нормальности распределения результатов измерения подтверждается, если не более m разностей превзошли значения S×zp/2. Здесь zp/2 – верхняя 100 ∙ P/2 – процентная точка нормированной функции Лапласа
Значения доверительной вероятности P выбирают из табл. 19.
Значения доверительной вероятности Р
Пример
В табл. 19 приведены результаты измерения угла одним оператором, одним и тем же теодолитом, в одних и тех же условиях. Проверить, можно ли считать, что приведенные в табл. 20 данные принадлежат совокупности, распределенной нормально.
Результаты исследований
Оценка измеряемой величины равна
Средние квадратические отклонения S и S * найдем по формулам:
Оценка параметра d составит
Уровень значимости критерия 1 примем q = 2%. Из табл. 18 находим d1% = = 0,92 и d99% = 0,68. При определении d1% и d99% использовалась линейная интерполяция ввиду того, что значение n = 14 в таблице отсутствует. Критерий 1 выполняется, так как В нашем случае это – 0,68
Способы обнаружения и устранения систематических погрешностей
Результаты наблюдений, полученные при наличии систематической погрешности, называются неисправленными. При проведении измерений стараются в максимальной степени исключить или учесть влияние систематических погрешностей.
Это может быть достигнуто следующими путями:
— устранением источников погрешностей до начала измерений. В большинстве областей измерений известны главные источники систематических погрешностей и разработаны методы, исключающие их возникновение или устраняющие их влияние на результат измерения. В связи с этим в практике измерений стараются устранить систематические погрешности не путем обработки экспериментальных данных, а применением СИ, реализующих соответствующие методы измерений;
— определением поправок и внесением их в результат измерения;
— оценкой границ неисключенных систематических погрешностей.
Постоянная систематическая погрешность не может быть найдена методами совместной обработки результатов измерений. Однако она не искажает ни показатели точности измерений, характеризующие случайную погрешность, ни результат нахождения переменной составляющей систематической погрешности. Действительно, результат одного измерения
Если систематическая погрешность постоянна во всех измерениях, т.е. i= ,то
Таким образом, постоянная систематическая погрешность не устраняется при многократных измерениях.
Постоянные систематические погрешности могут быть обнаружены лишь путем сравнения результатов измерений с другими, полученными с помощью более высокоточных методов и средств. Иногда эти погрешности могут быть устранены специальными приемами проведения процесса измерений. Эти методы рассмотрены ниже.
Наличие существенной переменной систематической погрешности искажает оценки характеристик случайной погрешности и аппроксимацию ее распределения. Поэтому она должна обязательно выявляться и исключаться из результатов измерений.
Для устранения постоянных систематических погрешностей применяют следующие методы:
— Метод замещения, представляющий собой разновидность метода сравнения, когда сравнение осуществляется заменой измеряемой величины известной величиной, причем так, что при этом в состоянии и действии всех используемых средств измерений не происходит никаких изменений. Этот метод дает наиболее полное решение задачи. Для его реализации необходимо иметь регулируемую меру, величина которой однородна измеряемой. Например, взвешивание по методу Борда, измерение сопротивления посредством моста постоянного тока и мер сопротивления.
— Метод противопоставления, являющийся разновидностью метода сравнения, при котором измерение выполняется дважды и проводится так, чтобы в обоих случаях причина постоянной погрешности оказывала разные, но известные по закономерности воздействия на результаты наблюдений. Например, способ взвешивания Гаусса.
— Метод компенсации погрешности по знаку (метод изменения знака систематической погрешности), предусматривающий измерение с двумя наблюдениями, выполняемыми так, чтобы постоянная систематическая погрешность входила в результат каждого из них с разными знаками.
Для устранения переменных и монотонно изменяющихся систематических погрешностей применяют следующие приемы и методы.
— Анализ знаков неисправленных случайных погрешностей.
Если знаки неисправленных случайных погрешностей чередуются с какой-либо закономерностью, то наблюдается переменная систематическая погрешность. Если последовательность знаков «+» у случайных погрешностей сменяется последовательностью знаков «-» или наоборот, то присутствует монотонно изменяющаяся систематическая погрешность. Если группы знаков «+» и «-» у случайных погрешностей чередуются, то присутствует периодическая систематическая погрешность.
— Графический метод.
Он является одним из наиболее простых способов обнаружения переменной систематической погрешности в ряду результатов наблюдений и заключается в построении графика последовательности неисправленных значений результатов наблюдений. На графике через построенные точки проводят плавную кривую, которая выражает тенденцию результата измерения, если она существует. Если тенденция не прослеживается, то переменную систематическую погрешность считают практически отсутствующей.
— Метод симметричных наблюдений.
Ее решение позволяет получить значение х, свободное от переменной систематической погрешности, обусловленной изменением коэффициента k:
Специальные статистические методы. К ним относятся способ последовательных разностей, дисперсионный анализ, и др. Рассмотрим подробнее некоторые из них.
Способ последовательных разностей (критерий Аббе).
Применяется для обнаружения изменяющейся во времени систематической погрешности и состоит в следующем. Дисперсию результатов наблюдений можно оценить двумя способами: обычным
Если в процессе измерений происходило смещение центра группирования результатов наблюдений, т.е. имела место переменная систематическая погрешность, то 2 [x] дает преувеличенную оценку дисперсии результатов наблюдений. Это объясняется тем, что на 2 [x] влияют вариации . В то же время изменения центра группирования весьма мало сказываются на значениях последовательных разностей d i = x i+1-x i, поэтому смещения почти не отразятся на значении Q 2 [x].
n | vq при q, равном | n | vq при q, равном | ||
0.001 | 0.01 | 0.05 | 0.001 | 0.01 | 0.05 |
0.295 | 0.313 | 0.390 | 0.295 | 0.431 | 0.578 |
0.208 | 0.269 | 0.410 | 0.311 | 0.447 | 0.591 |
0.182 | 0.281 | 0.445 | 0.327 | 0.461 | 0.603 |
0.185 | 0.307 | 0.468 | 0.341 | 0.474 | 0.614 |
0.202 | 0.331 | 0.491 | 0.355 | 0.487 | 0.624 |
0.221 | 0.354 | 0.512 | 0.368 | 0.499 | 0.633 |
0.241 | 0.376 | 0.531 | 0.381 | 0.510 | 0.642 |
0.260 | 0.396 | 0.548 | 0.393 | 0.520 | 0.650 |
0.278 | 0.414 | 0.564 |
Дисперсионный анализ (критерий Фишера).
В практике измерений часто бывает необходимо выяснить наличие систематической погрешности результатов наблюдений, обусловленной влиянием какого-либо постоянно действующего фактора, или определить, вызывают ли изменения этого фактора систематическое смещение результатов измерений. В данном случае проводят многократные измерения, состоящие из достаточного числа серий, каждая из которых соответствует определенным (пусть неизвестным, но различным) значениям влияющего фактора. Влияющими факторами, по которым производится объединение результатов наблюдений по сериям, могут быть внешние условия (температура, давление и т.д.), временная последовательность проведения измерений и т.п.
После проведения N измерений их разбивают на s серий (s > 3) по nj результатов наблюдений ( snj = N ) в каждой серии и затем устанавливают, имеется или отсутствует систематическое расхождение между результатами наблюдений в различных сериях. При этом должно быть установлено, что результаты в сериях распределены нормально. Рассеяние результатов наблюдений в пределах каждой серии отражает только случайные влияния, характеризует лишь случайные погрешности измерений в пределах этой серии. Характеристикой совокупности случайных внутрисерийных погрешностей будет средняя сумма дисперсий результатов наблюдений, вычисленных раздельно для каждой серии, т.е.
где , выражает силу действия фактора, вызывающего систематические различия между сериями.
Критерием оценки наличия систематических погрешностей в данном случае является дисперсионный критерий Фишера F = 2 MC 2 BC. Критическая область для критерия Фишера соответствует P (F>Fq) = q.
Из всех рассмотренных способов обнаружения систематических погрешностей дисперсионный анализ является наиболее эффективным и достоверным, так как позволяет не только установить факт наличия погрешности, но и дает возможность проанализировать источники ее возникновения.
Если закон распределения результатов измерений неизвестен, то для обнаружения систематической погрешности применяют статистический критерий Вилкоксона.
При mm>15 они рассчитываются по формулам:
Исключение систематических погрешностей путем введения поправок.
дисперсия исправленного результата
После введения поправки C tpSc результат измерения
где .
Максимальные доверительные значения погрешности результата измерения до и после введения поправки равны соответственно