Часть 3. Статистическая обработка результатов серий многократных измерений одной физической величины (2)

Часть 3. Статистическая обработка результатов серий многократных измерений одной физической величины.

Дано: массив результатов измерений одной и той же физической величины(ФВ). Данные получены при многократных измерениях заданного параметра с применением одной методики выполнения измерения(МВИ).

Требуется: построить точечные диаграммы  результатов измерений и выполнить статистическую обработку результатов измерений и отклонений результатов измерений от приписанной аппроксимации, включая проверку вида распределения по критериям согласия. По окончании стат.обработки– представить результаты измерений в  форме, установленной нормативными документами.

 

Массив данных(данные читать по столбцам):

8,013

8,154

8,196

7,979

7,968

7,824

7,986

8,099

8,224

8,242

8,168

7,993

7,722

7,796

7,811

8,087

8,133

8,292

8,134

7,971

7,785

7,837

7,898

8,178

8,193

8,32

8,17

7,949

7,787

7,734

8,004

8,24

7,987

8,058

8,213

7,927

7,844

7,811

8,003

8,279

8,107

8,248

7,989

7,905

7,817

7,828

8,034

8,311

8,167

8,1

8,036

7,883

7,82

7,883

8,049

8,181

8,149

8,213

8,039

7,951

7,715

7,896

8,063

8,112

Проанализируем имеющийся массив данных, первоначальная точечная диаграмма которого представлена на рисунке 1

Рис.1 Точечная диаграмма

Как видно из точечной диаграммы, существует некоторая систематическая зависимость, попытаемся выделить ее применив статистический программный пакет.

Первоначально попробуем построить регрессионную модель параболы, как показано на рисунке 2.

 

Рис 2. Регрессионная модель второго порядка массива данных

 

Как видно из рисунка, за 95% границу выходит большое число значений, поэтому попробуем провести анализ при помощи другого инструмента, результаты применения которого представлены на рисунке 2.

 

Рис.2 Применение метода взвешенных квадратов

Как видно из рисунка, аппроксимация параболой не самый лучший выход из ситуации, а аппроксимация вторым методом не дает ни одной из общепринятых при анализе точечных диаграмм, поэтому разобъем массив данных на два подмассива

  1. до 20 точки включительно
  2. все остальные

Построим регрессии обоих подмассивов и проанализируем результаты.

Рис 3 Регрессия первого подмассива данных

 

 

Рис.4 Регрессия второго подмассива данных

Как видно из построенных графиков, существует два тренда, вид функции которых показан на рисунках:

Для 1-ого массива данных функция зависимости

y = 8,0569+0,0219*x-0,0009*x^2,

где x- номер точки, а y- величина измеренной величины

Для второго массива функция зависимости:

y = 9,156-0,0674*x+0,0008*x^2,

где x- номер точки, а y- величина измеренной величины

Исходя из полученных значений проведем анализ результатов: определим правильно ли мы определили систематические составляющие погрешностей, критерием правильности построения является распределение остатков по нормальному закону.

Первоначально из имеющегося массива данных, получим новый, вычитая из реальных данных значения аппроксимирующих функций для каждой точки, получаем исправленные значения как показано на рисунке 5.

 

Рис. 5 Точечная диаграмма исправленных значений

 

Построим гистограмму распределения исправленных значений как показано на рисунке 6.

Рис. 6 Гистограмма распределения

Выдвигаем гипотезу о нормальности распределения и проверяем ее при помощи критерия Пирсона (Хи квадрат)

Критерий Пирсона χ2 вычисляется по формуле

 

,

 

где m — число сравниваемых частот.

fi и fi/ — эмпирическая и теоретическая частоты соответственно i-го интервала значений Х.

Далее рассчитывается число степеней свободы

 

k = m – p – 1,

 

где р — число параметров теоретического распределения (р = 2 для нормального и равновероятного распределения, р = 1 для эксцентриситета).

По величине k, используя таблицы можно определить Р(χ2). Если Р(χ2)≤0,05, то гипотеза о законе распределения отвергается.

Теоретические частоты вычисляются по формуле

 

                                               

       где z(t) = φ(t) – функция нормированного нормального распределения, берем из таблицы.

       где t рассчитывается по следующей формуле:

Рассчитанное значение Хи квадрат можно увидеть в таблице 1

Таблица 1

среднее

0,066703

теор. частота

практ. Частота

Отношение квадрата разности к теоретической частоте

СКО

0,091222

1,575578

2

0,114328847

 

 

5,63265

5

0,071058172

 

 

11,66044

13

0,153889168

 

 

16,55314

19

0,361692459

 

 

14,8586

12

0,549956898

 

 

8,763425

8

0,066505675

 

 

3,34332

5

0,820917133

 

 

 

Хи2=

2,138348351

 

Результат полученный, для 4-ех степеней свободы (K=m-p-1, m=7, p = 2) можно увидеть на рисунке7

 

Рис. 7 Результат расчета критерия Пирсона

 

Таким образом уровень доверительной вероятности равен 0,29, значит с вероятностью 71% можно утверждать, что данные распределены по нормальному закону.

Проверим нормальность распределения по критерию Колмогорова.

 

 

где Nх/, Nх — накопленные теоретические и эмпирические частоты (, fi — частота).

Для больших n,

Р(λ) = 1 – k(λ).

Функции k(λ) и Р(λ) табулированы. Если вероятность Р(λ) ≤ 0,05, то гипотеза отвергается.

 

среднее

0,066703

теор

Накопленные теоретические

практ

Накопленные эмпирические

Разница

СКО

0,091222

1,575578

1,575578019

2

2

0,424422

 

 

5,63265

7,208227843

5

7

-0,20823

 

 

11,66044

18,86866981

13

20

1,13133

 

 

16,55314

35,42180562

19

39

3,578194

 

 

14,8586

50,28040477

12

51

0,719595

 

 

8,763425

59,0438296

8

59

-0,04383

 

 

3,34332

62,38714959

5

64

1,61285

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

максимальное значение разницы =3.57

 

 

 

Получаем

Для данного значения в соответствии с табличными значениями определяем вероятность того, что выдвинутая гипотеза справедлива. Получаем Р(λ)=0,98, таким образом по критерию Колмогорова получаем, что с вероятностью 98%  исправленные значения- нормально распределенная физическая величина, что можно рассматривать как один из аргументов того, что систематические составляющие погрешности выделены верно.

 

Для предоставления результатов измерения в стандартизованном виде, необходимо определить среднее значение выборки, для наших результатов измерений среднее значение равно

Иср=8,024

Считаем, что систематическую составляющую погрешности измерения полностью исключили, среднее квадратическое отклонение исправленных значений, равно 0,09. Таким образом среднее квадратическое отклонение среднего арифметического будет равно

σ среднего арифметического= σ исправленных значений/641/2 =0,09/8=0,01125

Получаем для случая доверительной вероятности 99% имеем запись

(Иср±3* σ среднего арифметического), т.е.

(8,024±0,034) мм, P =0,99

 

Для случая доверительной вероятности P =0,95

(Иср±2* σ среднего арифметического), т.е.

(8,024±0,023) мм, P =0,95