Часть 3. Статистическая обработка результатов серий многократных измерений одной физической величины.
Дано: массив результатов измерений одной и той же физической величины(ФВ). Данные получены при многократных измерениях заданного параметра с применением одной методики выполнения измерения(МВИ).
Требуется: построить точечные диаграммы результатов измерений и выполнить статистическую обработку результатов измерений и отклонений результатов измерений от приписанной аппроксимации, включая проверку вида распределения по критериям согласия. По окончании стат.обработки– представить результаты измерений в форме, установленной нормативными документами.
Массив данных(данные читать по столбцам):
8,013 | 8,154 | 8,196 | 7,979 | 7,968 | 7,824 | 7,986 | 8,099 |
8,224 | 8,242 | 8,168 | 7,993 | 7,722 | 7,796 | 7,811 | 8,087 |
8,133 | 8,292 | 8,134 | 7,971 | 7,785 | 7,837 | 7,898 | 8,178 |
8,193 | 8,32 | 8,17 | 7,949 | 7,787 | 7,734 | 8,004 | 8,24 |
7,987 | 8,058 | 8,213 | 7,927 | 7,844 | 7,811 | 8,003 | 8,279 |
8,107 | 8,248 | 7,989 | 7,905 | 7,817 | 7,828 | 8,034 | 8,311 |
8,167 | 8,1 | 8,036 | 7,883 | 7,82 | 7,883 | 8,049 | 8,181 |
8,149 | 8,213 | 8,039 | 7,951 | 7,715 | 7,896 | 8,063 | 8,112 |
Проанализируем имеющийся массив данных, первоначальная точечная диаграмма которого представлена на рисунке 1
Рис.1 Точечная диаграмма
Как видно из точечной диаграммы, существует некоторая систематическая зависимость, попытаемся выделить ее применив статистический программный пакет.
Первоначально попробуем построить регрессионную модель параболы, как показано на рисунке 2.
Рис 2. Регрессионная модель второго порядка массива данных
Как видно из рисунка, за 95% границу выходит большое число значений, поэтому попробуем провести анализ при помощи другого инструмента, результаты применения которого представлены на рисунке 2.
Рис.2 Применение метода взвешенных квадратов
Как видно из рисунка, аппроксимация параболой не самый лучший выход из ситуации, а аппроксимация вторым методом не дает ни одной из общепринятых при анализе точечных диаграмм, поэтому разобъем массив данных на два подмассива
- до 20 точки включительно
- все остальные
Построим регрессии обоих подмассивов и проанализируем результаты.
Рис 3 Регрессия первого подмассива данных
Рис.4 Регрессия второго подмассива данных
Как видно из построенных графиков, существует два тренда, вид функции которых показан на рисунках:
Для 1-ого массива данных функция зависимости
y = 8,0569+0,0219*x-0,0009*x^2,
где x- номер точки, а y- величина измеренной величины
Для второго массива функция зависимости:
y = 9,156-0,0674*x+0,0008*x^2,
где x- номер точки, а y- величина измеренной величины
Исходя из полученных значений проведем анализ результатов: определим правильно ли мы определили систематические составляющие погрешностей, критерием правильности построения является распределение остатков по нормальному закону.
Первоначально из имеющегося массива данных, получим новый, вычитая из реальных данных значения аппроксимирующих функций для каждой точки, получаем исправленные значения как показано на рисунке 5.
Рис. 5 Точечная диаграмма исправленных значений
Построим гистограмму распределения исправленных значений как показано на рисунке 6.
Рис. 6 Гистограмма распределения
Выдвигаем гипотезу о нормальности распределения и проверяем ее при помощи критерия Пирсона (Хи квадрат)
Критерий Пирсона χ2 вычисляется по формуле
,
где m — число сравниваемых частот.
fi и fi/ — эмпирическая и теоретическая частоты соответственно i-го интервала значений Х.
Далее рассчитывается число степеней свободы
k = m – p – 1,
где р — число параметров теоретического распределения (р = 2 для нормального и равновероятного распределения, р = 1 для эксцентриситета).
По величине k, используя таблицы можно определить Р(χ2). Если Р(χ2)≤0,05, то гипотеза о законе распределения отвергается.
Теоретические частоты вычисляются по формуле
где z(t) = φ(t) – функция нормированного нормального распределения, берем из таблицы.
где t рассчитывается по следующей формуле:
Рассчитанное значение Хи квадрат можно увидеть в таблице 1
Таблица 1
среднее | 0,066703 | теор. частота | практ. Частота | Отношение квадрата разности к теоретической частоте |
СКО | 0,091222 | 1,575578 | 2 | 0,114328847 |
|
| 5,63265 | 5 | 0,071058172 |
|
| 11,66044 | 13 | 0,153889168 |
|
| 16,55314 | 19 | 0,361692459 |
|
| 14,8586 | 12 | 0,549956898 |
|
| 8,763425 | 8 | 0,066505675 |
|
| 3,34332 | 5 | 0,820917133 |
|
|
| Хи2= | 2,138348351 |
Результат полученный, для 4-ех степеней свободы (K=m-p-1, m=7, p = 2) можно увидеть на рисунке7
Рис. 7 Результат расчета критерия Пирсона
Таким образом уровень доверительной вероятности равен 0,29, значит с вероятностью 71% можно утверждать, что данные распределены по нормальному закону.
Проверим нормальность распределения по критерию Колмогорова.
где Nх/, Nх — накопленные теоретические и эмпирические частоты (, fi — частота).
Для больших n,
Р(λ) = 1 – k(λ).
Функции k(λ) и Р(λ) табулированы. Если вероятность Р(λ) ≤ 0,05, то гипотеза отвергается.
среднее | 0,066703 | теор | Накопленные теоретические | практ | Накопленные эмпирические | Разница |
СКО | 0,091222 | 1,575578 | 1,575578019 | 2 | 2 | 0,424422 |
|
| 5,63265 | 7,208227843 | 5 | 7 | -0,20823 |
|
| 11,66044 | 18,86866981 | 13 | 20 | 1,13133 |
|
| 16,55314 | 35,42180562 | 19 | 39 | 3,578194 |
|
| 14,8586 | 50,28040477 | 12 | 51 | 0,719595 |
|
| 8,763425 | 59,0438296 | 8 | 59 | -0,04383 |
|
| 3,34332 | 62,38714959 | 5 | 64 | 1,61285 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| максимальное значение разницы =3.57 |
|
|
Получаем
Для данного значения в соответствии с табличными значениями определяем вероятность того, что выдвинутая гипотеза справедлива. Получаем Р(λ)=0,98, таким образом по критерию Колмогорова получаем, что с вероятностью 98% исправленные значения- нормально распределенная физическая величина, что можно рассматривать как один из аргументов того, что систематические составляющие погрешности выделены верно.
Для предоставления результатов измерения в стандартизованном виде, необходимо определить среднее значение выборки, для наших результатов измерений среднее значение равно
Иср=8,024
Считаем, что систематическую составляющую погрешности измерения полностью исключили, среднее квадратическое отклонение исправленных значений, равно 0,09. Таким образом среднее квадратическое отклонение среднего арифметического будет равно
σ среднего арифметического= σ исправленных значений/641/2 =0,09/8=0,01125
Получаем для случая доверительной вероятности 99% имеем запись
(Иср±3* σ среднего арифметического), т.е.
(8,024±0,034) мм, P =0,99
Для случая доверительной вероятности P =0,95
(Иср±2* σ среднего арифметического), т.е.
(8,024±0,023) мм, P =0,95