i
366
ГЛАВА 21
Доверительные пределы по обе стороны линии регрессии, обозначенные
на фиг. 21.6 через Y
0
, являются примером этих границ, и можно заметить,
что прогноз значительно не соответствует области средних значений YHX.
С другой стороны, может оказаться, что надо будет определить довери-
тельные пределы для новых значений Y
0
при избранных X
0
, для которых
дисперсия Ογ.χ отдельных наблюдений должна быть прибавлена к следую-
щему выражению:
Var (Y
0
) - σ
2
' η
(X
0
-X)
2
^
1
(X
i
-X)*
тогда доверительный интервал будет следующим:
1 . (X
0
-*)
2
Υΰ±ί
α
,η-·ίΟΥ·Χ
1
2 (X
1
-X)*
1/2
(21.27)
(21.28)
Доверительные интервалы, обозначенные как Y
0
, показаны на фиг. 21.6.
Единичные наблюдения не предсказываются с достаточной степенью точ-
ности; она достигается лишь в том случае, когда количество их становится
довольно большим. Кроме того, точность не соответствует данным средним Y
при X. Становится ясным, что использование
Gy.
χ в качестве оценки погреш-
ности может привести к существенным ошибкам, если интересующие нас
измерения отражают отдельные наблюдения Y
i
.
21.9. ОЦЕНКА ПОГРЕШНОСТИ ДЛЯ «ПРЕДСКАЗАННОГО^!»
Довольно часто исследователь с целью установить взаимоотношение
между некоторым свойством эталонного объекта и его поведением при экспе-
рименте использует набор стандартов, определенных с очень малой погреш-
ностью; например, интенсивность линии на спектральной пластинке для
оценки количества элемента в веществе, интенсивность пика на рентгено-
грамме для определения количества минерала в смеси или же весовое коли-
чество углекислого газа, выделившегося при нагреве карбонатсодержащего
образца для оценки количества карбоната. Целью здесь является установ-
ление стандартной кривой, и при этом должны быть выполнены требования
регрессионной модели. Однако вслед за этим у экспериментатора появляется
желание перенести процедуру такой оценки с измерения эталона на новый
материал; предсказать, пользуясь полученной эталонной кривой, содер-
жание некоторого элемента или минерала в образце — это пример обращен-
ной оценки, в которой по наблюдаемому значению Y должно быть пред-
сказано значение X. Естественно, что исследователь хочет установить дове-
рительные пределы для этого «предсказанного X». Так как X было выбрано
с самого начала, оно представляет собой случайную переменную в вероят-
ностном значении, и так как X не обладает распределением погрешности,
ее невозможно оценить непосредственно; существует множество альтерна-
тивных возможностей оценки; этот вопрос в статистической литературе
является дискуссионным [3, 44, 454]. Исследователь должен быть знаком
со всеми способами, ибо каждая модель приспособлена к определенной
ситуации [3]. В данном случае, следуя Вильямсу [454] и Браун ли [44], задачу
можно представить как
X
0
= X + -Iip^, (21.29)
где X
0
— предсказанное значение X, соответствующее новому набору Yj
(;'
=
= 1, . . ., п), дающему Υ'
0
, а уравнение линии регрессии, основанной на η
парах Yjj, есть X
j
— Υ
0
=α + βΧ
0
. При данных ожидаемых значениях