Выше отмечалось, что уравнение линейной регрессии
позволяет прогнозировать одно свойство по другому, что имеет
значение, если прямое измерение характеристики прогнозируемого
свойства затруднено или связано
с дополнительными затратами.
Например, на одном из
полиметаллических
месторождений установлена
линейная зависимость
содержания кадмия от
содержания цинка в руде
(рис.3.7). Коэффициент
корреляции между
содержаниями 0,937, т.е. очень
высокий. Разброс точек на
рисунке обусловлен, во-первых,
колебаниями состава сфалерита,
во-вторых, значительной
случайной погрешностью определения содержания кадмия.
Погрешность уравнения регрессии составляет 0,0345%, что
ниже среднего содержания кадмия 0,0585%. Возможно, погрешность
уравнения завышена из-за неизбежной случайной погрешности
химического анализа (или опробования).
3.2.2. Выявление аномальных значений и
однородных совокупностей
При построении графиков регрессии отдельные точки
нередко далеко отходят от линии регрессии (рис.3.8). Без каких-либо
расчетов можно считать, что удаленная точка соответствует
аномальному значению. Если же точка аномального значения
находится вблизи линии регрессии, то необходим специальный
расчет. Вначале рассчитывается линия регрессии без
предполагаемого аномального значения, далее находят отклонения
точки от линии регрессии и с помощью различных критериев,
Рис.3.7. Зависимость содержания
кадмия от содержания цинка,
выраженная уравнением
Cd5=50,0043Zn5+50,0056
8
0,16
0,12
0,08
0,04
0,00
16 24 32
Zn
Cd