360
ГЛАВА 1 г
а значения другой определяются экспериментально. Так, скажем, петрограф
оценивает окатанность галек на пляже на расстоянии одной, двух и трех миль
от некоторого базиса. Результаты он вычерчивает в виде графика, затем
пытается усмотреть в этом графике отражение некоторой функциональной
зависимости. Однако в таких эмпирических определениях, несомненно,
содержится погрешность, с которой измеряется изучаемая величина. Ведь
разные гальки, которые измеряются на протяжении трех миль, не будут
характеризоваться одной и той же степенью окатанности. С другой стороны,
при функциональной зависимости имеется в виду, что обе переменные заме-
рены без погрешности. Но в экспериментальных примерах изменяемая
переменная рассматривается как измеряемая без погрешности; она назы-
вается независимой переменной Х\ другая же переменная является случай-
ной, она дает различные значения при одном и том же значении независимой
переменной и называется зависимой переменной Υ.
Получив на образцах серию замеров двух переменных, можно наносить
эти результаты на график и изучать возможность определения формы функ-
ции. В общем случае последняя может оказаться линейной или быть одной
из функций, описанных ранее, и в этом случае ее можно свести к линейной
форме, применив подходящее преобразование. После этого следует согла-
совать кривую с изменениями, представленными на графиках; используе-
мая для этого процедура известна под названием метода наименьших квад-
ратов (впервые этот метод описали Лежандр и Гаусс, см. в работе [452].)
21.5. ОПРЕДЕЛЕНИЕ ЛИНИИ «НАИЛУЧШЕГО ПРИБЛИЖЕНИЯ»
МЕТОДОМ НАИМЕНЬШИХ КВАДРАТОВ
Имея набор замеров двух характеристик, или свойств на η образцах,
одно из которых (X) измерено без погрешности и каждому значению которого
соответствует множество определений другого свойства (Yi), мы можем
рассматривать совокупность Y-ов по каждому значению X и оценивать их
соответственные средние значения μ^.χ. На фиг. 21.4 показана линейная зави-
симость между ожидаемыми значения-
ми Y, обозначенными μ
υ
.
χ
, и значе-
ниями X. Совокупности Y
i
распреде-
лены относительно соответствующих
значений μy. χ независимо и нормально
с общей дисперсией, равной о
2
, т. е.
Gy.χ= σ
2
; иначе говоря, совокупности
имеют постоянную условную диспер-
сию, следовательно,
μγ.χ = α + ρΧ. (21.4)
Положим, что данные образцы обла-
дают по крайней мере двумя незави-
симыми свойствами X и что величины Y
измерены в зависимости от каждого
значения Х\ тогда Y
i
может быть опре-
делено как
Γ,^ + βΧί + β,, (21.5)
Фиг. 21.4. Линейная связь в общем
виде.
Точки — точки наблюдений; крестики
—
μγ.
x'.fj
—отклонения наблюдаемых значе-
ний от средней линии. где ε
;
—«погрешность», или сумма, на
которую Y
i
отличается от μ,ν.χ для
всех значений Y
i
. Тогда процедуру наименьших квадратов можно пред-
ставить как способ определения «наилучшего приближения» прямой с наблю-
даемыми точками, что ведет к вычислению оценок α и β для α и β. Линия
«наилучшего приближения»— такая линия, которая минимизирует ε?, т. е.