1
ОБЩИЕ СВЕДЕНИЯ
1.3.1.1.4.
Оценки
Параметры, характеризующие распределение
переменной X, обычно бывают неизвестны. Их ста-
раются оценить с помощью функций элементов х,
выборки.
Подобные оценки называются
статисти-
ками.
Так, математическое ожидание Е(Х) оценивает-
ся средним значением m
x
1.3.1.2.
Двумерная выборка
Чтобы
изучить связь между переменными X и Y,
рекомендуется изобразить на плоскости точки
(X/, yj).
Если
полученное таким образом облако то-
чек имеет удлиненную форму, следует вычислить
коэффициент линейной корреляции:
P(X,Y)
=
COV(X,
Y)
1.3.1.4.1.
Факторные методы
В этих методах
выявляются
соотношения близо-
сти
между индивидуумами, которые распределя-
ются по классам соседних элементов. Для описа-
ния числовых таблиц используется анализ
главных
компонент.
Анализ
соответствий позволяет описы-
вать
зависимость между двумя качественными
признаками.
1.3.1.4.2.
Классификационные методы
В этих методах используются различные алго-
ритмы построения классов или путем последова-
тельных
объединений (восходящие алгоритмы) или
путем разделений (нисходящие алгоритмы).
1.3.2.
Статистические
решения
где
COV(X,Y)
=
(у
г
т,)
- ковариация X и Y,
л^-
число точек с координатами (x
h
у,).
Если
связь между X и Y линейна, то
|р|
= 1. Вы-
численное значение р - это показатель тесноты
связи
между X и Y, но интерпретация этого значе-
ния часто
бывает
затруднена, поскольку указан-
ная связь возмущается связями между последова-
тельными значениями х, или значениями y
s
, когда
приходится иметь дело с временными рядами.
1.3.1.3.
Случай временных рядов
Так называются числовые последовательности
наблюдений х(Л, упорядоченные во времени, при
1-1,2 Т.
Временной ряд
обладает
памятью, которая
характеризуется последовательностью коэффи-
циентов автокорреляции порядка т = 1, 2,...
СОУ(х(0,л(г+т))
р(т)
=
График функции р(х) представляет собой
корре-
лограмму.
1.3.1.4.
Исследование числовых
таблиц:
многомерный
анализ
Таблица
из л строк и р столбцов объединяет зна-
чения р признаков, наблюденные на л индивидуу-
мах. Существуют два больших семейства методов
анализа этих таблиц.
1.3.2.1.
Случайная величина
Всякая мера величины, значения которой
зави-
сят от случая, есть
случайная
величина.
Случай-
ная величина называется дискретной, если она
имеет конечное или бесконечное, но счетное коли-
чество возможных значений.
Если
множество ее
возможных значений есть интервал, то говорят,
что
случайная
величина непрерывна.
Случайная
величина X определяется своей
функцией распределения F(x) = Р(Х й х) (вероят-
ность
того,
что X принимает значения, меньшие х).
Если
F(x) непрерывна и дифференцируема, плот-
ностью распределения вероятностей называют
производную
f(x) функции F(x).
1.3.2.1.1.
Примеры дискретных
случайных
величин
1.3.2.1.1.1.
Величина В, распределенная по бино-
миальному закону
Для индивидуума популяции имеются две воз-
можности
А и А, вероятности которых р и 1 - р по-
стоянны в серии из л независимых испытаний
(выбор с возвращением).
1.3.2.1.1.2. Величина Н, распределенная по
гипер-
геометрическому
закону
В популяции из N индивидуумов имеются две
возможности
А и А, вероятности которых меняют-
ся в зависимости от испытания в серии из п после-
довательных
испытаний (выбор с возвращением).
1.3.2.1.1.3. Величина Р, распределенная по закону
Пуассона
В данной популяции признак А появляется с ма-
лой вероятностью р. Реализуется большое число л
независимых испытаний, так что лр = т.
21