5. Логлинейные модели многомерных таблиц сопряженности
5.1 Основные понятия логлинейного анализа
До сих пор мы рассматривали связи между двумя
категоризованными признаками. Естественно обобщить задачу на
случай числа признаков k > 2. Соответствующие таблицы называются
таблицами с несколькими входами, или многомерными таблицами
сопряженности.
С увеличением числа признаков, рассматриваемых одновременно,
число ячеек в таблице возрастает в геометрической прогрессии.
Визуальное исследование взаимосвязей основывается на рассмотрении
процентных соотношений по строкам, столбцам, "слоям" таблицы, и
изменения этих соотношений по градациям признаков. Однако, из-за
большого числа ячеек таблица становится труднообозримой, что
затрудняет изучение взаимосвязей показателей.
Рассмотрим многовходовую, таблицу сопряженности
N = {n
α
},
где n
α
– количество объектов (или частота), попавших в ячейку
α
= ( i
1
, i
2
,...,i
k
) таблицы.
Для любого подмножества признаков может быть составлена
частная (маргинальная) таблица сопряженности. В такой таблице каждое
число получается суммированием по всем клеткам исходной таблицы с
заданными значениями признаков, то есть число в ячейке
b=(i
1
, i
2
,...,i
k
)
маргинальной таблицы равно:
nn
bi
i
k
=
∑
1
,...,
i
.
Логлинейные модели легко обобщаются для случая нескольких
переменных. Они позволяют проверить гипотезу о наличии
взаимосвязей между признаками, и с помощью как можно меньшего
числа параметров позволяют представить в сжатом виде информацию,
содержащуюся в таблице и дать интерпретацию взаимодействий любого
порядка в одинаковых терминах.
Математическая задача многомерного логлинейного анализа
состоит в том, чтобы для сформулированной гипотезы о структуре
связей признаков, получить по выборочным частотам оценки
ожидаемых частот и, затем по степени соответствия выборочных и
модельных частот, проверить выдвинутую гипотезу.
Например, в случае проверки гипотезы о независимости всех
признаков ожидаемые частоты получаются на основе распределений
частот по градациям каждого из признаков. Если выдвинутая гипотеза
предполагает существование какой-то взаимосвязи, то при оценке
ожидаемых частот учитывается соответствующая маргинальная таблица.
44