Порядок граф таблицы не имеет значения, но f
0
из табл. 15.1 и f
e
из табл. 15.3 в
каждой определенной строке должны относиться к одному и тому же случаю.
Причина того, что разность между f
0
и f
e
сначала возводится в квадрат и лишь
потом делится на f
e
, та же, что в случае колебаний вокруг среднего
геометрического при определении стандартного отклонения. Хи-квадрат
определяется путем сложения всех цифр в последней колонке. В нашем
примере он получает значение 56,07.
Прежде чем мы интерпретируем эту цифру, нам необходимо сделать еще одно
вычисление – подсчитать так называемые степени свободы (degrees of freedom
– df). Степени свободы в таблице – это количество ячеек таблицы, которые
могут быть заполнены цифрами, прежде чем содержание всех остальных ячеек
станет фиксированным и постоянным. Формула для определения степеней
свободы в любой определенной таблице такова:
df = (r – 1) (c – 1),
где r = количество категорий переменной в ряду;
с = количество категорий переменной в колонке.
Например, df = (3 – 1) (3 – 1) = 4.
Теперь мы готовы оценить статистическую значимость наших данных. Таблица
А.4 в приложении содержит [c.422] значимые величины χ
2
для различных
степеней свободы на уровнях 0,001; 0,01; 0,05. Если значение χ
2
, которое мы
подсчитали (56,07), превышает то, что указано в таблице на любом из этих
уровней для таблицы с определенными степенями свободы (4), то можно
сказать, что те взаимосвязи, которые мы наблюдали, на данном уровне
статистически значимы. В настоящем случае, например, для того чтобы связь
была значимой на уровне 0,001 (т.е. если мы допускаем, что наблюдаемая связь
отражает характеристики всей совокупности, то мы рискуем ошибиться один
раз из 1000), наблюдаемый χ
2
должен превышать 18,467. Если это так, то мы
можем быть абсолютно уверены в своих результатах. [c.423]
ИЗМЕРЕНИЕ СВЯЗИ И ЗНАЧИМОСТИ ДЛЯ ПОРЯДКОВЫХ
ПЕРЕМЕННЫХ
Для порядковых переменных чаще всего используется коэффициент связи G,
или гамма, работающий по тому же принципу ограничения ошибки, что и λ ,
но особо ценный тем, что он не просто определяет количество признаков в той
или иной категории, а ранжирует их, т.е. выясняет их относительную позицию.
Вопрос, решаемый с помощью G, состоит в том, какова степень, до которой
ранжирование случаев одной порядковой переменной может быть определено
при условии знания рангов случаев другой порядковой переменной.
Когда мы анализируем две подобные переменные, то возможны два случая
зависимости. Первый, при котором случаи ранжируются в одном и том же