против тех, кто этого не делает (но хочет получить работу или пойти в училище), и вторую
функцию для дискриминации между теми выпускниками, которые хотят получить работу
против тех, кто хочет пойти в училище. Коэффициенты b в этих дискриминирующих
функциях могут быть проинтерпретированы тем же способом, что и ранее.
Каноническая корреляция.
Канонический анализ предназначен для анализа зависимостей между списками
переменными. Если говорить точнее, он позволяет исследовать зависимость между двумя
множествами переменных. При вычислении канонических корней подсчитывают
собственные значения матрицы корреляций. Эти значения равны доле дисперсии,
объясняемой корреляцией между соответствующими каноническими переменными. При этом
полученная доля вычисляется относительно дисперсии канонических переменных, т.е.
взвешенных сумм по двум множествам переменных; таким образом, собственные значения
не показывают абсолютного значения, объясняемого в соответствующих канонических
переменных.
Если извлечь квадратный корень из полученных собственных значений, получим
набор чисел, который можно проинтерпретировать как коэффициенты корреляции.
Поскольку они относятся к каноническим переменным, их также называют каноническими
корреляциями. Как и собственные значения, корреляции между последовательно
выделяемыми на каждом шаге каноническими переменными, убывают. Однако другие
канонические переменные также могут быть значимо коррелированы, и эти корреляции часто
допускают достаточно осмысленную интерпретацию.
Критерий значимости канонических корреляций сравнительно несложен. Во-первых,
канонические корреляции оцениваются одна за другой в порядке убывания. Только те корни,
которые оказались статистически значимыми, оставляются для последующего анализа. Хотя
на самом деле вычисления происходят немного иначе. Программа сначала оценивает
значимость всего набора корней, затем значимость набора, остающегося после удаления
первого корня, второго корня, и т.д.
Исследования показали, что используемый критерий обнаруживает большие
канонические корреляции даже при небольшом размере выборки (например, n = 50). Слабые
канонические корреляции (например, R = .3) требуют больших размеров выборки (n > 200)
для обнаружения в 50% случаев. Отметим, что канонические корреляции небольшого
размера обычно не представляют практической ценности, поскольку им соответствует
небольшая реальная изменчивость исходных данных.
Канонические веса. После определения числа значимых канонических корней
возникает вопрос об интерпретации каждого (значимого) корня. Напомним, что каждый
корень в действительности представляет две взвешенные суммы, по одной на каждое
множество переменных. Одним из способов толкования "смысла" каждого канонического
корня является рассмотрение весов, сопоставленных каждому множеству переменных. Эти
веса также называются каноническими весами.
При анализе, обычно, пользуются тем, что чем больше приписанный вес (т.е.,
абсолютное значение веса), тем больше вклад соответствующей переменной в значение
канонической переменной.
Если вы знакомы с множественной регрессией, вы можете применить для
канонических весов интерпретацию, использованную для бета - весов в уравнении
множественной регрессии. Канонические веса, в некотором смысле, аналогичны частным
корреляциям переменных, соответствующих каноническому корню. Таким образом,
рассмотрение канонических весов позволяют понять "значение" каждого канонического
корня, т.е. увидеть, как конкретные переменные в каждом множестве влияют на взвешенную
сумму (т.е. каноническую переменную).