Использование стандартных схем
классификации
Когда классификация данных преследует цель
выявления закономерности пространственного
распределения, используются стандартные схемы
разбивки данных на интервалы. Схемы группировок
данных в классы учитывают характер распределения
вашей выборки. Вам необходимо определить схему
классификации и количество классов, а верхний и
нижний предел для каждого класса вычисляет ГИС.
Приведем четыре наиболее известные стандартные
схемы: естественная разбивка, квантиль, равные
интервалы и стандартное отклонение.
Проанализировав характер распределение данных,
выберете лучшую схему создания разбивки класса,
затем определите число классов. Хорошим способом
оценки распределения данных является гистограмма.
В этом примере гистограммы и карты используют
одни и те же данные: средний доход на дом в
долларах США. Гистограмма на странице вкладки
показывает распределение значений данных для
области, показанной на карте. Средний доход
рассчитан вдоль горизонтальной оси, а число
кварталов для каждого значения - на вертикальной.
Высота стержня указывает на число кварталов с
одинаковым значением. Тоновые области (соответ-
ствуют оттенкам классов на карте) показывают
диапазон для каждой схемы разбивки; значения
интервалов класса обозначены на горизонтальной
оси. Ширина каждой области показывает, сколько
кварталов относится к каждому классу.
Естественная разбивка.
Классы основаны на естественной группировке
значений данных. На гистограмме, разбивка класса
сделана в соответствии с резкими скачками в значени-
ях, обозначенных большим разрывом между столбца-
ми, так что кварталы, имеющие близкие значения
размещаются в одном классе. Результирующая карта
подчеркивает разногласия между кварталами с самым
высоким доходом и более низким слева, а так же
высоким в центре.
Квантиль
Каждый класс содержит равное число объектов. На
гистограмме, заштрихованы площади, образующие
один класс, и указаны интервалы класса, где они
пересекают горизонтальную ось. На этой карте,
кварталы с подобными значениями помещены в
смежные классы, а кварталы с высокими значениями
(в пределах от $32,000 до $ 100,000) соединены в
один класс.
Равные интервалы
Разность между максимальными и минимальными
значениями - в этом случае одна и та же для каждого
класса - $ 20,000. На этой карте, почти все кварталы
содержатся в двух самых низких классах. Карта
подчеркивает место небольшого количества кварта-
лов с самым высоким средним доходом.
48' Руководство по ГИС анализу
Среднеквадратичное отклонение
Объекты разбиты на классы по величине отклонения
их значений от среднего. ГИС вычисляет среднее (в
этом случае, приблизительно $ 26,000) и стандартное
отклонение (приблизительно $ 12,900). Затем после-
довательно прибавляет среднеквадратичное отклоне-
ние к среднему или вычитает его от среднего, чтобы
определить интервалы класса. Карта показывает
насколько отличаются значения объектов от среднего.