Аномальные значения
В процессе визуализации данных вы можете обнару-
жить, что имеете несколько очень высоких или очень
низких значений. Эти аномальные значения могут
исказить диапазоны ваших классов, а следовательно,
н те закономерности, которые вы выявили. Это
особенно заметно при использовании схемы разбивки
на равные интервалы или по среднеквадратичному
отклонению, когда все значения, за исключением
аномального, могут попасть в один класс. Использо-
вание естественной разбивки может изолировать
аномальные значения в самом высоком или самом
низком классе, но это все равно отразится на остаю-
щихся классах.
0-18 97
:;-
л
- 18 98 - 37 94
ШВ 37 95 - 56 91
■■ 56 9? - 75 63
■■ 75 89 94 86
Стоимость земли за квадратный фут в долларах
США. В этом примере ошибка в базе данных привела к
появлению чрезвычайно высокого значения $ 94.86 за
квадратный фут (левая диаграмма и карта).
Классификация с равными интервалами поместила
все объекты в самом низком классе, а единственное
аномальное значение - в самом высоком. Оставшиеся
классы не имеют никаких объектов. Когда ошибка
была исправлена, гистограмма и карта показали
более ровное распределение значений.
Нужно рассмотреть аномальные значения вниматель-
нее. Они могут оказаться результатом ошибки в базе
данных или случайной для данной выборки величи-
ной, полученной из непредставительного образца, но
могут быть и вполне представительной информацией.
Если это не ошибки в базе данных, которые можно
исправить, вы можете выбрать один из вариантов
обращения с аномальными значениями а зависимости
от того, как они влияют на остальные данные и на
закономерности пространственных распределений на
карте:
• Можно разместить каждое аномальное значение в
собственном классе. Это возможно, если аномаль
ные значения существенно разбросаны.
• Сгруппировать их вместе в один класс. Такой
вариант возможен, если группа аномальных
значений локализована в одном месте.
• Сгруппирвать их со следующим самым близким
верхним или нижним классом, если они располо
жены также недалеко от других значений в этом
классе.
" Если вы уверены, что ваши аномальные значения
непредставительны, их можно отображать,
используя специальный символ. Например, их
можно залить серым цветом и маркировать
ссылкой "Недостаточно данных" в легенде.
Аномальные значения могут встречаться и как
результат вычисления отношений. В то время как
каждое из исходных значений было представительно,
результат деления может вводить в заблуждение. Это
может быть также вызвано способом хранения
объектов в базе данных или организацией взаимосвя-
зей между значениями на карте. Предположим, вы
наносите на карту количество бакалейных лавок в
каждом районе на 1,000 человек. Если эти торговые
точки расположены в районе, где живет немного
людей (возможно это участок, в котором большое
количество производственных зданий и мало жилых
домов), расчет лавок на 1,000 человек в этом случае
приведет к сильно завышенному значению, искажая
классы и затеняя закономерности в распределении
данных.
Анализ распределения числовых показателей - 5 3
Количество бакалей-
ных лавок на 1,000
человек по районом.
Маленькое население в
районе - 44.00
создает аномальное
значение при расчете.
0.12 -
1.61
1.61 -3.10
3 10-4.59
4.59 - 6.О8