Дж. С. Дэвис. Статистический анализ данных в геологии. Книга 2
ном масштабе, и не является случайной в другом. Поскольку обычно имеется намного больше пар
ближайших соседей, чем квадратов, этот анализ более чувствителен. Хорошее введение в методы
ближайшего соседа дают Джетис и Бутс [29]; Риплай [65], а также Клифф и Орд [15] приводят обзор
теории с применениями в разных областях.
Метод ближайшего соседа основан на сравнении наблюдаемого множества расстояний меж-
ду парами ближайших точек с характеристиками, которые ожидались бы в том случае, если бы точ-
ки были случайно распределены. Характеристики теоретической случайной схемы можно вычис-
лить из пуассоновского распределения. Если мы игнорируем эффект краев нашей карты, то ожидае-
мое расстояние между ближайшими соседями есть
nA /5,0
(5.24)
где А – площадь карты; n – число точек. Напомним, что – есть плотность точек
. Выборочная дис-
персия величины
задается по формуле
)4/()4(
2
2
nA
(5.25)
Проведя действия с константами, получим
2
2
/06831,0 nA
(5.26)
Стандартное отклонение среднего расстояния между ближайшими соседями есть квадратный ко-
рень из
2
:
2
//26136,0 nAs
e
(5.27)
Распределение
нормально при условии, что n больше 6, так что мы можем использовать
простой Z-критерий, приведенный в гл. 2, для проверки гипотезы о том, что наблюденное среднее
расстояние между ближайшими соседями
d
равно значению
для случайной схемы точек той же
плотности. Значение критерия есть
e
sdZ /)(
(5.28)
Это – общепринятый вид критерия ближайшего соседа, однако, к сожалению, он имеет значитель-
ный дефект в большинстве практических случаев. При построении ожидаемого значения
предпо-
лагается, что краевой эффект полностью отсутствует, а это означает, что наблюденные схемы точек
могут быть распространены неограниченно во всех направлениях, если
d
и
обоснованно сравни-
ваются. Так как карта не распространяется неограниченно, то ближайшие окрестности точек вблизи
краев должны лежать внутри поля карты и потому
d
смещено в направлении больших значений.
Имеется несколько поправок в решении этой задачи. Если данные за пределами исследуемой пло-
щади доступны, то карту можно окружить охранной областью. Тогда расстояния, вычисленные по
методу ближайшего соседа между точками внутри карты и точками в охранной области, можно
включить в вычисление
d
. Другой способ состоит в том, что мы можем считать нашу карту вычер-
ченной не на плоскости, а на торе. Это значит, что правый край карты считается склеенным с левым
краем, а нижний край – склеенным с верхним. Тогда ближайшая соседняя точка к точке, лежащей у
правого края, может быть расположена вблизи левого края (такое использование точек хорошо из-
вестно всякому, кто имел дело с построением изолиний плотностей по стереосетям). Еще один спо-
соб построения поправок состоит в построении повторений во всех направлениях, подобно мозаике.
Для любой точки, примыкающей к краю карты, имеется точка, которую можно с большим основа-
нием считать ближайшим соседом, чем ближайшую точку внутри заданной карты.
Третий способ построения поправок состоит в изменении
так, чтобы граничный эффект
был включен в ожидаемое значение. Используя численное моделирование, Доннелли [24] нашел эти
альтернативные выражения для теоретического значения средних расстояний по методу ближайше-
го соседа и его выборочного среднего:
n
p
n
n
A
412,0
514,0
2
1
(5.29)