47
4. Данные о выпадении дождя могут объединять наблюдения большого числа станций по
сбору данных внутри и вокруг определенной области. Таким образом, числа ,по этой
области могут быть взвешенными средними, полученными Из максимальных или средних
значений наблюдений, или это может быть простое среднее этих наблюдений. Таким
образом, «2 дюйма дождя в час» ничего не говорят о том, каким был дождь в течение
каждого часа, какова продолжительность непогоды пли равномерность дождя в данном
районе. Часовое выпадение дождя является существенно вероятностной оценкой, к
которой может быть применен статистический подход. В этом примере метеоролог
сообщением данных, которых он не понимает, вовлек себя и потребителя его данных в
плохо структуризованную проблему. Может случиться, что потребитель данных окажется
заключенным в проблеме, как в ловушке, из-за заблуждений автора при квалификации
данных. Типичной ловушкой является оставшееся скрытым предположение, лежащее в
основе решения.
Определенные проблемы могут возникнуть также из-за неправильного понимания
отношений данных. Могут получаться ошибки в масштабе из-за преувеличения влияния
качеств одного параметра на другой. Проблемы возникают также при отборе данных для
описания явления. Например, тяга авиационного двигателя может быть показана как
функция веса самолета. Из этой диаграммы специалист может заключить, что способ
описания энергии, необходимой для полета самолета, заключается в том, чтобы связать
тягу двигателя с весом самолета. Если специалист хотел описать предсказуемую
корреляцию веса и тяги, возможно лучше было бы выбрать не вес самолета, а вес
двигателя. Противоположной задачей могло стать понимание отношения тяги и скорости.
Для этой задачи, может быть, было бы более желательным показывать отношение тяги к
весу самолета для различных значений скорости в морских милях в час. Заметьте, что вес
самолета выражается в фунтах, тяга—в фунтах и что скорость может быть выражена в
фунтах в секунду, морских милях в час или милях в час. Использование «фунта» или
«скорости» должно быть полностью определено, в противном случае неосведомленный
читатель должен будет сделать предположение об единицах измерения величин.
Прежде всего специалист по анализу систем при анализе проблемы должен проверить
понятность данных и их отношений. Вторая проверка должна проводиться, когда
специалист использует данные для анализа проблемы. Третья проверка проводится тогда,
когда он выводит заключение из данных и их отношений. Четвертая проверка
выполняется, когда данные представлены формально как объяснение проблемы или как ее
решение. Конечная, пятая, проверка является проверкой последовательности и
убедительности объяснения. Она, в свою очередь, покоится на способности: 1)
демонстрировать исход последовательности событий, 2) предсказать исход, который
нельзя демонстрировать, но который фактически получается.
Другое возможное заблуждение при выборе и представлении данных связано со
структурой проблемы. Должно быть показано, каким образом используются данные при
решении проблемы: данные объясняют явление или, напротив, явление объясняет
данные? Точно так же: объясняют ли написанные слова отчета данные или же
относительно данных предполагается, что они объясняют слова? Обратимся снова к
эксперименту Кеплера. Его проблема состояла в том, чтобы найти такую форму орбиты
Марса, которая давала бы наилучшее объяснение данным, наблюдавшимся Браге.
Предположение, сделанное Кеплером, было основано на проверке точности данных Браге
и состояло в том, что данные правильно отражают реальное явление. Если бы Кеплер
догматически подошел к проблеме, он мог бы объяснить предполагаемую им орбиту через
данные. Вообще, сущность данных состоит в том, что они объясняют явление.
Упоминания о «сырых» данных обычно относятся к незарегистрированным наборам