11
R
i
≈ C* d* N.
Заметим, что
N1 = N2 = N, N3 << N.
Тогда время решения i-й задачи (i = 1, 2) при использовании объединенного файла увели-
чится в
R
i
/
T
i
≈
d
/
l
i
раз. Для нашего примера время решения задач в зависимости от выбран-
ной длины полей может изменяться в 2–3 раза. Таким образом, платой за исключение дубли-
рования информации является увеличение времени решаемых задач. Заметим, что такое уве-
личение, как правило, допустимо.
Время решения задачи 3 увеличится в
R3/T3
≈
d*N / l3 *N3 раз. Так как для данного при-
мера
N3
<< N, то R3
>> T3. Время решения задачи 3 может увеличиться на несколько поряд-
ков, что совершенно недопустимо.
Рассмотрим другой вариант построения единой информационной базы. Объединим запи-
си задач 1 и 2, запись задачи 3 оставим отдельно. Получим два типа записей:
FIO D O G K
o
S M
FIO O K
дв
SN
В этом случае дублирование остается (дублируются поля
FIO, O). Но так как N
3
<< N,
то общий объем дублирования незначителен. Время решения задачи 1 и 2 в этом случае не-
значительно возрастет по сравнению с вариантом отдельных файловых систем, время реше-
ния задачи 3 такое же, как и в начальном варианте отдельного файла. Такое объединение по-
зволяет значительно уменьшить влияние недостатков и в то же время существенно увеличи-
вает время решения всех задач. Все три задачи можно решать, используя общую информаци-
онную базу из двух типов записей. Отметим, что два приведенных типа записей связаны друг
с другом по полю
FIO (находятся в некотором отношении). Отметим, что приведенные вари-
анты интеграции не исчерпывают все возможные способы интеграции данных для приведен-
ных задач и к вопросу выбора наилучшего варианта вернемся в последующих лекциях.
Здесь очень важно, что в этом случае для решения вышеуказанных задач используется
некоторый новый вид данных, формируемый на основе
интеграции записей.
Для описания этого вида данных вводится новое понятие
«База данных» [1].
База данных – совокупность экземпляров различных типов записей и отношений
между записями и элементами.
Базу данных можно определить как совокупность взаимосвязанных хранящихся
вместе данных при наличии такой минимальной избыточности, которая допускает их
использование оптимальным образом для одного или нескольких приложений.
Таким образом, появление понятие «Базы даннах» обусловлено возникновением ново-
го класса невычислительных задач, при решении которых используются общие данные. В
качестве основного критерия оптимальности функционирования базы данных,как правило,
используются временные характеристики реализации запросов пользователей прикладными
программами.