действительности и отображение этой действительности на естественном языке. Индивидуальное
знание предметной области источником и потребителем информации складывается из
совокупности представлений и понятий [10].
Представления — это чувственно наглядные образы объектов реального мира. Источником
формирования представлений являются психологические процессы ощущения и восприятия, а
также информация, получаемая от других членов общества в процессе общения. В результате
создаются представления об объектах реального мира. Представления носят субъективный
характер, который определяется внутренним психологическим миром данного человека. Хотя у
разных людей создаются разные представления о реальном мире, в них присутствует элемент
общности, которой позволяет использовать представления в процессе общения.
Понятия образуются в результате логического осмысления представлений об объектах
реального мира и являются формой абстрактного мышления, отражающей и фиксирующей
существенные признаки данных объектов. Понятия более объективны и в большей степени
отражают коллективный опыт. Понятия и представления тесно связаны друг с другом и являются
формой отражения реальной действительности в мышлении.
Язык — это средство, с помощью которого люди передают друг другу информацию о
реальном мире. Словарные выражения являются материальной формой понятий и представлений.
Естественный язык сформировался в результате длительного развития общества. Поскольку для
различных слоев общества характерна разная степень общности представлений, возникла
многозначность слов естественного языка: одно и то же слово приобретало множество различных
значений, и для одного и того же слова использовалось несколько словесных выражений. Таким
образом, общими недостатками естественного языка с позиций оценки эффективности поиска
являются избыточность и недостаточность.
Избыточность проявляется в следующем:
1) активную роль в процессе передачи содержания текста играют только некоторые слова или
словосочетания, так называемые ключевые слова. Другие можно отбросить практически без ущерба
для понимания смысла;
2) в естественном языке используются синонимы, то есть слова, различающиеся по звучанию
и написанию, но тождественные или близкие по смыслу;
3) имеет место неоднозначность выражения, то есть возможность выразить одну и ту же
мысль словами, не являющимися синонимами (например, «уменьшение сопротивления» —
«увеличение проводимости»).
Недостаточность выражения на естественном языке проявляется в следующем:
1) многозначность отдельных слов — омонимия (совпадение по звучанию и написанию
разных по значению слов). Например, «ключ» (для двери), «ключ» (источник);
2) эллипсность естественного языка. Под эллипсностью понимается пропуск в тексте
подразумеваемых слов.
Если рассматривать процесс отражения объектов реального мира текстом на естественном
языке, то в нем можно выделить план содержания — смысл сообщения, то есть результат процесса
мышления, и план выражения — произвольный текст на естественном языке. Таким образом,
тексты на естественном языке, хранящиеся в информационных системах, находятся на уровне плана
выражения и характеризуются всеми недостатками естественного языка, которые были отмечены
выше. Следует иметь в виду, что выявленные недостатки следует рассматривать лишь с позиций
эффективного поиска сообщений в информационных системах. Причина неоднозначности
выражений, например эллипсность, при рассмотрении под другим углом будет отнесена к
достоинствам естественного языка.
Отметим, что потребитель информации, пользователь нуждается в получении информации о
предметной области в соответствии со своими представлениями об объектах, свойствах и
отношениях в этой области. Свой запрос он также формулирует на уровне плана выражения.
Таким образом, в самой информационной системе, содержащей тексты на естественном языке,
мы имеем массив планов выражения источников на естественном языке, а на входе
информационной системы мы имеем множество запросов в виде планов выражения,
сформулированных потребителями информации.