Статья. // Computational Linguistics — 1999. — 25/4 — С. 527-571.
Интерактивный диалог, по замечанию авторов, «обеспечивает много
новых проблем для систем понимания спонтанной речи». Одной из самых
критических названа проблема сегментации дискурса и определения
намеченного говорящим высказывания. Последняя проблема осложнена
тем, что прекрасно распознавая отдельные слова, система не может
распознать возникновения самоисправлений, происходящих, когда
говорящий возвращается к началу забракованного фрагмента
высказывания и повторяет или изменяет его. В таких случаях,
забракованный участок дискурса больше не является частью
высказывания и не должен учитываться системой распознавания речи.
Сегментация дискурса и решение проблемы возникновения
самоисправлений тесно переплетены с задачей идентификации
дискурсивных маркеров, использующихся в речи для структурирования
высказывания, заострения внимания слушающего на некоторых его
частях или отсылки к тому, то было сказано ранее. Используется и
много других дискурсивных маркеров, исполняющих самые разные
функции и зачастую не несущих никакой информационной нагрузки. Так
как все три явления тесно переплетены друг с другом, П. Хееман и
Дж. Аллен представляют в своей статье статистическую языковую
модель, особенностью которой является распознавание речи с учетом
общих закономерностей, возникающих при использовании дискурсивных
маркеров, самоисправлений и фразовой интонации, отмечающей
сегментацию дискурса, а также с учетом контекста их употребления.
Одновременное решение этих проблем позволило создать систему
распознавания речи, показывающую лучшие результаты, чем системы,
обращающиеся к каждой из них отдельно.