Статья. Опубликована в "Proceedings of the Human Language
Technology Workshop"- 1994 - 187-192.
В статье «Tagging Speech Repairs» отмечая проблему распознавания самоисправлений в речи, П. Хееман и Дж. Аллен предлагают статистический метод обнаружения, использующий разметчик текста по частям речи (part-of-speech tagger). В основе исследования лежит гипотеза о том, что самоисправления могут быть обнаружены благодаря возникновению синтаксических аномалий в построении высказывания. Синтаксическими аномалиями могут быть использование подряд нескольких предлогов (Поезд едет к… из Эльмиры до места назначения) повторение слова, переход его в другую часть речи, что проясняется контекстом (последний показатель характерен для английского языка, однако возникновение прочих синтаксических аномалий может быть маркером самоисправления и для русского дискурса). Таким образом, производится поиск синтаксических аномалий, сигнализирующих о появлении самоисправления, принадлежащего к одной из трех выделяемых на основании структуры групп.
В статье «Tagging Speech Repairs» отмечая проблему распознавания самоисправлений в речи, П. Хееман и Дж. Аллен предлагают статистический метод обнаружения, использующий разметчик текста по частям речи (part-of-speech tagger). В основе исследования лежит гипотеза о том, что самоисправления могут быть обнаружены благодаря возникновению синтаксических аномалий в построении высказывания. Синтаксическими аномалиями могут быть использование подряд нескольких предлогов (Поезд едет к… из Эльмиры до места назначения) повторение слова, переход его в другую часть речи, что проясняется контекстом (последний показатель характерен для английского языка, однако возникновение прочих синтаксических аномалий может быть маркером самоисправления и для русского дискурса). Таким образом, производится поиск синтаксических аномалий, сигнализирующих о появлении самоисправления, принадлежащего к одной из трех выделяемых на основании структуры групп.