мови. Вони широко використовуються у сучасних інформаційних технологіях
(сканування тексту, надиктовування текстів, керування персональним
комп’ютером з голосу).
Можна навести характерні риси сукупностей предметів або явищ, і ці
характерні риси дозволяють говорити про ці сукупності як про "зразки" та
зумовлюють доцільність постановки задачі розпізнавання зразків (в основному ці
риси описані згідно з [16]).
Предмети або явища, що належать одному класові, схожі між собою. Під
схожістю мається на увазі наявність певних ознак, на основі яких можна
відокремити об’єкти, що належать даному класу, від об’єктів, що йому не
належать. Часто міру схожості вдається виміряти кількісно.
Об’єкти, що належать одному класу, можуть дуже змінюватися, часто
досить-таки сильно. Часто встановити чіткі границі зразків неможливо. Якби наше
сприйняття представників одного й того самого класу були ідентичними,
розпізнавання стало б тривіальною задачею. Ця змінність може бути зумовлена
різними факторами: помилками при вимірюваннях; помилками, що вносяться
зовнішніми факторами (шуми при передачі по каналу зв’язку, затінення об’єкту та
ін.), власною змінюваністю об’єктів. Особливо гостро проблема змінюваності
стоїть у випадку плавного переходу одного класу в інший, класичним прикладом є
перетворення пуголовка на жабу;
Ознайомлення з деякою скінченою кількістю представників класу дає
змогу розпізнавати довільну кількість інших представників (можливо, з
певним рівнем достовірності) [16, Д.6]. Зразками можуть бути, наприклад, "ріка",
"море", "рідина". Таке ознайомлення можна охарактеризувати як навчання, а
множина представників класу, на основі яких формується правило розпізнавання,
називається навчальною вибіркою. Правило розпізнавання, або правило
вирішення - це алгоритм, який відносить деякий об’єкт до одного з класів.
Зрозуміло, що таке рішення може бути правильним або помилковим.
До навчальної вибірки часто включаються контрприклади, тобто типові
представники інших класів. Часто розглядається екзаменаційна вибірка, на
підставі розпізнавання елементів якої робиться висновок про якість навчання.
Таким чином, у задачі розпізнавання можна виділити три частини: навчання,
екзамен і власне розпізнавання.
У [Д.6] розглядається один з класичних підходів до навчання розпізнаванню
та формування понять на основі перебору можливих ознак та виділенні їх
інформативних комбінацій.
Окремо можна виділити задачу розпізнання без учителя, або кластерного
аналізу. Для цієї задачі характерним є те, що класи попередньо не задаються;
система повинна сама розділити відомі їй об’єкти на класи.
Зразок у розумінні "класу" визначається у [16] як деяка сукупність об’єктів,
що мають спільні властивості, або певні спільні ознаки. Там же наводиться
більш формалізоване визначення: об’єкти, для яких виконується відношення
еквівалентності, або у крайньому разі відношення толерантності, у своїй
сукупності складають образ.
88