Повна версія

Головна arrow Природознавство arrow ІНТЕЛЕКТУАЛЬНІ СИСТЕМИ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

ПОНЯТТЯ ТЕСТУ

Тестовий підхід пов'язаний з поняття тесту, запропонованого

С.В.Яблонскім і І.А.Чегіс [62, 63].

Нехай є безліч об'єктів М = {xi, ..., х т }, і кожен з об'єктів описується в заданій системі ознак наборами значень цих ознак, або, іншими словами, задається вектором простору ознак. Тоді безліч М може бути описано матрицею

де через Xi (j) позначено значення j-ro ознаки об'єкта т », i = 1,2, ..., m, j = 1,2, ..., п. Нехай M розбите на два класи До і / Гг, а тим самим і матриця Т т> п складається з двох підматриць Тк х і Тк 2 - Класи і К 2 нам невідомі, але нам дана деяка навчальна вибірка. Нехай Ti і Т 2 - подматріци матриць Тк х і 7 / с 2 , відповідні елементам навчальної вибірки. Потрібно для будь-якого набору ознак, який є опис об'єкта з М визначити, до якого класу він належить.

Будемо вважати, що значення ознак 1,2, ..., п належать множині {0,1}, і ці ознаки обрані так, що в матриці Т Ш | П немає двох однакових рядків, що відповідають об'єктам з різних класів.

Якщо Т - деяка матриця, а т - деякий набір ознак (набір стовпців), то через Т (т) позначимо підматрицю матриці Т, отриману видаленням всіх стовпців крім стовпців з т.

Набір стовпців т назвемо тестом , якщо не існує рядки, що міститься в 7 (т) і ТГ (т) одночасно. Тим самим, тест - це безліч ознак, яке дозволяє відрізнити на навчальній вибірці класи До і Кь »

Будемо говорити, що т - тупиковий тест } якщо г - тест, а будь-який його поднабор не є тестом. Іншими словами, тупиковий тест - мінімальне по вкладенню безліч ознак, яке все ще може відрізняти класи До і ^ 2 на навчальній вибірці.

Ідея тестового підходу грунтується евристиці голосування тесту. Якщо дано об'єкт х, який треба розпізнати, і деякий тест т, то відкидаються всі ознаки, які не входять до тест. Якщо х на безлічі залишилися ознак більше схожий на елементи навчальної вибірки з першого класу, то кажуть, що тест т голосує за перший клас, інакше - за другий. Далі вибирається деякий опорна множина тестів, в якості якого можна взяти безліч всіх тестів, безліч тупикових тестів, або безліч тестів фіксованою довжини, і обчислюється, за що інтегрально голосує опорна множина.

Тим самим, оскільки не вистачає довжини навчальної множини, щоб говорити про статистично надійних результатах, то "статистика" набирається на безлічі ознак, пробігаючи по опорному безлічі тестів.

 
<<   ЗМІСТ   >>