Повна версія

Головна arrow Інформатика arrow ІНТЕЛЕКТУАЛЬНІ СИСТЕМИ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

ЗАПИТАННЯ І ЗАВДАННЯ

  • 1. Уявіть, що у вас немає золотого стандарту. Яку метрику для оцінки якості кластеризації в такому випадку ви б придумали?
  • 2. Для схем розрахунку відстаней між кластерами з параграфа 6.2 придумайте найгірший випадок, в якому дана схема б погано спрацювала. Порівнюючи ці випадки між собою, подумайте, яку схему ви б вважали за краще.
  • 3. Алгоритм самоорганізується карти Кохонена дуже зручно використовувати для візуалізації складних даних, представляючи їх на двовимірної площині. Який геометричною фігурою на площині ви б представили кожен нейрон вихідного шару?
  • 4. Які не названі в параграфі 6.4 завдання можна було б вирішувати за допомогою FPM ?
  • 5. Яку трудомісткість має алгоритм Apriori ?

ПРАКТИКУМ

  • 1. Реалізуйте алгоритми кластеризації з параграфа 6.1 або 6.3 на будь-якому вибраному вами мовою програмування. Порівняйте їх з точки зору метрик кластеризації з параграфа 6.1.
  • 2. Завдання пошуку частотних шаблонів, наприклад в призначених для користувача логах, може бути корисна для пошуку шаблонів поведінки користувача. Придумайте алгоритм класифікації дивної поведінки (відмінного від стандартного) користувача. Як би ви побудували алгоритм кластеризації користувачів на групи з використанням частотних шаблонів?
  • 3. Крім завдання пошуку частотних шаблонів в представленому вигляді існує так званий пошук частотних послідовних шаблонів {Sequence Pattern Mining - SPM ), завданням якого є пошук шаблонів в даних, що мають певний порядок. Наприклад, купівельна корзина має такий порядок - один і той же людина може спочатку купити комп'ютер, потім додаткову техніку до нього, наприклад принтер і сканер, а потім буде купувати витратні матеріали для принтера і диски. Подумайте, як можна було б використовувати алгоритми SPM для кластеризації користувачів і яку корисну інформацію така кластеризація б несла?

РЕКОМЕНДОВАНА ЛІТЕРАТУРА

  • 1. Маннинг , К. Д. Введення в інформаційний пошук / К. Д. Маннинг, П. Рагхаван. - М .: Вільямс, 2014.
  • 2. Aggarwal, С. С. Frequent Pattern Mining / С. С. Aggarwal, J. Han. - NY: Springer, 2014.
  • 3. Ian, H. Data Mining. Practical Machine Learning Tools and Techniques / H. Ian, EF Witten. - Burlington: Elsevier, 2011 року.
  • 4 . Jiawei, H. Pattern Discovery in Data Mining / H. Jiawei // Coursera. - URL: https://ru.courscra.org/learn/data-patterns
  • 5. Jiawei, H. Cluster Analysis in Data Mining / H. Jiawei // Coursera. - URL: https: // ru.coursera.org/learn/cluster-analysis
 
<<   ЗМІСТ   >>