|
Скачать 16.61 Kb.
|
УДК 004.896(06) Интеллектуальные системы и технологии И.С. НАФТУЛИН, О.Ю. РЕБРОВА Научный центр неврологии РАМН, Москва ПРИМЕНЕНИЕ АЛГОРИТМОВ DATA MINING ДЛЯ РЕШЕНИЯ ЗАДАЧИ ДИАГНОСТИКИ ТИПА ИНСУЛЬТА В работе рассматриваются методы распознавания образов для решения дифференциально-диагностических задач. Для решения дифференциально-диагностических задач традиционно применяются методы распознавания образов. Нами также ранее использовались статистические и логико-статистические подходы к решению нашей задачи дифференциальной диагностики трех типов инсульта, а в последние годы мы применяли нейросетевые методы (наилучший результат - диагностическая точность 98% [1]). В настоящем сообщении приводятся результаты применения трех алгоритмов Data Mining. Интерактивная процедура классификации и регрессии ITrees C&RT, интерактивная процедура ITrees CHAID в режимах построения полного и усеченного дерева решений, обобщённые деревья классификации и регрессии General C&RT и обобщённые CHAID модели пакета STATISTICA 6.1 (StatSoft, Inc., США) не дали приемлемого по точности результатов. Алгоритм С4.5 (RuleQuest Research, Австралия), позволяющий получать как деревья решений, так и наборы логических правил типа IF-THEN, а также включающий процедуры, позволяющие снизить результирующую ошибку классификации (создание последовательности деревьев, использование нечётких порогов выбора ветвей) в режиме обучения для отдельных значений целевого параметра дал хорошие результаты классификации, однако тестовые проверки показали высокий уровень ошибок. Система WizWhy v. 4.06 (WizSoft Inc., США) имеет большой набор инструментов для построения и последующего анализа решающих правил, включая IF-THEN, IF-And-Only-IF и «Unexpected (неожиданные)» правила. Результаты расчётов оказались достаточно хорошими (точность - 93%), однако интерпретация более 2000 правил практически невозможна. Таким образом, примененные нами алгоритмы Data Mining не позволили решить нашу задачу с приемлемым качеством результатов. Отметим, что многие другие доступные нам алгоритмы этих классов не допускают обработку данных с пропусками, что резко снижает их применимость в медицинских задачах. Список литературы
ISBN 978-5-7262-0883-1. НАУЧНАЯ СЕССИЯ МИФИ-2008. Том 10 |