|
Скачать 107.49 Kb.
|
Содержание
2. Материалы и методыРезультаты классификации наблюдений с помощью четырехслойного Показатели эффективности четырехслойного персептрона Список литературы |
СЕКЦИЯ 3 О.Ю. РЕБРОВА, О.А. ИШАНОВ ГУ НИИ неврологии РАМН, Москва [email protected] РАЗРАБОТКА И РЕАЛИЗАЦИЯ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧИ МЕДИЦИНСКОЙ ДИАГНОСТИКИ Аннотация Для разработки способа поддержки принятия решений при дифференциальной диагностике трех типов инсульта применены методы искусственных нейронных сетей пакета «Statistica» (StatSoft, Inc., США). Основными критериями оценки эффективности полученных алгоритмов служили диагностическая чувствительность и прогностическая ценность положительного результата, составившие 97 и 99 % соответственно. Данные результаты статистически значимо превосходят как существующий уровень врачебной диагностики, так и разработанные ранее математические алгоритмы. Сгенерирован код на языке C, реализовано web-приложение. Исследование эффективности диагностики продолжается. 1. Введение Инсульт является одной из центральных проблем клинической медицины, т.к. занимает третье место среди причин смертности от неинфекционной патологии. 80% перенесших инсульт лиц инвалидизированы [1]. В настоящее время выделяют три типа инсульта (ишемический, геморрагический, субарахноидальное кровоизлияние), причем тактика ведения больного в этих трех случаях должна быть различной. От правильности диагностики типа инсульта зависит эффективность лечебных мероприятий, а следовательно, и прогноз для каждого больного. На практике доля врачебных ошибок при определении типа инсульта составляет даже у опытных врачей 20-45 % [2, 3]. Интеллектуальная компьютерная система поддержки принятия решений в области неотложной ангионеврологии, ассистирующая неврологу или врачу общей практики, могла бы способствовать снижению доли врачебных ошибок. Разработанные ранее алгоритмы и системы дифференциальной диагностики двух типов инсульта [4-7] не были эффективными из-за низкой точности (в среднем 71 %) и ряда существенных ограничений. В связи с вышеизложенным мы поставили задачу разработки системы поддержки принятия врачебных решений при дифференциальной диагностике трех типов инсульта. Существуют два основных пути создания компьютерных интеллектуальных средств поддержки принятия решений: разработка математических алгоритмов с использованием методов data mining и создание систем представления знаний экспертов. К методам анализа данных, применимых к задачам диагностики (классификации), в настоящее время относят статистические и логико-статистические методы многофакторного моделирования (логистический регрессионный анализ, дискриминантный анализ, факторный анализ и др.) и кибернетические методы оптимизации (нейросетевые алгоритмы и др.). Однако, с нашей точки зрения и с точки зрения других авторов [8], продуктивными могут оказаться гибридные подходы к решению подобных задач, когда на разных этапах исследования применяются математические методы разных классов. Ранее мы решали нашу задачу с применением статистических методов (логистические регрессионные модели), также мы разработали экспертную систему на базе сетевой иерархической пороговой модели. Наши результаты были достаточно успешными (статистически значимо превышающими существующий уровень врачебной диагностики), однако не позволили достичь максимальных значений эффективности, в связи с чем мы перешли к разработке нейросетевого алгоритма классификации. ^ В исследование были включены 298 наблюдений больных с инсультом острого периода: 211 наблюдений ишемического инсульта (ИИ), 73 наблюдения геморрагического инсульта (ГИ), 14 наблюдений субарахноидального кровоизлияния (САК). В отношении преваленса типов инсульта выборка репрезентативна по отношению к популяции. Тип инсульта (заключительный диагноз) во всех случаях верифицирован результатами комплексного клинико-инструментально-лабораторного исследования, включая компьютерную томографию головы. Исходная выборка была разделена на обучающую (n = 268) и контрольную (n = 30) с использованием рандомизации с помощью генератора случайных чисел. Для тестирования алгоритмов была набрана дополнительная выборка из 25 случаев (16 случаев ИИ, 8 случаев ГИ, 1 случай САК). Признаковое пространство исходно включало 239 признаков, при этом 8 признаков были количественными, остальные – качественными порядковыми или бинарными. Качественные номинальные признаки были предварительно преобразованы в бинарные по правилу «1-из-N». Статистический анализ данных осуществлялся с использованием пакета «Statistica 5.5» (StatSoft, Inc., США). Для разработки алгоритмов дифференциальной диагностики применялись методы математического моделирования по технологии нейронных сетей пакетов «Statistica Neural Networks 4.0» и «Statistica 6.0» (StatSoft, Inc., США). Критериями оценки (показателями) эффективности разработанных диагностических алгоритмов в соответствии с концепцией доказательной медицины [9] служили значения операционных характеристик (диагностической чувствительности – ДЧ, диагностической специфичности – ДС), диагностической точности, прогностической ценности положительного (ПЦПР) и отрицательного (ПЦОР) результата, а также индекс согласия независимых диагностических заключений K (каппа). Для перечисленных показателей были получены точечные и интервальные оценки – средние значения и 95 % доверительные интервалы соответственно. 3. Результаты До построения математических алгоритмов диагностики типа инсульта необходимо было оценить эффективность диагностики типа инсульта по клинико-анамнестическим данным при существующей врачебной практике. С этой целью мы проводили сопоставление направительного (либо предварительного) и заключительного (сформулированного при выписке больного из стационара НИИ неврологии) диагнозов в отношении типа (характера) инсульта. Применялись два подхода. При первом мы производили расчеты только для тех случаев (n = 119), в которых тип инсульта был указан в предварительном (либо направительном) диагнозе. Средняя ДЧ при этом оказалась равной 86 % [79 %; 91 %], точность диагностики – 84 % [76 %; 90 %]. При втором подходе мы полагали, что в 155 случаях тип инсульта не был уточнен в направительном (либо предварительном) диагнозе вследствие неуверенности в нем врачей, и учитывали эти случаи при расчетах как случаи отказа от уточнения типа инсульта. Тогда средняя ДЧ врачебной диагностики оказалась равной 53 % [47 %; 59 %], точность диагностики – 36 % [31 %; 42 %]. Эти результаты мы в дальнейшем использовали для оценки качества разрабатываемых алгоритмов. Далее мы перешли собственно к построению нейросетевых алгоритмов. Предварительно необходимо было снизить размерность признакового пространства. Для этого мы использовали следующие подходы: 1) экспертную оценку информативности признаков; 2) статистический анализ данных – методы анализа таблиц сопряженности (Хи-квадрат, точный критерий Фишера) и сравнения групп (тест Манна-Уитни, непараметрический дисперсионный анализ по Краскел-Уоллису); 3) генетический алгоритм. Комбинируя результаты этих трех подходов, мы поэтапно отобрали 34 перспективных признака из 239 исходно имевшихся признаков. Для решения задачи классификации при поиске наилучшей архитектуры и параметров сети нами использовался имеющийся в пакете модуль Intelligent problem solver. Для обучения нейросети использовалась обучающая выборка, для контроля – контрольная, для тестирования – тестовая. Строились сети четырех архитектур (топологий): линейные нейросети, вероятностные нейросети, нейросети на основе радиальных базисных функций, многослойные (трех- и четырехслойные) персептроны. Наилучшая сеть имела архитектуру четырехслойного персептрона с двумя скрытыми слоями нейронов. В 1-м скрытом слое содержится 12 нейронов, во 2-м – 14. Из 34 признаков, отобранных генетическим алгоритмом, в наилучшую по эффективности нейросеть было включено 29 признаков. Все эти признаки качественные, причем 24 из них – бинарные. Выходной слой состоит из 3-х нейронов в соответствии с числом дифференцируемых состояний. Решение о принадлежности к тому или иному классу принимается по наиболее вероятному состоянию. В качестве основного результата рассматривались матрицы классификации. Результаты распознавания с помощью наилучшего четырехслойного персептрона представлены в табл. 1, а его операционные характеристики и прогностичность – в табл. 2. Средняя ДЧ составила на обучающей выборке 97 % [94 %; 98 %]. Средняя ПЦПР на обучающей выборке составила 99 % [97 %; 100 %]. Диагностическая точность алгоритма на обучающей выборке – 98 % [96 %; 99 %]. Индекс согласия заключений на обучающей выборке составил 0,949 [0,908; 0,989]. Мы также провели дополнительное тестирование разработанного алгоритма на 25 случаях (16 случаев ИИ, 8 случаев ГИ, 1 случай САК), которые не были включены ранее ни в обучающую, ни в контрольную выборки. Результаты тестирования оказались следующими: правильно отнесены к ИИ все 16 случаев ИИ, к ГИ – 6 из 8 случаев ГИ, 1 случай САК распознан правильно. Один случай ГИ неверно отнесен к ИИ, второй – к САК. Последняя ошибка может рассматриваться как относительно менее грубая, поскольку патофизиологический механизм был определен верно, и, следовательно, специфическое лечение не может принести вреда больному. Таким образом, точность диагностики составила 92 %, прогностическая ценность – 98 %, чувствительность – 92 %. Таблица 1 ^ персептрона (абсолютные частоты)
Таблица 2 ^
Далее мы поставили задачу разработки web-ориентированного приложения, реализующего работу разработанного нами нейросетевого алгоритма. С этой целью с помощью генератора кода пакета «Statistica 6.0» был получен код программы на языке С. Далее, используя технологию CGI (Common Gateway Interface), доступную на практически любом web-сервере, мы организовали работу нейросети на Интернет-сайте Научного центра по изучению инсульта Минздрава России (http://www.stroke-center.ru). Однако для работы CGI-скрипта на сервере хостинг-провайдера необходимо было предварительно переписать код с языка С на один из таких языков, как Perl, PHP или JavaScript. В целях обеспечения защиты алгоритма, а также в силу близости синтаксиса к языку С и наличия большой библиотеки модулей, нами был выбран язык Perl. На сайте пользователю предоставляется форма для выбора нужных значений признаков. Коды (значения) признаков, введенные пользователем, отправляются на сервер, где обрабатываются CGI-скриптом, а результаты обратно пересылаются пользователю. Все данные (введенные пользователем значения переменных, IP-адрес пользователя и пр.), а также результаты работы программы сохраняются в файле статистики и могут быть просмотрены либо с использованием web-интерфейса на странице статистики работы нейросети, либо сохранены в формате .xml на локальном диске для дальнейшей обработки в программе MS Excel и т.п. Для обработки введенных пользователем данных также можно использовать технологию Java-апплетов, однако нельзя гарантировать поддержку этой технологии пользовательским браузером. 4. Заключение В результате применения нейросетевого подхода был разработан алгоритм для дифференциальной диагностики трех типов инсульта, превосходящий по эффективности как рутинную врачебную диагностику, так и ранее разработанные с использованием других математических подходов алгоритмы. Web-реализация этого алгоритма может свободно использоваться врачами в качестве средства поддержки принятия решений. Исследование эффективности алгоритма продолжается. ^
УДК 004.032.26(06) Нейронные сети |