Автореферат и диссертация по медицине (14.02.04) на тему:Применение искусственных нейронных сетей в оценке риска развития клинических проявлений атеросклероза у работников, занятых во вредных условиях труда
Автореферат диссертации по медицине на тему Применение искусственных нейронных сетей в оценке риска развития клинических проявлений атеросклероза у работников, занятых во вредных условиях труда
На правах рукописи
005012252
ЮСУПОВ Андрей Николаевич
ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В ОЦЕНКЕ РИСКА РАЗВИТИЯ КЛИНИЧЕСКИХ ПРОЯВЛЕНИЙ АТЕРОСКЛЕРОЗА У РАБОТНИКОВ, ЗАНЯТЫХ ВО ВРЕДНЫХ УСЛОВИЯХ ТРУДА (НА ПРИМЕРЕ НЕФТЕПЕРЕРАБАТЫВАЮЩИХ ПРОИЗВОДСТВ)
14.02.04 - медицина труда
Автореферат диссертации на соискание ученой степени кандидата биологических наук
1 2 [.]Д? Ш1
Москва -2012
005012252
Работа выполнена в Федеральном государственном бюджетном военном образовательном учреждении высшего профессионального образования «Военно-медицинская Академии имени С.М. Кирова» Министерства обороны Российской Федерации
Научный руководитель
Научный консультант
Официальные оппоненты:
Ведущая организация
доктор медицинских наук, профессор Бовтюшко Василий Григорьевич
доктор медицинских наук, профессор, академик РАМН
Софроиов Генрих Александрович
доктор биологических наук, профессор Рыжов Анатолий Яковлевич, Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Тверской государственный университет», заведующий кафедрой биомедицины
доктор биологических наук, профессор Бобров Александр Федорович, Федеральный медицинский биофизический центр им. А.И. Бурназяна Федерального медико-биологического агентства России, главный научный сотрудник
Федеральное государственное унитарное предприятие Всероссийский научно-исследовательский институт железнодорожной гигиены Роспотреб-надзора
Защита диссертации состоится
//ч
2012 г. в ( у часов на заседании диссертационного совета Д.001.012.01 при Федеральном государственном бюджетном учреждении «Научно-исследовательский институт медицины труда» Российской академии медицинских наук (ФГБУ «НИИ МТ РАМН») по адресу: 105275, г. Москва, проспект Буденного, д. 31.
С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного учреждения «Научно-исследовательский институт медицины труда» Российской академии медицинских наук (ФГБУ «НИИ МТ РАМН») по адресу: 105275, г. Москва, проспект Буденного, д. 31.
Автореферат разослан <«
2012 г.
Ученый секретарь диссертационного совета, доктор биологических наук
Нина Борисовна Рубцова
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Атеросклеротически обусловленная кардио-васкулярная патология является основной причиной смертности населения в мире. Так, в США на ее долю приходится более 30% от всех причин смерти, в Европе - свыше 50%. В России ежегодно от сердечнососудистых заболеваний умирает более 700 человек на каждые 100 тысяч населения (Константинов В.О., 2006; Информационный бюллетень ВОЗ, 2007; Christopher Р., 2002; Conroy R.M et al., 2003; Lloyd-Jones D.M. et al., 2004; Fourth J.T. 2007). Факторы риска развития атеросклероза весьма многообразны и большинство из них достаточно хорошо изучено. Они включают нарушение липидного обмена, артериальную гипертензию, сахарный диабет II типа, хроническую почечную недостаточность, гипотиреоз, неблагоприятную наследственность, метаболический синдром, курение и некоторые другие. Вместе с тем, в отечественной научной литературе имеются данные о более высокой вероятности развития атеросклероза при воздействии тех или иных факторов труда и трудового процесса, что в ряде случаев позволяет рассматривать эту группу заболеваний в качестве профессионально обусловленных. В частности, в процессе многолетних исследований, выполненных под руководством профессора Бовтюшко В.Г., установлены факты более раннего развития сердечнососудистой патологии атерогенной природы у работников нефтеперерабатывающего производства. Авторы связывают это с воздействием на работников сложного комплекса вредных факторов рабочей среды и трудового процесса, включающего интенсивный производственный шум, повышенную напряженность труда вследствие взрывоопасности производства и высокой личной ответственности, а также широкий спектр вредных химических веществ, представленный, в основном углеводородами различных классов (Бовтюшко В.Г., 1996, Иванов A.A., 2007, Иванов A.A. и др., 2008).
Исследованиям, связанным с изучением закономерностей формирования болезней системы кровообращения как профессионально обусловленных заболеваний уделяется на современном этапе развития медицины труда особое внимание, поскольку, являясь «болезнями цивилизации», именно они определяют уровень заболеваемости, трудопотерь по болезни и смертности работаю-
3
щего населения в большинстве развитых и многих развивающихся странах (Измеров Н.Ф., 2005; Шаяхметов С.Ф., Дьякович М.П., 2007; Денисов Э.И., Че-салин П.В., 2007).
В условиях анализа и мониторинга здоровья в крупных трудовых коллективах одной из важнейших проблем становится оценка и прогноз индивидуального риска клинических проявлений атеросклероза, особенно таких серьезных как инфаркт миокарда и мозговой инсульт. Наиболее широко с этой целью в настоящее время используется таблица SCORE (Systemic Coronary Risk Evaluation), с помощью которой прогнозируется индивидуальный фатальный риск атеросклеротической патологии на ближайшие 10 лет (Christopher Р., 2002 Thompson G. Et al., 2006). Величина индивидуального риска в диапазоне от 1% до 15% определяется с учетом пола, возраста, статуса курения, уровня систолического артериального давления и общего холестерина в плазме крови. Значения параметров рисков по шкале SCORE основаны на результатах 12 эпидемиологических исследований с участием более 205 тысяч человек. В настоящее время разработана аналогичная таблица для Российской Федерации с учетом данных национальной статистики и особенностей распространения факторов риска сердечнососудистой патологии в России. Тем не менее, установлено, что он может быть выше, чем рассчитанный с помощью SCORE, поскольку в ней не учитываются данные инструментальных и лабораторных исследований, объективно характеризующие состояние сердечнососудистой системы, липидного обмена, гематологические и биохимические показатели.
Существует еще несколько методик оценки риска развития атеросклероза, в частности FHS (Framingham heart study) и PROCAM, также основанных на статистическом прогнозировании, которые уделяют чрезмерную роль календарному возрасту. По этой причине, подавляющее большинство лиц в возрасте 25 - 50 лет попадает в категорию низкого, реже, умеренного риска. Из этого следует, что работники молодого и среднего возраста традиционно исключаются из сферы действия известных методов стратификации риска. В то же время, по данным Росстата, за период с 1990 по 2005 год смертность среди лиц в воз-
расте от 25 до 35 лет от сердечнососудистых заболеваний выросла более чем в три раза.
В 1996 году В.Г. Бовтюшко в своей докторской диссертации продемонстрировал эффективность практического применения медицинской статусметрии (Разоренов Г.И., Поддубский ГЛ., 1985) при решении задачи диагностики доклинических стадий заболеваний сердечнососудистой системы атерогенной природы у работников нефтеперерабатывающих производств. Установленные в последующем зависимости взаимосвязей биохимических и гемодинамических показателей при развитии атеросклероза позволили расширить состав диагностических показателей, традиционно используемых при оценке риска развития атеросклероза, что повысило информативность и устойчивость полученных результатов, по сравнению с наиболее распространенными экспертными методами. Опыт использования системы диагностики доклинического атеросклероза подтвердил эффективность применения медицинской статусметрии в целях своевременной профилактики сердечнососудистых заболеваний атерогенной природы. Однако одновременно был выявлен и ряд серьезных недостатков используемой системы, проявляющихся в значимом искажении оценки риска для лиц, показатели которых имели значения, далеко отстоящие от основной массы наблюдений.
Повысить эффективность практического применения метода индивидуальной оценки риска может позволить математический аппарат искусственных нейронных сетей (ИНС), которые способны обобщать эмпирические данные, выявлять и воспроизводить скрытые в этих данных закономерности, что дает возможность рассматривать нейросетевой подход как наиболее приемлемую альтернативу применяемым ранее классическим статистическим методам.
Таким образом, актуальность настоящего исследования определяется высокой распространенностью среди работающего населения атерогенных поражений системы кровообращения, являющихся одной из основных причин ранней утраты трудоспособности и смертности в трудоспособном возрасте, необходимостью оценки индивидуального риска развития атеросклероза в условиях мониторинга здоровья трудовых коллективов и потребностью повышения эф-
5
фекгивности методов оценки риска за счет использования математического аппарата ИНС.
Целью настоящей работы является совершенствование системы оценки индивидуального риска развития клинических проявлений атеросклероза, у работников занятых во вредных условиях труда, путем использования математического аппарата искусственных нейронных сетей.
Для достижения поставленной цели необходимо было решить следующие основные задачи:
1. Исследовать современные подходы к анализу данных медицинских обследований и выявить основные причины недостаточной информативности и устойчивости оценки риска развития клинических проявлений атеросклероза при применении линейного дискриминантного анализа по данным отечественной и зарубежной литературы.
2. Теоретически обосновать возможность применения и разработать математический аппарат нейросетевой оценки риска развития клинических проявлений атеросклероза.
3. Разработать алгоритм автоматизированного синтеза нейросетевой системы оценки риска.
4. Оценить эффективность нейросетевого метода оценки риска развития клинических проявлений атеросклероза на основе сравнительного анализа результатов многолетнего мониторинга состояния здоровья работников нефтеперерабатывающих производств.
5. Оценить распространенность заболеваний системы кровообращения в современных производствах нефтепереработки с учетом характера и условий труда работников.
Научная новизна исследования состоит в том, что представленный в работе подход к оценке риска развития клинических проявлений атеросклероза у работников нефтехимических производств не имеет опубликованных аналогов. Впервые ИНС рассматривается в качестве математического аппарата, воспроизводящего условную функцию частоты на основании альтернативных обучающих выборок. Установлено, что высокая чувствительность нейросетевого
6
метода к изменению взаимосвязей показателей функциональных систем организма позволяет отследить систематический рост величины риска, спрогнозировать развитие патологии, принять своевременные профилактические и лечебные мероприятия; последующий анализ динамики риска позволяет также оценить эффективность принятых мер, и, при необходимости, скорректировать профилактику и лечение доклинического атеросклероза.
Теоретическая значимость исследования состоит в аналитическом обосновании алгоритма самоорганизации ИНС, обеспечивающего нейросетевую реализацию условной функции частоты заболеваемости на множестве значений показателей, которые могут иметь произвольную природу.
В работе показана универсальность предлагаемого подхода к обработке многомерных статистических данных. Эти свойства разработанного алгоритма позволяют использовать его для решения широкого круга медицинских и биологических задач, в том числе для выявления производственных факторов, вызывающих раннее развитие атеросклероза, до начала фактического роста производственно-обусловленной сердечнососудистой заболеваемости.
Практическая значимость исследования заключается в разработке унифицированного комплекса программных и вычислительных средств, реализующих нейросетевой алгоритм оценки риска развития клинических проявлений атеросклероза, и внедрении нейросетевой оценки риска в систему мониторинга здоровья персонала нефтеперерабатывающего производства «Кириши-нефтеоргсинтез». Благодаря высокой информативной емкости искусственной нейронной сети и ее обобщающим способностям, разработанный метод оценки риска развития атеросклероза в значительной степени повышает эффективность мониторинга состояния здоровья работников нефтеперерабатывающих предприятий и позволяет решить главную задачу профилактики атеросклероза, а, именно, не «пропустить» лиц молодого возраста с высокой активностью атеро-склеротических процессов.
Положения, выносимые на защиту.
1. Использовавшийся ранее в расчете риска линейный дискриминантный анализ Фишера дает недостаточно информативные и недостаточно устойчивые
7
результаты, что происходит вследствие неполного соответствия данных лабораторных и врачебных исследований его требованиям.
2. Математический аппарат искусственных нейронных сетей - наиболее приемлемая альтернатива модели Фишера для оценки риска развития атеросклероза по данным врачебных, инструментальных и лабораторных исследований.
3. Предложенный метод обучения искусственных нейронных сетей повышает эффективность мониторинга состояния здоровья работников, занятых во вредных условиях труда, и позволяет решить главную задачу профилактики атеросклероза, а, именно, не «пропустить» лиц молодого возраста с высокой активностью атеросклеротических процессов.
Апробация и внедрение результатов исследования. Цели и материалы исследования докладывались на ежегодной Школе кардиологов Ленинградской области, г. Кириши, 26-27 октября 2006 г.; на второй Всероссийской научно-практической конференции «Терапевтические проблемы пожилого человека» (к 50-летию возрождения Российского научного медицинского общества терапевтов), Санкт-Петербург, 23-25 октября 2008 г.; на научно-практической конференции «Современные подходы к диагностике сердечнососудистых заболеваний» (к 70-летию кафедры ВМГТ ВМедА), Санкт-Петербург, 29-30 апреля 2010 г.; а также на совещаниях научно-исследовательской лаборатории лекарственной и экологической токсикологии НИЦ ВМедА.
Полученные научные данные используются при организации медицинского обеспечения работников предприятия «Киришинефтеоргсинтез», а также в учебном процессе Балтийского государственного технического университета «ВОЕНМЕХ» имени им. Д.Ф. Устинова.
Публикации. По теме диссертации опубликовано 8 работ, в том числе 2 - в журналах, рекомендуемых ВАК; получен 1 патент на изобретение.
Объем и структура диссертации. Диссертация изложена на 150 страницах машинописного текста. Она содержит: введение; обзор литературы; описание материалов и методов исследования; главы, описывающие собственные результаты исследований; обсуждение полученных результатов; заключительные раз-
8
делы, содержащие выводы, и список использованной литературы, включающий 123 источника, в том числе 76 отечественных и 47 иностранных авторов. Работа содержит 40 рисунков и 16 таблиц.
Личный вклад автора. Автором осуществлено планирование, организация и проведение статистических исследований, сформулированы цель и задачи, определены объем и методы исследований, проведены теоретическое обоснование и разработка алгоритма нейросетевой оценки риска. В составе авторского коллектива диссертант принимал участие в подготовке публикаций.
СОДЕРЖАНИЕ РАБОТЫ
В первом главе «Современные подходы к анализу данных медицинских обследований. Аналитический обзор литературы» показано, что преимущественная роль атеросклероза в структуре смертности от болезней системы кровообращения подтверждается практически во всех исследованиях по данной проблеме, в связи с чем главным стратегическим средством в замедлении и снижении показателей смертности является профилактика и превентивное лечение этой патологии (Климов А.Н., Липовецкий Б.М., 1987; Липовецкий, Б.М., 2001; Измеров Н.Ф., Сквирская Г.П., 2005; Иванов A.A., 2008; Conroy R.M. et al., 2003; Lloyd-Jones D.M. et al., 2004). Так, в результате исследований Государственного научно-исследовательского центра профилактической медицины, на фоне проведения профилактики (первые 5 лет наблюдений) отмечено достоверное снижение смертности от ССЗ практически в полтора раза по сравнению с показателями при общепринятом лечении (Калинина A.M., Чазова Л.В., 1998). Очевидно, что реализация этих мер невозможна без своевременной диагностики патологии атерогенной природы на ранней стадии ее развития (Эдвин Л., 1993, Богомолов, Л.А. и др., 2003). Существует множество публикаций, свидетельствующих об успешном применении ИНС в медицине и подтверждающих необходимость и целесообразность перехода от линейного дискриминантного анализа (ЛДА) к ИНС. Однако все рекомендации, приведенные в литературе, носят общий характер и недостаточно освещают ряд важных вопросов применения ИНС в оценке риска. Во-первых, в публикациях отсутствуют сведения о
критерии обучения ИНС, гарантирующего равномерную сходимость реакции
9
ИНС к искомой условной функции частоты. Во-вторых, на усмотрение разработчика остаются выбор структуры ИНС и метода ее обучения из множества вариантов, при отсутствии формальных критериев этого выбора (Оссовский С., 2002; Терехов С.А., 2002; Люгер Д.Ф., 2003; Крислов В.А., 2004; Леонов В.П., 2005; Рутковская Д. и др., 2006; Whitley D. et al., 1990; Lindahl D., 2000 и др.)
Во второй главе «Объекты, объем и методы исследования» представлены характеристики участников комплексных обследований состояния здоровья сотрудников предприятия ООО «ПО «КИНЕФ» («Киришинефтеоргсинтез»), а также жителей Санкт-Петербурга и Ленинградской области, полученных в 1995-2008 годах сотрудниками Оздоровительного фонда «МЕДИНЕФ» и научно-исследовательской лаборатории лекарственной и экологической токсикологии Военно-медицинской академии им. С.М. Кирова. Всего обследовано 1945 человек — 1221 мужчина и 724 женщины. Из них на нефтеперерабатывающем предприятии работает 1596 человек (1073 мужчины и 523 женщины). В значительной части обследования были неоднократными, поэтому общее число обследований составило 6698 (4005 у мужчин и 2693 у женщин).
Перечень показателей включает в себя показатели биохимического анализа крови: гемоглобин, общий холестерин, холестерин липопротеидов высокой плотности, холестерин липопротеидов низкой плотности (ХС ЛПНП), тригли-цериды, коэффициент атерогенности аланин-амино-трансфераза, аспартат-амино-трансфераза, альфа-амилаза, мочевина, мочевая кислота, креатинин, билирубин общий, лактат, глюкоза; показатели клинического анализа крови: лейкоциты, эритроциты, сегментоядерные, лимфоциты; а также гемодинамические и расчетные показатели: систолическое давление, диастолическое давление, ударный объем кровообращения, минутный объем кровообращения, периферическое сопротивление, индекс физического состояния. Для всех пациентов проводилось ультразвуковое исследование сонных и бедренных артерий с выявлением атеросклеротических бляшек.
В третьей главе «Теоретическое обоснование возможности применения и разработка математического аппарата нейросетевой оценки риска развития клинических проявлений атеросклероза» представлены результаты теоретиче-
10
ских исследований, ставшие основой разработанного нейросетевого алгоритма оценки риска. Показано, что линейный дискриминантный анализ (ЛДА), лежащий в основе медицинской статусметрии, позволяет одновременно решить задачу классификации и задачу восстановления условной функции частоты. Однако использование ЛДА требует, чтобы в каждой альтернативной выборке «больных» и «здоровых» данные были распределены нормально и с одинаковой дисперсией, тогда как для биомедицинских данных эти требования невыполнимы.
ИНС - это математический аппарат многомерной обработки данных произвольной природы, моделирующий структуру и функционирование биологической нейронной сети. В качестве количественной оценки риска при этом принимается условная функция частоты, под которой, согласно статистической математике, подразумевают величину, определяющую, как часто наблюдается исследуемое заболевание («контрольная точка») при заданном сочетании показателей лабораторных и врачебных обследований. Условная функция частоты восстанавливается по обучающему множеству, в которое входят результатам лабораторных и инструментальных исследований. Обучающее множество представляет собой матрицу исходных данных, включающих набор показателей пациента, количество пациентов в обучающей выборке и вектор диагнозов (0-«здоров», 1- «болен»). Данные пациента, состоящие из набора показателей и диагноза, называются «пример из обучающей выборки» или «прецедент».
Настройка параметров ИНС называется «обучением». Для контроля над качеством обучения и результатами работы ИНС используется два вида критериев. Критерий, который применяется непосредственно в процедуре обучения ИНС, называется «внутренним» критерием. Он служит для пошагового подбора параметров ИНС с целью его минимизации. Для проверки того, воспроизводит ли ИНС на самом деле искомую функцию частоты, используется «внешний» критерий, который рассчитывается на данных, не участвовавших в обучении.
Данные литературы, собственные теоретические исследования и вычислительные эксперименты позволили разработать внешний и внутренний критерии, которые обеспечивают оптимум между информативной емкостью и обоб-
11
щающими свойствами ИНС и гарантирует воспроизведение ИНС искомой функции условной частоты. Применяемый в данной работе внешний критерий имеет простой квадратичный вид. Внутренний критерий обучения ИНС представляет собой взвешенную сумму квадратичного критерия, отвечающего за информативную емкость ИНС и штрафной функции, обеспечивающей обобщающие свойства ИНС:
где с1к - ожидаемая реакция нейросети, указанная в обучающем примере под номером к, ук - реакция ИНС на значения показателей из этого же примера, М - количество примеров в обучающем множестве, /^(а) - «штрафная функция», определяющая информативную емкость ИНС, а - вектор настраиваемых параметров ИНС, Р - коэффициент регуляризации.
Следует отдельно отметить роль коэффициента регуляризации в обучении ИНС. Именно благодаря подбору этого коэффициента становиться возможным соблюсти наиболее удачное для воспроизведения условной функции частоты сочетание информативной емкости ИНС и ее обобщающих свойств.
В четвертой главе «Разработка алгоритма автоматизированного синтеза нейросетевой системы оценки риска» представлено описание процедуры и этапов сквозного алгоритмического синтеза нейросетевой оценки риска. Основная задача разработанной процедуры синтеза состоит в поиске оптимальной структуры ИНС и коэффициента регуляризации. Эта процедура состоит из пяти основных этапов, порядок выполнения которых носит циклический характер (рисунок 1).
На первом этапе происходит формирование обучающего множества на основе данных популяционных лабораторных, инструментальных и врачебных исследований. На втором этапе осуществляется выбор типа ИНС и соответствующего ей внутреннего критерия. В данной работе основной упор делается на ИНС прямого распространения, обучаемой по внутреннему критерию. На третьем этапе проводится очень большое количество численных экспериментов
(1)
по определению величины параметров регуляризации, которые позволяют ИНС выбранной структуры воспроизводить искомую частоту.
©
©
© ©
Данные популяционных исследований
Формирование обучающего множества л
О
Г V Выбор структуры ИНС и метода ее обучения
і
Ґ N. Определение оптимальных параметров процедуры обучения "ч >
О
Г V Обучение ИНС по всему обучающему множеству л
О
/ V Отбор наилучшей ИНС и сохранение ее в базу данных л >
ИНС, реализующая условную функцию частоты
Рисунок 1 - Общий алгоритм синтеза нейросетевой системы оценки риска
В результате многократного повторения второго и третьего этапов выявляется наиболее приемлемая структура ИНС и эмпирическая зависимость пара-
метра регуляризации обучения от размера обучающей выборки. Экстраполяция этой зависимости позволяет определить параметр регуляризации для обучения ИНС по всей обучающей выборке, что и происходит на четвертом этапе. При анализе результатов обучения проводится экспертный анализ на соответствие величины риска состоянию здоровья лиц, чьи данные исследований были включены в обучающее множество. Как правило, большая часть выявленных экспертами несоответствий связана с неучтенным ранее интенсивным лечением, либо значимым кратковременным ухудшением здоровья, что является основанием для исключения примеров с подобными несоответствиями из обучающей выборки.
После коррекции обучающей выборки разработанного алгоритма получена ИНС с наилучшими обобщающими и классифицирующими свойствами, которая воспроизводит наиболее вероятную форму условной функции частоты, скрытую в экспериментальных альтернативных данных.
В пятой главе «Исследование эффективности нейросетевого метода оценки риска развития клинических проявлений атеросклероза» представлены результаты вычислительных экспериментов. В первую очередь, было получено подтверждение того, что внешний квадратичный критерий при условии минимизации информативной емкости ИНС на самом деле гарантирует воспроизведения условной функции частоты. Для этого задавались гипотетическая условная частота, на ее основе порождались альтернативные данные, и уже по ним происходило обучение ИНС. Реакция полученной ИНС сравнивалась с исходной функцией частоты. Мерой сравнения является квадратичная ошибка воспроизведения частоты. Зависимость внешнего критерия от коэффициента регуляризации полностью повторяет форму квадратичной ошибки с точностью до постоянной составляющей (рисунок 2).
Коэффициент корреляции между упомянутыми критериями близок к величине 0,999 и не зависит от формы исходной функции частоты. Эта серия вычислительных экспериментов показала эффективность разработанного алгоритма обучения ИНС, при этом были подтверждены следующие предположения: внутренний критерий при удачном подборе коэффициента регуляризации
14
гарантирует воспроизведение искомой функции частоты; для каждой ИНС коэффициент регуляризации имеет единственную оптимальную величину, зависящую от сложности структуры ИНС и объема обучающей выборки; для ИНС с фиксированной структурой становится возможно выявить зависимость оптимальной величины и коэффициента регуляризации от объема обучающей выборки, что позволяет экстраполировать величину коэффициента на всю обучающую регуляризации выборку.
Преимущество ИНС в качестве воспроизведения условной частоты хорошо демонстрирует сравнительный анализ трех методов: нейросетевого, ЛДА и метода кп-ближайших соседей (аналог метода «скользящего среднего») на примере одномерного варианта, когда величина риска оценивается только по одному показателю «глюкоза».
0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02
0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Коэффициент регуляризации
Рисунок 2 - Сопоставление ошибки воспроизведения частоты и внешнего квадратичного критерия при разных величинах коэффициента регуляризации
При этом ИНС сглаживает флуктуации эмпирической кривой и практически полностью повторяет ее форму. Результаты же ЛДА в значительной степени завышают роль глюкозы в доклиническом атеросклерозе. Вызвано это зна-
V
Внешний квадратичный критерий
Постоянная составляющая внешнего критерия
Квадратичная ошибка воспроизведения частоты
чимой асимметрией вероятностного распределения величины глюкозы и нарушением требований ЛДА (рисунок 3).
-ИНС
Рисунок 3 - Зависимость условной функции частоты выявления доклинического атеросклероза от величины показателя «глюкоза»
Для того чтобы продемонстрировать преимущества нейросетевого подхода над ЛДА, был проведен синтез ИНС простейшей структуры из четырех нейронов. Для проведения эксперимента были отобраны данные первых исследований тех лиц, у которых наличие или отсутствие атеросклероза было подтверждено результатами УЗИ, проведенного два и более раз. В результате была получена обучающая выборка, включающая данные 591 исследования, причем 216 из них сопровождались диагнозом «атеросклероз». В состав исходных данных входило 25 приведенных ранее показателей. В каждом вычислительном эксперименте данные случайным образом разбивались на две выборки: обучающая - 400 и тестовая - 191. Первая серия тестов позволила сравнить изменение реакции ИНС и модели Фишера при вариации обучающих выборок после 10000 испытаний с разными обучающими выборками (таблица 1). Внешний критерий, рассчитываемый на данных, не участвовавших в обучении, показал, что ИНС более точно воспроизводит функцию условной частоты, а вариация результатов работы ИНС в значительной степени меньше, чем при обучении модели Фишера. Последнее утверждение подтверждается, тем, что при большом количестве испытаний реакция ИНС в среднем только на двух примерах
16
из обучающего множества отклонилась на величину, большую, чем 0,34 (в абсолютных единицах). Реакция модели Фишера в этих же условиях преодолела порог 0,34 в 179 случаях, при этом полученные различия статистически достоверны (х2= 204; р<0,0001).
Таблица 1 - Результаты работы ЛДА и ИНС при разных обучающих выборках
Параметр ИНС Модель Фишера
Средняя величина внешнего критерия (без постоянной составляющей) 0,011+0,001 0,020±0,003
Дисперсия оценки частоты при разных обучающих выборках 0,04 0,08
Среднеквадратичное отклонение оценки частоты при разных обучающих выборках 0,20 0,24
Максимальное среднеквадратичное отклонение оценки частоты при разных обучающих выборках 0,34 0,49
Количество примеров, при которых среднеквадратичное отклонение превышает 0.34 2 179
Следующая серия испытаний позволила выяснить, каким образом ИНС и модель Фишера реагируют на существенное изменение только одного показателя. Для этого ИНС и модели Фишера настраивались на одинаковых обучающих выборках и рассчитывались оценки риска на тестовых данных. Далее один из показателей (холестерин липопротеидов низкой плотности) во всех примерах тестовой выборки значимым образом изменялся (до 8 ммоль/л), после чего сравнивалось реакция ИНС и модели Фишера с исходными оценками риска (таблице 2).
Таблица 2 - Среднестатистическое искажение оценки риска при изменении ХС ЛПНП до 8 ммоль/л
Параметр ИНС Модель Фишера
Средняя величина внешнего критерия (без постоянной составляющей) 0,011+0,001 0,020+0,003
Дисперсия оценки частоты при разных обучающих выборках 0,04 0,08
Среднеквадратичное отклонение оценки частоты при разных обучающих выборках 0,20 0,24
Максимальное среднеквадратичное отклонение оценки частоты при разных обучающих выборках 0,34 0,49
Количество примеров, при которых среднеквадратичное отклонение превышает 0,34 2 179
При большом количестве испытаний точно так же, как и при изменении обучающей выборки, ИНС показала гораздо более устойчивые результаты. Так порог абсолютной вариации риска 0,16 в случае ИНС в среднем преодолели только 5 примеров, а в случае модели Фишера - 470 (р<0,0001).
В главе 6 «Оценка риска развития клинических проявлений атеросклероза с учетом характера и условий труда на примере работников нефтепереработки» показаны фактические результаты анализа риска развития клинических проявлений атеросклероза на примере работников нефтеперерабатывающего производства. Наиболее важным является анализ развития атеросклероза у работников молодого возраста, так как они традиционно относятся к категории низкого, реже умеренного риска. Так, согласно оценке FHS к категории низкого риска (вероятность развития ИБС в течении 10 лет меньше 5%) было отнесено 70% мужчин, занятых на НПП . К классу умеренного риска (до 10%) было отнесено 15% лиц из той же когорты . При этом, в категории низкого риска уже у 16% лиц выявлен атеросклероз крупных артерий, а в категории умеренного риска распространенность атеросклероза крупных артерий достигла 48%.
С целью наглядного представления и подтверждения информативности метода ИНС проведен сравнительный анализ полученных результатов с аналогичными результатами, полученными при использовании методик оценки риска SCORE и FHS. Для анализа взяты две собирательные профессиональные группы: работники ремонтных бригад и транспортных цехов, которые в процессе труда подвергаются воздействию комплекса вредных химических веществ, преимущественно углеводородов, в сочетании с шумом, интенсивность которых соответствует параметрам условий труда в пределах классов 3.1 - 3.2, согласно Р 2.2.2006-05, и объединенная группа операторов нефтепереработки и инженерно-технических работников (ИТР), условия труда которых, в основном, соответствуют второму классу.
При этом группы работников распределены таким образом, чтобы в каждом возрастном диапазоне средний возраст у лиц с низким и высоким стажем был одинаков, что позволило элиминировать возраст и проанализировать динамику риска развития клинических проявлений атеросклероза в зависимости от
18
стажа работы. Стаж в данном исследовании представлен двумя качественными характеристиками - низкий (Н) и высокий (В). В группу с низким стажем входят работники, чей стаж ниже его среднестатистического значения для лиц данного возраста, а в группу с высоким стажем - работники со стажем равным или большим его среднестатистического значения для лиц данного возраста (таблица 3).
Результаты анализа показали, что методами SCORE и FHS не удается выявить лиц, относящихся к группе высокого риска формирования атеросклероза в возрастных группах до 30 и 31 - 40 лет, в то время как разработанным методом ИНС в группе до 30 лет во второй стажевой группе у 12% обследованных выявлены доклинические признаки атеросклероза, а в возрастной группе 31 -40 лет удельный вес лиц с доклиническими признаками атеросклероза составил 22% при стаже до пяти лет и 25% - при среднем стаже около 15 лет.
Таблица 3 - Сравнительная характеристика зависимости повозрастного риска развития доклинических признаков атеросклероза от стажа работы в различных моделях оценки
Стаж работы, лет Возраст, лет Число лиц Средний возраст, лет Средний стаж,лет Доля лиц с высоким риском, %, по методике Распр. доклинического. AT
SCORE FHS ИНС
Работники ремонтных бригад и транспортных цехов
Н До 30 12 24,13 2,13 0 0 0 0
В 24 26,25 6,5 0 0 12,5 6,25
Н 31-40 49 35,25 4,19 0 0 21,88 25
В 25 35,69 14,88 0 0 25,00 43,75
Н 41-50 72 44,51 4,81 2,13 4,26 65,96 61,7
В 47 45,16 20,81 6,45 12,9 64,52 74,19
Н Более 51 64 55,24 9,52 35,71 26,19 76,19 73,81
В 24 53,19 28 37,5 25 87,5 62,5
Операторы нефтепереработки и ИТР
Н До 30 88 25,36 2,93 0 0 1,72 0
В 81 25,7 6,66 0 0 0 3,77
Н 31-40 129 34,22 4,79 0 0 11,76 8,24
В 110 34,56 13,33 0 0 16,67 26,39
Н 41-50 113 43,96 7,92 1,35 0 48,65 39,19
В 123 44,67 21,85 2,47 8,64 55,56 48,15
Н Более 51 53 56,26 10,03 34,29 40 60 62,86
В 59 55,56 27,54 38,46 33,33 71,79 53,85
Сравнительный анализ показателей риска в обеих профессиональных группах, а также сопоставление их в зависимости от стажа во всех возрастных группах, свидетельствует о наличии взаимозависимостей между характером и условиями труда, с одной стороны, и сроками развития и распространенность доклинических признаков атеросклероза - с другой. Так, во всех группах, начиная с 30 лет, риск развития атеросклероза у работников ремонтных бригад и транспортных цехов существенно выше, чем у операторов нефтепереработки и ИТР, для которых характерно менее интенсивное воздействие факторов рабочей среды и трудового процесса, независимо от стажа работы. Кроме того, риск существенно зависит от стажа работы. Так, для мужчин в возрасте 30 - 40 лет (средний возраст 35 лет) с низким стажем работы (в пределах 4-5 лет), атеросклероз выявляется у 8% операторов нефтепереработки и ИТР и у 25% работников ремонтных бригад и транспортных цехов. При увеличении стажа работы до 13 - 15 лет в тех же возрастных группах распространенность атеросклероза крупных артерий возрастает до 26% и 44% соответственно, при этом влияние возраста элиминировано. Кроме того, между показателями первой и второй стажевыми группами при условии объединения всех возрастных групп выявлены статистически достоверные различия (р<0,027).
В разделе «Обсуждение полученных результатов» представлены основные преимущества разработанной методики, пути дальнейшего теоретического развития метода и расширения сферы его применения. Показано, что благодаря высокой информативной емкости ИНС и ее обобщающим способностям, разработанный метод оценки риска развития атеросклероза в значительной степени повышает эффективность мониторинга состояния здоровья работников нефтеперерабатывающих предприятий и позволяет решить главную задачу доклинической диагностики атеросклероза, а, именно, не «пропустить» лиц молодого возраста с высокой активностью атеросклеротических процессов. Высокая чувствительность нейросетевого метода к изменению взаимосвязей показателей функциональных систем организма позволяет отследить систематический рост величины риска, спрогнозировать развитие патологии, принять своевременные профилактические и лечебные мероприятия. Последующий анализ динамики
20
риска позволяет также оценить эффективность принятых мер, при необходимости скорректировать профилактику и лечение доклинического атеросклероза.
Разработанный метод оценки риска развития клинических проявлений атеросклероза ориентируется на изменение взаимосвязи и вариации комплекса биохимических показателей, входящих в стандартный набор лабораторных исследований, таких как клинический и биохимический анализ крови, что позволяет получить индивидуальную количественную оценку риска развития атеросклероза для работников, занятых в различных видах экономической деятельности опираясь на доклиническую стадию развития патологии, не дожидаясь реализации рисков.
ВЫВОДЫ
1. Линейный дискриминантный анализ в значительной степени искажает оценку риска развития клинических проявлений атеросклероза для лиц, чьи данные сильно отличаются от основной массы наблюдений, что обусловлено несоответствием распределения медицинских и биологических данных требованиям метода.
2. Математический аппарат искусственных нейронных сетей является наиболее приемлемой альтернативой линейному дискриминантному анализу, так как преобразовывает многообразие исходных показателей к виду, удовлетворяющему требованиям линейного дискриминантного анализа, что позволяет избежать искажения результатов оценки риска развития клинических проявлений атеросклероза в случаях введения в систему новых данных, появления данных, существенно отличающихся от основной массы наблюдений, и ошибочных измерений.
3. Теоретически обоснован, реализован и исследован оригинальный нейро-сетевой метод оценки риска развития клинических проявлений атеросклероза, важным достоинством которого является более высокая по сравнению с другими методами чувствительность к изменению структуры взаимосвязей показателей функциональных систем организма, в том числе и в случаях, когда величины этих показателей находятся в пределах общепринятых медицинских норм.
4. Разработана методика сквозного алгоритмического синтеза искусственных нейронных сетей, четко разделяющая задачи технических и медицинских экспертов, что позволяет добиваться максимальной эффективности их работы.
5. Высокая чувствительность нейросетевого метода к изменению взаимосвязей показателей функциональных систем организма позволяет отследить систематический рост величины риска, спрогнозировать развитие патологии, принять своевременные профилактические и лечебные мероприятия. Последующий анализ динамики риска позволяет также оценить эффективность принятых мер, и, при необходимости, скорректировать профилактику и лечение доклинического атеросклероза.
6. Использование метода ИНС позволило выявить зависимость показателей риска развития клинических проявлений атеросклероза от интенсивности воздействия вредных производственных факторов и стажа работы. Начиная с 30 лет, независимо от стажа работы риск развития атеросклероза у работников ремонтных бригад и транспортных цехов существенно выше, чем у операторов нефтепереработки и ИТР, для которых характерно менее интенсивное воздействие факторов рабочей среды и трудового процесса. При увеличении среднего стажа работы от 5 до 15 лет риск развития клинических проявлений атеросклероза возрастает, что, при объединении всех возрастных групп подтверждается наличием статистически достоверных различий (р<0,027).
СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Юсупов, А.Н. Исследование зависимости частоты выявления бляшек в магистральных артериях от уровня глюкозы в крови у работников нефтеперерабатывающего производства / А.Н. Юсупов, П.В. Бовтюшко, В.А. Чепурнов // Вестник Российской Военно-медицинской академии. Приложение. - 2007. - N 2 (18).-С. 170.
2. Иванов, A.A. Распространенность дислипопротеидемий и ишемической болезни сердца у разных категорий работников нефтеперерабатывающего производства / A.A. Иванов, В.А. Чепурнов, П.В. Бовтюшко, В.В. Щукин, А.Н. Юсупов // Вестник Российской Военно-медицинской академии. Приложение. -2008. - N 3 (23). - С. 110.
3. Юсупов, А.Н. Нейросетевой метод оценки риска развития клинических проявлений атеросклероза / А.Н. Юсупов // Сборник докладов и тезисов Международной научно-практической конференции. - Днепропетровск: ИТМ НА-НУ и НКАУ. -2008. - С. 161 -162.
4. Патент № 2385668 Российская Федерация. Способ индивидуальной количественной оценки риска развития клинических проявлений атеросклероза / Бовтюшко В.Г., Бовтюшко П.В., Поддубский Г.А., Юсупов А.Н.; опубл. 10.04.2010.-Бюл.№ 10. - Ч. 2. - С. 424.
5. Бовтюшко, П.В. Оценка риска развития атеросклероза по показателям липидного обмена у персонала нефтеперерабатывающих предприятий / П.В. Бовтюшко, А.Н. Юсупов // Вестник Российской Военно-медицинской академии. Приложение. - 2010. - № 2 (30) - С. 215.
6. Юсупов, А.Н. Применение искусственных нейронных сетей в оценке риска развития клинических проявлений атеросклероза / А.Н. Юсупов, П.В. Бовтюшко // Вестник Российской Военно-медицинской академии. Приложение. -2010.-№2(30)-С. 193 - 197.
7. Юсупов, А.Н. Оценка активности атеросклеротических процессов с применением математического аппарата искусственных нейронных сетей у работников нефтеперерабатывающего предприятия / А.Н. Юсупов, П.В. Бовтюшко // Вестник Российской Военно-медицинской академии. - 2011. - № 3 (35). -С. 141-145.
8. Юсупов, А.Н. Регуляризация метода Лавенберга-Маркварта при обучении искусственных нейронных сетей прямого распространения /А.Н. Юсупов, П.В. Бовтюшко //Актуальные проблемы защиты безопасности. Военно-морской флот России. Труды XIV научно-практической конференции. Том 4. - С. 283 -292.
ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ
1. Предлагаемая система оценки риска не использует показатели, специфичные только для нефтепереработки, исходя из чего нейросетевой алгоритм оценки риска может применяться для мониторинга состояния работников в
возрасте 25 - 85 лет, занятых в различных сферах деятельности.
23
2. Применение предлагаемого метода целесообразно для работников, подверженных следующим факторам риска:
работа на предприятиях с повышенной (профессионально-обусловленной) заболеваемостью болезнями системы кровообращения;
- проживание в экологически-неблагоприятных условиях, способствующих раннему развитию атеросклероза;
- семейный анамнез (ранняя смерть ближайших родственников или наличие у них диагнозов, таких как инфаркт, инсульт или других клинических проявлений атеросклероза);
- нарушение липидного обмена (ОХС больше 5 или ХС ЛПНП больше 3,5 или ТГ больше 1,7 ХС ЛПВП меньше 1 для мужчин или ХС ЛПВП меньше 1,2 для женщин);
- наличие заключения о нарушении толерантности к глюкозе;
- избыточный вес (ИМТ больше 29) и курение.
3. Если при обследовании пациента невозможно измерить какой-либо из анализируемых показателей, то при расчете оценки риска необходимо использовать медиану данного показателя, рассчитанную на данных обучающего множества.
4. Как правило, при обследовании пациента возникает необходимость проанализировать вклад того или иного показателя в оценку риска. Для этого необходимо рассчитать оценку риска только по этому показателю, заменив значения других показателей соответствующей медианой.
5. Для выявления наиболее значимых факторов, главным образом определяющих оценку риска исследуемого пациента, необходимо провести описанную в предыдущем пункте процедуру для всего комплекса исследуемых показателей.
6. При анализе здоровья группы лиц, целесообразно данные их исследований разбить на группы «здоровых» и «больных» используя правило Байеса («больные» - риск больше 50%). Это позволит при помощи известных статистических методов выявить специфические атерогенные изменения показателей и проанализировать их взаимосвязь с условиями труда и средой обитания.
24
Подписано в печать 24.02.12 Формат 60x84'/,6 Цифровая Печ. л. 1.375 Уч.-изд.л. 1.375 Тираж 100 Заказ 22/02 печать_
Отпечатано в типографии «Фалкон Принт» (197101, г. Санкт-Петербург, ул. Большая Пушкарская, д. 54, офис 2)
Текст научной работы по медицине, диссертация 2012 года, Юсупов, Андрей Николаевич
61 12-3/585
Федеральное государственное образовательное учреждение профессионального образования «Военно-медицинская академии имени С.М. Кирова» Министерства обороны Российской Федерации На правах рукописи
ЮСУПОВ Андрей Николаевич
ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В ОЦЕНКЕ РИСКА РАЗВИТИЯ КЛИНИЧЕСКИХ ПРОЯВЛЕНИЙ АТЕРОСКЛЕРОЗА У РАБОТНИКОВ, ЗАНЯТЫХ ВО ВРЕДНЫХ УСЛОВИЯХ ТРУДА (НА ПРИМЕРЕ НЕФТЕПЕРЕРАБАТЫВАЮЩИХ ПРОИЗВОДСТВ)
14.02.04 - медицина труда
Диссертация на соискание ученой степени кандидата биологических наук
Научный руководитель:
доктор медицинских наук, профессор
В.Г. Бовтюшко
Научный консультант: академик РАМН, профессор Г.А. Софронов
Санкт-Петербург 2012
СОДЕРЖАНИЕ
СПИСОК СОКРАЩЕНИЙ И ОБОЗНАЧЕНИЙ......................................................5
ВВЕДЕНИЕ..................................................................................................................6
Глава 1. СОВРЕМЕННЫЕ ПОДХОДЫ К АНАЛИЗУ ДАННЫХ МЕДИЦИНСКИХ ОБСЛЕДОВАНИЙ. АНАЛИТИЧЕСКИЙ ОБЗОР
ЛИТЕРАТРЫ..............................................................................................................13
1Л. Статистические данные о сердечнососудистой патологии у работников нефтеперерабатывающих производств...................................................................13
1.2. Медицинская статусметрия в оценке риска развития клинических проявлений атеросклероза........................................................................................15
1.3. Применение искусственных нейронных сетей в медицине......................21
1.4. Методологические аспекты применения ИНС в оценке риска.................24
1.5. Генетические методы.....................................................................................27
1.6. Критерий качества обучения ИНС...............................................................29
1.7. Заключение.....................................................................................................30
Глава 2. ОБЪЕКТЫ, ОБЪЕМ И МЕТОДЫ ИССЛЕДОВАНИЯ.....................31
2.1. Общая характеристика материала исследования........................................31
2.2. Характеристика использованных показателей...........................................32
2.3. Описание процесса составления обучающих и контрольных выборок... 36
2.4. Программное обеспечение............................................................................36
2.5. Заключение.....................................................................................................38
Глава 3. ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ ВОЗМОЖНОСТИ ПРИЕНЕНИЯ И РАЗРАБОТКА МАТЕМАТИЧЕСКОГО АППАРАТА НЕЙРОСЕТЕВОЙ ОЦЕНКИ РИСКА РАЗВИТИЯ КЛИНИЧЕСКИХ ПРОЯВЛЕНИЙ АТЕРОСКЛЕРОЗА........................................................................39
3.1. Формальное представление исходных данных...........................................39
3.2. Математическое определение оценки риска...............................................41
3.3. Связь условной функции частоты и модели Фишера................................42
3.4. Востановление условной функции частоты методом «кп ближайших соседей» (kn — Nearest Neighbor).............................................................................45
3.5. Особенности применения искусственных нейронных сетей при аппроксимации условной функции частоты...........................................................51
3.6. Эмпирический подход к регуляризации обучения искусственных нейронных сетей........................................................................................................59
3.7. Коррекция алгоритма Лавенберга-Маркварта............................................66
3.8. Генетический алгоритм и аспекты его применения в синтезе и обучении ИНС..............................................................................................71
3.9. Нормировка значений исходных показателей............................................72
3.10. Заключение..................................................................................................77
Глава 4. РАЗРАБОТКА АЛГОРИТМ АВТОМАТИЗИРОВАННОГО СИНТЕЗА НЕЙРОСЕТЕВОЙ СИСТЕМЫ ОЦЕНКИ РИСКА.............................79
4.1. Общая структура процедуры синтеза..........................................................79
4.2. Формирование обучающего множества......................................................81
4.3. Выбор структуры ИНС и метода ее обучения............................................87
4.4. Обучение ИНС по всему обучающему множеству....................................91
Глава 5. ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ НЕЙРОСЕТЕВОГО МЕТОДА ОЦЕНКИ РИСКА РАЗВИТИЯ КЛИНИЧЕСКИХ ПРОЯВЛЕНИЙ АТЕРОСКЛЕРОЗА....................................................................................................98
5.1. Статистическое моделирование...................................................................98
5.1.1. Пример восстановления условной функции частоты по экспериментальным данным....................................................................................98
5.1.2. Экспериментальное подтверждение эффективности применения внешнего критерия..................................................................................................103
5.2. Проверка эффективности нейросетевого алгоритма по сравнению с
существующим методом на экспериментальных данных...................................106
5.2.1. Сравнение результатов работы ИНС и ЛДА на реальных экспериментальных данных...................................................................................106
5.2.2. Исследование вариации оценки риска при значительном изменении
одного параметра.....................................................................................................111
5.3. Заключение...................................................................................................117
Глава 6. ОЦЕНКА РИСКА РАЗВИТИЯ КЛИНИЧЕСКИХ ПРОЯВЛЕНИЙ АТЕРОСКЛЕРОЗА С УЧЕТОМ ХАРАКТЕРА И УСЛОВИЙ ТРУДА НА ПРИМЕРЕ РАБОТНИКОВ НЕФТЕПЕРЕРАБОТКИ..........................................118
6.1. Распространенность атеросклероза крупных сосудов среди работников нефтепереработки....................................................................................................118
6.2. Сравнительный анализ эффективности нейросетевой оценки риска развития клинических проявлений атеросклероза со шкалами SCORE, PROCAM и FHS.......................................................................................................121
6.3. Анализ состояния здоровья работников HI Ш, находящихся под
длительным наблюдением......................................................................................124
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ...........................................................................127
ВЫВОДЫ.................................................................................................................134
ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ.................................................................136
СПИСОК ЛИТЕРАТУРЫ.......................................................................................138
СПИСОК СОКРАЩЕНИЙ И ОБОЗНАЧЕНИЙ
ВМГТ - военно-морская госпитальная терапия
ВМедА - Военно-медицинская академия имени С.М. Кирова
ВОЗ - Всемирная организация здравоохранения
ВУТ - временная утрата трудоспособности
ГА - генетический алгоритм
ИНС - искусственная нейронная сеть
ИМТ - индекс массы тела
ИФС - индекс физического состояния
ЛДА - линейный дискриминантный анализ
ЛДФ - линейная дискриминантная функция
МОК - минутный объем кровообращения
ОХС - общий холестерин
ПД - пульсовое давление
ПС - периферическое сопротивление
СДД - средне динамическое давление
ССЗ - сердечнососудистое заболевание
УЗДГ - ультразвуковая допплерография
УЗИ - ультразвуковое исследование
УОК - ударный объем кровообращения
ХС ЛПНП - холестерин липопротеидов низкой плотности
ХС ЛПВП - холестерин липопротеидов высокой плотности
ЧСС - частота сердечных сокращений
ЭКГ - элекрокардиография
ЭЭГ - эхокардиография
FHS - Framingham Heart Study
kn БС - метод kn ближайших соседей
ВВЕДЕНИЕ
Охрана здоровья работающего населения является одной из приоритетных составляющих социальной деятельности любого государства. Особое значение это имеет для современной России, поскольку ограниченные ресурсы трудового потенциала могут в недалекой перспективе создать проблемы в обеспечении национальной безопасности страны. Сложившаяся ситуация переводит сохранение здоровья работающих из задачи, по преимуществу социальной, в задачу политическую, причем первостепенной важности. Успешное ее решение сопряжено не в последнюю очередь с необходимостью осуществления фундаментальных и прикладных научных изысканий в области медицины труда. И не случайно планом научных работ учреждений Российской академии медицинских наук на 2010 - 2011 годы предусмотрено «Установление общих закономерностей и механизмов влияния факторов производственной среды и трудового процесса на здоровье работающих».
Одним из ключевых направлений формирования научных основ профилактики производственно обусловленных заболеваний справедливо признается совершенствование методологии оценки производственного риска (Измеров Н.Ф., Каспаров A.A., 2002, Измеров Н.Ф., 2005; Шаяхметов С.Ф., Дьякович М.П., 2007; Денисов Э.И., Чесалин П.В., 2007 ). Важно при этом подчеркнуть, что внедрение в медицину труда современных принципов и технологий получения количественных характеристик профессионального риска дает возможность прогнозирования и оценки индивидуального риска и тем самым поднимает эффективность проводимых профилактических мероприятий на качественно иной уровень.
В течение 20 лет наш научный коллектив осуществляет мониторинг состояния здоровья персонала одного из крупнейших отечественных нефтехимических предприятий - Нефтеперерабатывающего завода «Кириши-нефтеоргсинтез», расположенного в г. Кириши Ленинградской области. В процессе многолетних исследований установлен целый ряд научных фактов и, в
частности, приоритет раннего развития сердечнососудистой патологии атерогенной природы у работников завода (Бовтюшко В.Г., 1996, Иванов A.A., 2007, и др.).
Учитывая длительный латентный период развития атеросклероза, особую актуальность для рациональной и эффективной профилактики клинических проявлений атеросклероза приобретают методы ранней диагностики этой болезни [48].
Целью многих исследований в данной области является установление взаимосвязи патологии с величинами различных биохимических и физиологических показателей. В частности, в работах Г.И. Разоренова и Г.А. Поддубского (1985) был представлен метод медицинской статусметрии, который успешно применялся при решении ряда задач диагностического и прогностического характера. В основе медицинской статусметрии заложена линейная дискриминантная модель Фишера, параметры которой определяются по данным клинических, инструментальных и лабораторных исследований, в двух обучающих альтернативных выборках: «больных» и «здоровых» [65].
В 1996 году В.Г. Бовтюшко в докторской диссертации показал эффективность практического применения статусметрии при решении задачи диагностики доклинических стадий заболеваний сердечнососудистой системы атерогенной природы у работников нефтехимических производств. Одним из важных результатов этой и последующих работ стало выявление динамики взаимосвязей биохимических и гемодинамических показателей при развитии атеросклероза. Установленные зависимости позволили расширить перечень диагностических показателей, традиционно используемых при оценке риска, что повысило информативность и устойчивость полученных результатов, по сравнению с наиболее распространенными экспертными методами. Индивидуальная количественная оценка состояния здоровья, предложенная В.Г. Бовтюшко, получила название «риска развития клинических проявлений атеросклероза» и определялась как условная частота клинических проявлений
атеросклероза, соответствующая заданному сочетанию показателей лабораторных и клинических обследований.
Дальнейшие исследования, связанные с доклинической диагностикой сердечнососудистой патологии, были направлены на усовершенствование алгоритмов расчета риска. В основе метода по-прежнему оставался линейный дискриминантный анализ Фишера, но исходные данные предварительно обрабатывались методом главных компонент [29]. Этот метод осуществляет линейное преобразование пространства исходных показателей в факторное пространство с меньшей размерностью и линейно независимыми компонентами. При этом осуществляется переход от широкого набора исходных показателей к ограниченному числу статистически независимых интегральных показателей, что значительно повышает надежность оценок с минимальной потерей информативности. На основе этого подхода была создана и внедрена автоматизированная экспертная система доклинической диагностики сердечнососудистой патологии атерогенной этиологии, которая применяется в рамках программы мониторинга здоровья работников нефтеперерабатывающего предприятия «Киришинефтеоргсинтез». Один из основных элементов мониторинга — выявление лиц с повышенным риском развития сердечнососудистых заболеваний среди тех, у кого отсутствуют явные клинические признаки патологии. Опыт использования этой системы подтвердил эффективность применения оценки риска в целях своевременной первичной профилактики сердечнососудистых заболеваний атерогенной природы. Одновременно был выявлен и ряд недостатков используемой системы, проявляющихся в значимом искажении оценки риска для лиц, показатели которых имели значения, далеко отстоящие от основной массы наблюдений. Анализ проблемы практического применения статусметрии свидетельствует, что ее «слабое звено» заключается в несоответствии исходных данных некоторым важным требованиям и допущениям линейного дискриминантного анализа. Недостаточная эффективность применяемого
метода, новые данные популяционных исследований, а также современные сведения об эпидемиологии и патогенезе атеросклероза побудили нас к поиску иного подхода к определению величины риска.
В основу нового подхода, повышающего эффективность практического применения метода индивидуальной оценки риска, заложен математический аппарат, так называемых, искусственных нейронных сетей (ИНС). ИНС - это математический аппарат, основанный на аналогии с биологическими нейронными сетями. Методы, использующие ИНС, называют нейросетевыми. Как будет показано в данной работе, ИНС способны обобщать эмпирические данные, выявлять и воспроизводить скрытые в этих данных закономерности. Эти достоинства нейросетевого подхода позволили рассматривать его как наиболее приемлемую альтернативу применяемым ранее классическим статистическим методам. В данной работе представлена разработка и реализация нейросетевого алгоритма, позволяющего усовершенствовать метод медицинской статусметрии.
Целью настоящей работы является совершенствование системы оценки индивидуального риска развития клинических проявлений атеросклероза, у работников занятых во вредных условиях труда, путем использования математического аппарата искусственных нейронных сетей.
Для достижения поставленной цели необходимо было решить следующие основные задачи:
Исследовать современные подходы к анализу данных медицинских обследований и выявить основные причины недостаточной информативности и устойчивости оценки риска развития клинических проявлений атеросклероза при применении линейного дискриминантного анализа по данным отечественной и зарубежной литературы.
Теоретически обосновать возможность применения и разработать математический аппарат нейросетевой оценки риска развития клинических проявлений атеросклероза.
Разработать алгоритм автоматизированного синтеза нейросетевой системы оценки риска.
Оценить эффективность нейросетевого метода оценки риска развития клинических проявлений атеросклероза на основе сравнительного анализа результатов многолетнего мониторинга состояния здоровья работников нефтеперерабатывающих производств.
Оценить распространенность заболеваний системы кровообращения в современных производствах нефтепереработки с учетом характера и условий труда работников.
Научная новизна исследования состоит в том, что представленный в работе подход к оценке риска развития клинических проявлений атеросклероза у работников нефтехимических производств не имеет опубликованных аналогов. Впервые ИНС рассматривается в качестве математического аппарата, воспроизводящего условную функцию частоты на основании альтернативных обучающих выборок. Установлено, что высокая чувствительность нейросетевого метода к изменению взаимосвязей показателей функциональных систем организма позволяет отследить систематический рост величины риска, спрогнозировать развитие патологии, принять своевременные профилактические и лечебные мероприятия; последующий анализ динамики риска позволяет также оценить эффективность принятых мер, и, при необходимости, скорректировать профилактику и лечение доклинического атеросклероза.
Теоретическая значимость исследования состоит в аналитическом обосновании алгоритма самоорганизации ИНС, обеспечивающего нейросетевую реализацию условной функции частоты заболеваемости на множестве значений показателей, которые могут иметь произвольную природу.
В работе показана универсальность предлагаемого подхода к обработке многомерных статистических данных. Эти свойства разработанного алгоритма позволяют использовать его для решения широкого круга медицинских и
биологических задач, в том числе для выявления производственных факторов, вызывающих раннее развитие атеросклероза, до начала фактического роста производственно-обусловленной сердечнососудистой заболеваемости.
Практическая значимость исследования заключается в разработке унифицированного комплекса программных и вычислительных средств, реализующих нейросетевой алгоритм оценки риска развития клинических проявлений атероск�