Автореферат диссертации по медицине на тему Алгоритмы распознавания этиологии отравлений химическими веществами
На правах рукописи
БУЛАНОВА Елена Владимировна
АЛГОРИТМЫ РАСПОЗНАВАНИЯ
ЭТИОЛОГИИ ОТРАВЛЕНИЙ ХИМИЧЕСКИМИ ВЕЩЕСТВАМИ
14.00.20— токсикология
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата биологических наук
Санкт-Петербург — 2005
Работа выполнена в лаборатории информационных технологий Федерального государственного унитарного предприятия «Научно-исследовательский институт гигиены, токсикологии и профпатологии» Федерального медико-биологического агентства.
Научный руководитель — доктор медицинских наук,
Филатов Борис Николаевич.
Официальные оппоненты: доктор медицинских наук, профессор
Ливанов Георгий Александрович;
доктор медицинских наук, старший научный сотрудник Федонюк Владимир Петрович.
Ведущая организация — Федеральное государственное унитарное предприятие «Научно-исследовательский институт гигиены, профпатологии и экологии человека» Федерального медико-биологического агентства.
Защита диссертации состоится ^»Д НоАуЛ 2005 г. в час. 00 мин. на заседании диссертационного совета Д 208.0^0.01 при Федеральном государственном учреждении науки «Институт токсикологии» Федерального медико-биологического агентства России по адресу: 193019, Санкт-Петербург, ул. Бехтерева, 1.
С диссертацией можно ознакомиться в библиотеке Института токсикологии.
Автореферат разослан £ ОК-ГХ^р^у 2005 г.
Ученый секретарь диссертационного совета доктор медицинских наук __/ Т.Н. Саватеева-Любимова
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы
По данным Международного форума Организации Объединенных Наций по химической безопасности, в мире ежегодно производится и используется не менее 40 тысяч наименований химических веществ, представляющих особую опасность для человека и биосферы в целом. Проблемы профилактики и ликвидации медицинских последствий «антропогенного химического стресса» обсуждались на специальных конференциях ООН по окружающей среде и развитию. На конференции в Рио-де-Жанейро (3—14 июня 1992 г.) был принят итоговый документ «Повестка дня на XXI век», в котором нашла отражение международная стратегия в области химической безопасности. В нашей стране общегосударственные меры по профилактике воздействия антропогенного химического стресса на население базируются на системе регламентирования содержания химических веществ в среде обитания.
К настоящему времени в России острые химические отравления выходят в число ведущих причин, определяющих смертность населения от неинфекционных заболеваний. Во многих случаях химическое вещество, вызвавшее отравление, остается нераспознанным. В результате острые отравления лекарственными препаратами, пестицидами и другими химическими веществами могут быть зарегистрированы в рамках нозологической формы, сходной по клиническим проявлениям заболевания.
Особую проблему составляет и возможность применения химических веществ в террористических актах с целью массового поражения людей и животных, а также массовые острые отравления городского населения в результате техногенных катастроф. Чрезвычайное разнообразие химических веществ и реакций организма человека при отравлении ими приводит к необходимости их кластеризации для целей дифференцирования и лечения.
Проблема идентификации и распознавания образов в течение продолжительного времени привлекает внимание специалистов в области математики и кибернетики. Существенный вклад в становление и развитие данного направления внесли Л. Льюинг, Р. Фишер, А.Н. Колмогоров, А.Я. Хинчин и др. Анализ отечественной и зарубежной литературы показал, что во многих диагностических системах алгоритм принятия оптимального статистического решения основывается на использовании полной формулы Байеса с учетом априорных вероятностей. Широко известны работы в этом направлении Л. Ластеда, Е.В. Гублера, N.H. Edwards, А. Sonnenberg, J.P. van de Merwe.
Проблема выявления этиологического фактора при неясных отравлениях привела к необходимости разработки универсальной системы диагностики применительно к различным классам химических веществ, что подчеркивает актуальность данных исследований.
Цель работы
Разработка эффективных математических алгоритмов распознавания этиологии острых отравлений химическими веществами.
Основные задачи исследования
1. Создание базы данных по случаям острых отравлений лекарственными препаратами, пестицидами и боевыми отравляющими веществами.
2. Кластеризация исследуемых химических веществ.
3. Математическое моделирование химических интоксикаций. Разработка и обоснование метода и алгоритма распознавания класса химического вещества, вызвавшего интоксикацию.
4. Разработка программного обеспечения распознавания этиологии острых отравлений лекарственными препаратами, пестицидами и боевыми отравляющими веществами.
5. Практическая реализация программного средства.
Методы исследования
Для решения поставленных задач были использованы методы системного анализа, теории вероятности, математической статистики и теории проектирования реляционных баз данных.
Исследования проводили на IBM-совместимых персональных компьютерах под управлением операционной системы Windows ХР в инструментальной среде разработки Borland Delphi 7.0.
Научная новизна
Разработан и обоснован эмпирический алгоритм распознавания.
Модификация алгоритма распознавания с учетом совместного присутствия симптомов и признаков болезни, т. е. зависимости симптомов и признаков, приводит к уменьшению вариабельности коэффициента распознавания. Изменение алгоритма с учетом кластеризации и комплекса зависимых симптомов и признаков позволило повысить коэффициент распознавания болезни до 0,92.
Практическая значимость
Результатом проведенных исследований является компьютерная система DEFIT для определения химического вещества, вызвавшего острое отравление.
Предлагаемые методические подходы позволяют повысить эффективность работы врачей токсикологических центров, приемных отделений больниц и центров санитарно-эпидемиологического надзора при расследовании острых отравлений лекарствами, пестицидами и другими химическими веществами, случаев заболеваний неясной этиологии, а также при проведении судебно-медицинского освидетельствования больных.
Реализация и внедрение результатов исследований
Предлагаемый метод внедрен в практику Волгоградского областного токсикологического центра, Волгоградского областного центра санитарно-эпидемиологического надзора и Краснодарского медико-экологического центра «Гемос».
На защиту выносятся следующие положения:
1. База данных по клиническим проявлениям острых интоксикаций химическими веществами должна формироваться на основе их кластеризации по химической структуре с учетом зависимости симптомов и признаков (сочетаемости по 3).
2. В основу распознавания класса, к которому принадлежит химический агент, вызвавший у человека острую интоксикацию, может быгь положен следующий алгоритм:
) N
где £>у — апостериорная вероятность появления у'-го заболевания у больного;
N — число симптомов, наблюдаемых у больного;
Рщ — априорная вероятность появления к-то сочетания симптомов
(признаков) приу'-м заболевании; } — изменяется от 1 до N1 (N1 — количество заболеваний в базе); к — изменяется от 1 до N2 (#2 — количество пар симптомов в базе);
1 — при наличии к-го сочетания симптомов у больного; О — при отсутствии к-го сочетания симптомов у больного.
Хк =
Апробация работы
Алгоритм и программа прошли экспертизу на новизну и зарегистрированы в Центре государственной регистрации программ для ЭВМ, баз данных и топологии интегральных схем (свидетельство о Государственной регистрации № 920042). Министерством здравоохранения РФ выдано свидетельство (№ 003 от 26.02.1999 г.) о пригодности использования предлагаемого программного продукта.
Основные положения и материалы диссертации докладывались на:
— Всесоюзной научной конференции «Проблемы мониторинга за здоровьем населения промышленных городов» (Ангарск, июнь 1989 г.);
— Всесоюзной научной конференции «Проблемы наркоманий, токси-команий и интоксикационных психических расстройств» (Ленинград, март 1990 г.);
— Всесоюзной научной конференции «Информатика в здравоохранении» (Москва, дек. 1990 г.);
— Всесоюзной научной конференции «Токсикологические проблемы химических катастроф» (Ленинград, май 1991 г.);
— Всероссийской научно-практической конференции «Экология и здоровье человека» (Самара, окт. 1994 г.);
— международных научно-технических конференциях «Информационные технологии в образовании, технике и медицине» (Волгоград, сент. 2000 г. и сент. 2002 г.);
— Международном симпозиуме по антитерроризму «Разработка и принятие решений по снижению последствий для здоровья населения при террористических актах с применением опасных веществ» (г. Волгоград, окт.
2002 г.);
— Международном симпозиуме «Медицинские и биологические проблемы, связанные с уничтожением химического оружия» (г. Волгоград, авг.
2003 г.);
— Втором Международном конгрессе по химическому, биологическому и радиационному терроризму (Дубровник, Хорватия, сент. 2003).
Публикации
По теме диссертации опубликовано 17 печатных работ, в числе которых 1 статья в центральном журнале «Гигиена и санитария», 2 тезиса в сборниках научно-практических конференций, 6 статей в сборниках научных конференций, 8 тезисов докладов на международных конференциях.
Структура и объем диссертации
Диссертационная работа состоит из введения, обзора литературы, главы с описанием материала и методов исследования, трех глав основных результатов исследования, заключения, списка литературы. Работа содержит 143 страницы наборного текста, 28 рисунков, 27 таблиц, 15 формул. Список литературы включает 130 работ, в том числе 43 — зарубежных авторов.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность работы, дана характеристика объекта и предмета исследования, сформулированы цель и задачи, изложена г научная новизна, определена практическая значимость работы.
В первой главе представлен анализ доступной литературы, который позволил заключить, что, несмотря на разнообразие точек зрения и подходов к решению проблемы компьютерной диагностики острых отравлений различными классами химических веществ, она остается еще малоизученной. Проведен обзор методов, использующихся при решении поставленной задачи. Рассмотрены вероятностные подходы к решению проблемы, дан анализ диагностических систем, в которых алгоритм принятия оптимального статистического решения основывается на использовании полной формулы Байеса с учетом априорных вероятностей (так называемый «байесовский подход»). Проведен анализ экспертных систем и систем управления базами данных, способных решить задачу идентификации. В заключительной части обозначены основные проблемы, позволившие сформулировать задачи диссертационной работы.
Материалы исследований приведены во второй главе. В целях разработки эффективных алгоритмов распознавания химических веществ, вызвавших отравление, создана база данных клинических описаний интоксикаций по результатам стационарного обследования больных в первые 1—2 суток после госпитализации. Для исследований были отобраны лишь случаи отравлений, подтвержденные результатами химических анализов. Эти медицинские документы взяты в качестве исходного объективного материала.
Базы данных формировались из симптомов и признаков интоксикаций фосфорорганическими ядохимикатами и медикаментами синтетического и природного происхождения, наркотическими средствами. Материалом для исследований служили истории болезни лиц, поступивших в Волгоградский областной токсикологический центр в период с 1980 г. по 2000 г. Всего в обработку взято 2883 истории болезней.
В третьей главе приведено описание методов исследований.
Кластеризация историй болезней проводилась с использованием методов многомерного анализа (кластерный, факторный, дискриминантный).
Во многих диагностических системах алгоритм принятия оптимального статистического решения основывается на использовании полной формулы Байеса с учетом априорных вероятностей. Однако довольно продолжительное практическое применение этого подхода показало ряд его существенных недостатков:
— обрабатываемые симптомы и признаки должны быть независимыми;
— учет взаимозависимости признаков по формуле Байеса снижает быстродействие и требует увеличения объема памяти ЭВМ, а также повышает требование к объему и репрезентативности исходных данных, что часто делает расчеты практически неосуществимыми.
Универсально-эффективные алгоритмы распознавания в связи со сложностью и индивидуальностью практически значимой задачи в настоящее время отсутствуют, поэтому большое значение приобретают эмпирические алгоритмы решения отдельных задач, учитывающие специфику и объединяющие в себе знания и навыки высококвалифицированных экспертов.
Разработана информационная структура системы, которая состоит из 2 основных блоков:
— подсистемы хранения данных (справочный блок);
— подсистемы диагностики.
Для выбора среды разработки были выделены и сформулированы критерии и альтернативы. По результатам сравнения на первый план выходит альтернатива Borland Delphi. Поэтому данный программный продует был выбран для разработки автоматизированной системы. Разработаны минимальные системные требования, предъявляемые к ЭВМ для работы программы.
Четвертая глава посвящена разработке структуры баз данных.
На 1-м этапе исследований рассматриваемые истории болезней за 1980—1990 годы соответствовали острым отравлениям 40 химическими веществами (лекарственные препараты и пестициды), которые были объединены в 10 классов по фармакологической структуре. База содержала информацию об интоксикациях по 111 симптомам и признакам. Симптомы были отнесены к 10 функциональным системам организма человека.
На 2-м этапе исследований для расширения и пополнения базы данных использовали тотальную выборку за 1990—2000 годы, были добавлены исто-
рии болезней как по новым химическим веществам, так и по уже имеющимся в базе данных. Рассматриваемые истории болезней соответствовали теперь острым отравлениям 58 химическими веществами (наркотические средства, лекарственные препараты и пестицвды), которые были объединены в 16 групп по химической структуре. Увеличилось число симптомов и признаков до 142, которые отнесены к 10 функциональным системам организма человека.
Для расчета коэффициента диагностической эффективности алгоритмов методом случайных чисел были созданы 2 контрольные базы, состоящие на 1-м этапе исследований из 130 историй болезни, на 2-м этапе —• из 300.
После формирования таблиц баз данных и ввода исходной информации из историй болезни выполнен расчет вероятности появления симптомов при острой интоксикации химическим веществом и классом веществ. Для проведения расчетов с учетом зависимости симптомов и признаков сформированы новые таблицы данных сочетаемости по 2 симптома и по 3 симптома.
В пятой главе проведены анализ данных, оценка эффективности распознавания химических веществ врачами-экспертами и с помощью алгоритма Байеса, обоснованы новые алгоритмы распознавания химических веществ, изучена эффективность распознавания классов химических веществ с учетом сочетаемости симптомов.
Анализ данных. Кластеризация случаев отравления
Ретроспективный анализ медицинской документации показал, что среди отравлений пестицидами в основном фигурируют фосфорорганические инсектициды (ФОИ), довольно широко используемые в быту. Прошедшее десятилетие характеризуется наиболее выраженным ростом количества острых отравлений этими веществами среди взрослых, прежде всего — с суицидной целью или в связи с приемом их внутрь для потенцирования действия алкоголя.
Несколько менее существен рост количества отравлений медикаментами, острые отравления которыми в основном связаны с суицидами. Среди отравлений медикаментами ведущее место занимают психотропные средства, антигистаминные и антихолинергические препараты.
Изучались половые, возрастные и дозовые зависимости.
Статистическую обработку проводили по методу х-квадрат. Достоверность выборочного коэффициента ассоциации (Я„), по величине критерия К. Пирсона, оценивали для уровня значимости, равного 95%, и числа степеней свободы К = 1.
В результате оценки клинических проявлений интоксикации веществами, отобранными для исследования, половые различия были установлены лишь по частоте атаксии при отравлениях элениумом (Дв=0,281), а также по гипертензии (Яя=0,205) и повышению СОЭ (Яв=0,201) при отравлениях димедролом. Однако наблюдаемые в этих случаях величины коэффициента ассоциации (Л„ < 0,4) указывают на слабую тесноту связи.
Проведенные исследования позволяют утверждать, что при острых отравлениях медикаментами и фосфорорганическими инсектицидами в изучавшейся выборке отсутствовали существенные половые различия в клинических проявлениях интоксикаций.
Для оценки возрастных различий лица, госпитализированные по поводу отравлений медикаментами и фосфорорганическими инсектицидами, были разделены на две группы: до 30 лет включительно и старше 30.
Установлено, что при подобных острых отравлениях в выборке отсутствовали существенные возрастные различия в клинических проявлениях интоксикаций.
Учитывая, что выборка в данном случае составлена из отравлений химическими веществами, принятыми преимущественно с суицидной целью, введенные в организм дозы медикаментов, как правило, многократно превышали максимально разовую (терапевтическую) дозу. Оценку дозовой зависимости относительно клинических признаков интоксикации проводили на больных, госпитализированных по поводу отравлений элениумом и димедролом.
Оценка различий клинических проявлений интоксикации веществами, отобранными для исследований, позволила выявить различия только по частоте регистрации глухих тонов сердца при интоксикации димедролом и дих-лофосом (Ла равен 0,348 и 0,475 соответственно). Однако, исходя из того, что это отличие наблюдается лишь по одному из представленных в выборке симптомов, выявленным случаем связи различий в возрастных группах по указанному признаку можно пренебречь. К тому же была констатирована лишь средняя степень тесноты связи.
Оценивали тесноту связи между качественными признаками интоксикаций последовательно всеми веществами, представленными в базе, относительно аминазина, димедрола, элениума, атропина, этаминала натрия и дих-лофоса, количество которых в базе было наиболее представительно. Полученные коэффициенты ассоциации позволяют сделать заключение, что клинические проявления интоксикации нейролептиками, транквилизаторами,
снотворными и антидепрессантами в основном не носят существенных различий. Лишь при интоксикации элениумом и этаминалом натрия наблюдаются единичные симптомы, отличающие их от интоксикации аминазином (кома, вялая реакция на свет и гипотензия — при отравлениях элениумом; миоз — при отравлениях этаминалом натрия). Учитывая, что указанные симптомы имели слабую связь, можно сделать вывод, что в токсических дозах нейролептики, транквилизаторы, антидепрессанты и снотворные по клиническим проявлениям интоксикации трудно поддаются кластеризации, в связи с чем их следует анализировать как единую группу.
Проведенные исследования позволили изучавшиеся случаи отравлений подразделить на четыре группы:
— нейротропные;
— антигистаминные;
— М-холинолитики;
— фосфорорганические инсектициды.
Сравнительная оценка эффективности распознавания химических
веществ врачами-экспертами и с помощью алгоритма Байеса
Для проверки эффективности компьютерного распознавания химических веществ по формуле Байеса были сформированы группы экспертов из числа научных работников (токсикологов и профпатологов) Научно-исследовательского института гигиены, токсикологии и профпатологйи и врачей Волгоградского областного токсикологического центра. Всего в состав экспертных групп входило 24 специалиста, занимающихся вопросами клинической токсикологии, в том числе 2 доктора и 8 кандидатов медицинских наук.
Работа экспертов проводилась в двух направлениях:
— оценка эффективности распознавания химических веществ на примере описаний симптоматики 30 случаев острых отравлений, отобранных по принципу случайной выборки;
— психологическая оценка восприятия степени «опасности» и «объективности» симптомов и признаков.
Использование формулы Байеса для распознавания химических веществ в тех же 30 случаях отравлений выявило некоторые преимущества метода компьютерной диагностики (табл. 1). Диагностика улучшилась по всем группам веществ, но, что особенно важно, существенно улучшилось распознавание нейролептиков, плохо диагностированных врачами.
Эффективность распознавания химических веществ, вызвавших интоксикацию
Класс веществ Коэффициент распознавания
Врачи-эксперты Формула Байеса
Нейротропные средства 0,29 0,52
Антигистаминные средства 0,49 0,52
М-холинолитики 0,75 0,80
Фосфорорганические инсектициды 0,66 0,75
Общая выборка 0,55 0,65
Обоснование новых алгоритмов распознавания химических веществ
По существу задача диагностики состоит в том, чтобы установить диагноз, используя тот минимум доступной диагностической информации, который достаточен для достижения необходимой надежности диагноза. Это обычно требует использования не одного симптома, а набора симптомов — симптомокомплекса.
Такой подход может быть назван «многомерным подходом к установлению диагноза», т. к. при нем одновременно используют несколько признаков.
В начале работы, исходя из логических посылок, предложен был диагностический алгоритм (1), представленный в следующей форме:
J , V I у '
где О,-
I
ЛГ
)
— достоверностьу-й болезни у /-го больного;
— относительная частота появления /-го симптома (признака) при у'-м заболевании;
— изменяется от 1 до Ы;
— количество симптомов в базе;
— изменяется от 1 до N1;
— количество заболеваний в базе; 1 — при наличии ¡-го симптома у .¡-го больного; О — при отсутствии ¡-го симптома у .¡-го больного.
Коэффициент распознавания при расчетах по эмпирическому алгоритму составил 0,6308, а по формуле Байеса — 0,7154. По данным литературы, коэффициент распознавания равен 0,85.
В дальнейшем эмпирический алгоритм был модернизирован и приобрел вид, показанный в формуле 2.
' (X.
)И
£) = *-- (2)
1 N
где — апостериорная вероятность появления у'-го заболевания у больного;
Рщ — априорная вероятность появления к-го сочетания симптомов
(признаков) при /-м заболевании; N — число симптомов, наблюдаемых у больного; у — изменяется от 1 до Л^ (ЛГ,—количество заболеваний в базе); к — изменяется от 1 до Ы2 (N2 — количество пар симптомов в базе); т — эмпирический показатель степени;
Хк =
1 — при наличии к-го сочетания симптомов у больного; 0 — при отсутствии к-го сочетания симптомов у больного.
Результаты оценки значения т (см. табл. 2 и 3) позволили сделать заключение о возрастании коэффициента распознавания со снижением величины т благодаря повышению частоты истинно-положительных и снижению ложно-положительных ответов.
Изучение эффективности распознавания классов химических веществ с учетом сочетаемости симптомов
Недостаточность распознающей способности использовавшихся алгоритмов привела к мысли о модификации алгоритма с учетом возможности совместного присутствия симптомов и признаков болезни.
В работах многих ученых предпринимались попытки определения вероятности болезни по комплексу зависимых симптомов. С этой целью используется ряд модификаций формулы Байеса и вытекающих из нее алгоритмов, учитывающих зависимость симптомов. В частности, Н.М. Амосов и Е.В. Шкабара предлагают формулу
р
(3)
где
(х . /
IА
Х\ ,Х2
,Х
Различные химические вещества, поступившие в организм человека, приводят к развитию патологических процессов, обладающих определенными совокупностями специфических свойств (синдромов, симптомов и признаков). В силу внутренней определенности интоксикация веществами одного класса отличается от интоксикации веществами другого класса. Поэтому формализованное отражение патологических процессов при компьютерной технологии распознавания вещества, вызвавшего интоксикацию, вполне закономерно должно быть представлено не только с учетом встречающихся симптомов и признаков, но и их сочетаний. Так, интоксикация фосфорорга-ническими веществами в процессе врачебной диагностики ассоциируется прежде всего не столько с разрозненными, хотя и весьма характерными симптомами (миоз, саливация, миофибрилляция, брадикардия и др.), сколько с наличием у больного сочетаний этих симптомов, что существенно повышает информативность. С изменением эмпирического алгоритма с учетом сочетаемости симптомов и признаков по 2 (табл. 4 и 5) повысилась и эффективность коэффициента распознавания болезней. Так, при т=1/4 коэффициент распознавания равен 0,75, в том числе отравления фосфорорганическими инсектицидами определяются с коэффициентом 0,85. Существенно улучшилось и распознавание изучавшихся групп лекарственных веществ. Сравнение с расчетами по формуле Байеса показало преимущество предлагаемого эмпирического алгоритма.
Коэффициент распознавания по формуле Байеса в среднем составил 0,20, в том числе по фосфорорганическим инсектицидам — 0,29. Все это дало основание модернизировать эмпирический алгоритм с учетом возможности совместного присутствия симптомов и признаков при отравлениях определенными химическими веществами.
Эффективность распознавания класса химических веществ при условии независимости симптомов,
вызвавших интоксикацию при m = 1,1/2,1/4 н 1/8
№ п/л Название класса Контроль ш=1 т=1/2 т=1/4 т=1/8
к % к % к % к %
1 Нейротропные средства 40 0,7231 58 0,7385 63 0,7385 63 0,6923 60
2 Антигистаминные средства 40 0,5538 35 0,5692 38 0,6000 45 0,6000 45
3 Холинергические средства 10 0,5692 60 0,6000 70 0,6615 80 0,6923 90
4 ФОС 40 0,6769 98 0,7385 98 0,7692 98 0,7846 98
130 2,52308 250 2,64615 268 2,76923 285 2,76923 293
Среднее к 0,6308 63 0,6615 67 0,6923 71 0,6923 73
ТаблицаЗ
Эффективность распознавания класса химических веществ при условии независимости симптомов, вызвавших интоксикацию при го = 1/20,1/50,1/100 и по формуле Байеса
№ п/п Название класса Контроль ш=1/20 т=1/50 т=1/100 Формула Байеса
к % к % к % к %
1 Нейротропные средства 40 0,6769 58 0,6769 58 0,6769 58 0,6154 85
2 Антигистаминные средства 40 0,5692 43 0,5692 43 0,5692 43 0,6615 68
3 Холинергические средства 10 0,7077 90 0,7077 90 0,7077 90 0,8154 0
4 ФОС 40 0,7538 98 0,7538 98 0,7538 98 0,7692 80
130 2,70769 288 2,70769 288 2,70769 288 2,86154 233
Среднее к 0,6769 72 0,6769 72 0,6769 72 0,7154 58
Распознавание химических веществ, классифицированных по химической структуре, с учетом сочетаемости симптомов интоксикации
В связи с тем, что коэффициент распознавания в среднем по классам химических веществ оказался ниже максимально достижимого значения, принятого в мировой практике, была пересмотрена классификация изучавшихся веществ не по механизму действия, а по химической структуре.
Проведение кластеризации историй болезней с помощью методов многомерного анализа (кластерный, факторный, дискриминантный) показало, что ошибка в классификации историй болезней составила 1% за счет тяжелых форм отравления с летальным исходом. В результате анализа истории болезней разделились на 13 химических групп.
Приведенные расчеты по новой классификации с учетом зависимости симптомов и признаков подтвердили правильность принятого решения. Значение коэффициента распознавания для случая независимости симптомов и признаков выросло с 0,69 до 0,78, а для случая сочетаемости симптомов по 2 —с 0,75 до 0,88.
С увеличением коэффициента распознавания значительно увеличилось число истинно положительных и снизилось число ложноположительных ответов.
В дальнейших исследованиях случай независимости симптомов больше не рассматривался. Были внесены изменения и в базу данных. Из-за низкой репрезентативности из обработки был исключен класс 13-й — Софора толстоплодная, а класс 12-й — Производные тиофосфоновой кислоты — объединен, с 11-м классом — Производные фосфоновой кислоты. Был произведен перерасчет частоты встречаемости симптомов и признаков с учетом сочетаемости по 3 для каждого класса химических веществ.
Как и предполагалось, коэффициент распознавания увеличился при ш=1/4 с 0,88 до 0,91 с вероятностью появления истинно положительных ответов с 56 до 63%. При т» 1/100 коэффициент распознавания равен 0,94 с вероятностью появления истинно положительных ответов 68%.
Для определения более точного значения эмпирического показателя степени ш были проведены дополнительные исследования (см. рис. 1, табл. 6).
Эффективность распознавания класса химических веществ при условии зависимости симптомов (сочетаемости по 2), вызвавших интоксикацию при т = 1,1/2,1/4 н 1/8
№ п/п Название класса Контроль ш=1 т=1/2 ш=1/4 т=1/8
к % к % к % к %
1 Нейротропные средства 40 0,7231 58 0,7385 65 0,7231 68 0,6462 68
2 Антигистаминные средства 40 0,5538 35 0,6154 45 0,6769 60 0,6462 55
3 Холинергические средства 10 0,5846 70 0,6615 70 0,7692 60 0,8154 60
4 ФОС 40 0,6923 98 0,7538 98 0,8154 100 0,7846 98
130 2,55385 260 2,76923 278 2,98462 288 2,89231 280
Среднее к 0,6385 65 0,6923 69 0,7462 72 0,7231 70
Таблица 5 Эффективность распознавания класса химических веществ при условии зависимости симптомов (сочетаемости по 2), вызвавших интоксикацию при ш = 1/20,1/50,1/100 н по формуле Байеса
№ п/п Название класса Контроль т=1/20 т=1/50 т=1/100 Формула Байеса
к % к % к % к %
1 Нейротропные средства 40 0,6462 70 0,6154 75 0,5538 75 0,5231 25
2 Антигистаминные средства 40 0,6615 60 0,6462 55 0,5846 45 0,4308 13
3 Холинергические средства 10 0,8308 50 0,8462 50 0,8462 50 -0,4462 90
4 ФОС 40 0,8154 98 0,8462 98 0,8462 98 0,2923 5
130 2,95385 278 2,95385 278 2,83077 268 0,8 133
Среднее к 0,7385 69 0,7385 69 0,7077 67 0,2000 33
0,9600
я 0,9400 х
1 0,9200 1 0,9000 l
а 0,8800
I 0,8600
А 0,8400 | 0,8200 0,8000
1/2 1/3 1/4 1/5 1/6 1/7 1/8 1/9 1/10 1/21 1/22 1/23 1/24 1/25 1/50 1/100
Значение коэффициента m
--г
/ /
у ■ / /
f
Рис. 1. Значение вариации критерия т для распознавания острых отравлений
Полученные результаты позволяют констатировать появления оптимума для показателя степени ш=1/25.
В дальнейшем с целью повышения эффективности распознавания химических веществ исследования проводились в следующих направлениях: -— добавление новых классов;
— проведение кластеризации и аппроксимации коэффициента т. <
Проанализировав истории болезней за период с 1991-го по 2000 г., было установлено, что в Волгоградский токсикологический центр чаще стали , обращаться по поводу отравления наркотическими средствами (суррогатами и производными опия, суррогатами конопли). Увеличились также случаи отравления лекарственными препаратами с суицидной целью.
Результаты, приведенные в табл. б, обрабатывали с помощью регрессионного анализа. Полученная нелинейная модель уравнения регрессии имеет вид
Y = axh+c, (4)
где a.b. с — коэффициенты уравнения регрессии.
Эффективность распознавания класса химических веществ при условии зависимости симптомов (сочетаемости по 3), вызвавших интоксикацию при m = 1/21,1/22,1/23,1/24,1/25 и 150
№ п/п Название класса Контроль ш=1/21 т=1/22 ш=1/23 т=1/24 т=1/25 т=1/50
1 Производные фенотиазина 9 0,9320 0,9320 0,9320 0,9355 0,9370 0,9370
2 Производные бензодиазепина 18 0,8740 0,8740 0,8740 0,8740 0,8740 0,8740
3 Производные бутерофенона 3 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
4 Производные дибензазепина и дибензгексана 4 0,9843 0,9843 0,9843 0,9843 0,9843 0,9843
5 Производные барбитуровой кислоты б 0,9500 0,9500 0,9500 0,9525 0,9528 0,9528
6 Производные дибензиндола 0 0,9843 0,9843 0,9843 0,9843 0,9843 0,9843
7 Производные пропандиола 2 0,9213 0,9213 0,9213 0,9213 0,9213 0,9213
8 Производные троповой кислоты 7 0,9300 0,9300 0,9300 0,9300 0,9370 0,9370
9 Оксазиновые производные 0 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
10 Эфиры бензогидрола 38 0,9200 0,9200 0,9200 0,9213 0,9213 0,9213
11 Производные фосфоновой кислоты 40 0,8583 0,8583 0,8583 0,8583 0,8583 0,8583
127 10,3542 10,3542 10,3542 10,3615 10,3703 10,3703
Среднее к 0,9413 0,9413 0,9413 0,9420 0,9428 0,9428
Аппроксимация прогрессии в область теоретического оптимума т по коэффициенту распознавания, проведенная на основе данных, полученных при т = 1/100; 1/10; 1/9; 1/8; 1/7; 1/6; 1/5; 1/4 1/3; 1/2; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 100, позволила констатировать оптимум т = 1/33. Однако экспериментальная проверка в тех же условиях показала, что при т < 1/33 коэффициент распознавания веществ существенно не изменяется. Вероятность распознавания веществ составляет около 0,92. Отсутствие возможности достижения 100%-ного распознавания закономерно и, вероятно, объясняется суммарной ошибкой, связанной с учетом случайных симптомов (отчасти по этой причине в медицинских исследованиях допускается ошибка в пределах 5%).
В результате новых исследований алгоритм приобрел вид
"'•^—х-• <5)
где Dj — апостериорная вероятность появления ./-го заболевания у больного;
N — число симптомов, наблюдаемых у больного;
Рк] — априорная вероятность появления к-го сочетания симптомов (признаков) при _/-м заболевании;
} — изменяется от 1 до N1 (Л^ — количество заболеваний в базе);
к —- изменяется от 1 до N2 (N2 — количество пар симптомов в базе);
_ I 1 — при наличии к-го сочетания симптомов у больного;
* ] 0 — при отсутствии к-го сочетания симптомов у больного.
Отсутствие существенных различий в величине коэффициента распознавания изучавшихся классов и открытость системы позволяют рекомендовать принципы кластеризации интоксикаций химическими веществами и предлагаемый алгоритм для практического использования в качестве способа предварительной идентификации класса химического вещества, вызвавшего интоксикацию. Результаты исследований представлены в табл. 7.
Таким образом, на основе историй болезни в связи с острыми отравлениями химическими веществами разработан алгоритм распознавания групп химических веществ, имеющий достаточно высокую эффективность и универсальность, что позволяет рекомендовать его для использования в медицинской практике.
Эффективность распознавания принадлежности к соответствующей химической группе вещества, вызвавшего интоксикацию (т = ]/,- )
№ п/п Название химической группы Коэффициент распознавания
1 Суррогаты и производные опия 0,84
2 Суррогаты конопли 0,93
3 Производные барбитуровой кислоты 0,85
4 Производные троповой кислоты 0,93
5 Аналоги эфедрина 0,99
6 Производные фенотиазина 0,88
7 Производные бензодиазепина 0,74
8 Производные бутерофенона 0,99
9 Производные дибензазепина и дибензгексана 0,91
10 Производные дибензиндола 0,97
И Производные пропандиола 0,97
12 Эфиры бензогидрола 0,87
13 Производные фосфоновой кислоты 0,83
14 Софора толстоплодная 1,00
15 Синтетические пиретроиды 1,00
16 Дихлорфениламинн 0,96
Среднее т 0,92
Шестая глава посвящена разработке программного продукта.
Для практической реализации разработанного алгоритма на первых этапах работы была создана компьютерная система DEFITOX, которая функционировала под управлением операционной системы MS DOS 5.0 и выше и была написана на языке Clipper версия 5.01.
С быстрым ростом модификации и усовершенствования как вычислительной техники, так и программного обеспечения компьютерная система DEFITOX претерпела кардинальные изменения. Необходимо было разработать систему, у которой база данных могла пополняться, изменяться и корректироваться пользователем. В результате разработана система DEFIT v.2.0 в комплекте с редактором базы данных «Database Editor for DEFIT».
Система определения химической группы, вызвавшей отравление DEFIT, содержит:
— собственно систему определения химической группы — DEFIT;
—редактор базы данных системы — «Database Editor for DEFIT 2.0».
Программа «Database Editor for DEFIT 2.0» может использоваться для создания и/или редактирования БД системы DEFIT с учётом особенностей конкретного региона.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
Основные научные и прикладные результаты диссертационной работы заключаются в следующем:
1. Разработана структура системы и основные алгоритмы функционирования системы.
2. Разработана структура баз данных.
После формирования таблиц баз данных и ввода исходной информации из историй болезни произведен расчет вероятности появления симптома при острой интоксикации при условии независимости симптомов применительно к конкретным химическим веществам и соответствующим химическим группам. Для проведения расчетов с учетом зависимости симптомов и признаков сформированы новые таблицы данных сочетаемости по 2 и 3 симптома. Сформирована контрольная база данных для расчета коэффициента диагностической эффективности алгоритмов.
3. Разработан алгоритм распознавания химических групп, имеющий достаточно высокую эффективность и универсальность, что позволило рекомендовать его для использования в медицинской практике.
4. Проведена экспертиза алгоритма и программы на новизну. Программа зарегистрирована в Центре государственной регистрации программ для ЭВМ, баз данных и топологии интегральных схем (свидетельство о государственной регистрации № 920042). Министерством здравоохранения РФ выдано свидетельство № 003 от 26.022.1999 г. о пригодности использования предлагаемого программного продукта.
5. Разработана компьютерная система распознавания указанных классов химических веществ, названная DEFITOX (Definition of Toxic), которая внедрена в практику Краснодарского краевого центра санитарно-эпидемиологического надзора, Краснодарского медико-экологического центра «Гемос», Волгоградского областного токсикологического центра и МСЧ-40 (г. Волгоград).
6. Разработана компьютерная система DEFIT.
7. Созданный алгоритм использовался для разработки компьютерной программы ЭеРЬов 2.0 — дифференциальной диагностики острых отравлений фосфорорганическими веществами.
ОПУБЛИКОВАННЫЕ РАБОТЫ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Буланова, Е.В. Автоматизированный способ выявления интоксикаций пестицидами на примере ФОВ / Б.Н. Филатов, Е.В. Буланова, Г.А. Хар-дина // Проблемы мониторинга за здоровьем населения промышленных городов: тез. докл. Всесоюз. науч. конф. Ангарск, 21—22 июня 1989 г. — Ангарск, 1989. — Ч. 1. — С. 188.
2. Буланова, Е.В. Автоматизированный анализ клинических проявлений болезни с целью выявления причин массовых заболеваний химической этиологии / Б.Н. Филатов, Е.В. Буланова // Проблемы мониторинга за здоровьем населения промышленных городов: тез. докл. Всесоюз. науч. конф. Ангарск, 21—22 июня 1989 г. — Ангарск, 1989. — Ч. 2/3. — С. 125.
3. Буланова, Е.В. Компьютерное распознавание ксенобиотика при суициде / Б.Н. Филатов, Е.В. Буланова [и др.] // Проблемы наркоманий, токси-команий и интоксикационных психических расстройств: тез. докл. Всесоюз. науч. конф., Ленинград, 27—28 марта 1990 г. — Л., 1990. — С. 38—39.
4. Буланова, Е.В. Компьютерный анализ возможных причин массовых заболеваний неясной этиологии / Б.Н. Филатов, Е.В. Буланова // Информатика в здравоохранении: материалы Всесоюз. науч. конф. Москва, 11—12 дек.
» 1990г.—М., 1990.—Ч. 2.—С. 89.
5. Буланова, Е.В. Компьютерное дифференцирование острых экзогенных интоксикаций / Б.Н. Филатов, Е.В. Буланова, Г.А. Хардина // Информатика в здравоохранении: материалы Всесоюз. науч. конф. Москва, 11—12 дек. 1990 г.—М., 1990. —Ч. 2. —С. 89—90.
6. Буланова, Е.В. Система управления базой данных ФОН, предназначенная для выявления причин массовых заболеваний / Б.Н. Филатов, Е.В. Буланова // Гигиена и санитария. —1990. — № 6. — С. 45—46.
7. Буланова, Е.В. Компьютерное распознавание поражающих агентов в очагах массовых заболеваний неясной этиологии / Б.Н. Филатов, Е.В. Буланова // Токсикологические проблемы химических катастроф: тез. докл. на Всесоюз. науч. конф. Ленинград, 15—16 мая 1991 г. — Л., 1991. — С. 21.
8. Буланова, E.B. Разработка системы выявления и медико-экологической экспертизы очагов массовых заболеваний химической этиологии / Б.Н. Филатов, Е.В. Буланова, Р.Н. Киселев // Экология и здоровье человека: тез. докл. Всерос. науч.-практ. конф. Самара, 10—14 окт. 1994 г. — Самара, 1994. —С. 187—188.
9. Boulanova, Е. KAIF a neurotopic poison recognition system in acute exposure cases / B.N. Filatov, E. Boulanova [et al.] // J. Toxicology Letters. Abstracts of the XXXVII European Congress of Toxicology — EUROTOX'99, June 27—30. — Oslo, 1999. — P. 93.
10. Буланова, E.B. Программа распознавания химических веществ при острых отравлениях / Б.Н. Филатов, Е.В. Буланова, Джефрей И. Даниелс // Информационные технологии в образовании, технике и медицине: сб. науч. тр. Междунар. науч.-техн. конф. г. Волгоград, сент. 2000 г. — Волгоград, 2000. — Ч. 2. — С. 232—235.
11. Буланова, Е.В. DEFIT — программа распознавания химических веществ при острых отравлениях / Б.Н. Филатов, Е.В. Буланова, C.B. Кубраков // Информационные технологии в образовании, технике и медицине: сб. науч. тр. Междунар. науч.-техн. конф. г. Волгоград, сент. 2000 г. — Волгоград, 2000. — Ч. 2. — С. 243—246.
12. Буланова, Е.В. Система распознавания химических веществ и растительных ядов, вызвавших отравление / Е.В. Буланова, C.B. Кубраков, Д.П. Панченко // Разработка и принятие решений по снижению последствий для здоровья населения при террористических актах с применением опасных веществ: материалы Междунар. симп. по антитерроризму, г. Волгоград 8—9 окт. 2002 г. — Волгоград, 2002. — С. 67.
13. Буланова, E.B. DePhos — программа дифференцирования поражений фосфорорганическими боевыми OB и инсектицидами / Е.В. Буланова, Б.Н. Филатов // Разработка и принятие решений по снижению последствий для здоровья населения при террористических актах с применением опасных веществ: материалы Междунар. симп. по антитерроризму, г. Волгоград 8—9 окт. 2002 г. — Волгоград, 2002. — С. 68.
14. Буланова, Е.В. Автоматизация дифференциальной диагностики фосфорорганических отравляющих веществ и фосфорорганических соединений / Б.Н. Филатов, Е.В. Буланова [и др.] // Медицинские и биологические проблемы, связанные с уничтожением химического оружия: тез. докл. Междунар. симп. г. Волгоград, 26—28 авг. 2003 г. — Волгоград, 2003. — С. 194—195.
15. Boulanova, E. Demonstration of software on differential syndrome diagnostics of acute exposure to hazardous chemicals / E. Boulanova // Second World Congress on Chemical, Biological and Radiological Terrorism. Dubrovnik, Croatia, 06-12 September 2003. — Dubrovnik, Croatia, 2003. — P. 41.
16. Boulanova, E. Information technologies as a tool in response to chemical emergencies — minimizing effect of terrorist use of hazardous chemicals / B.N. Filatov, E. Boulanova, J.I. Daniels // Second World Congress on Chemical, Biological and Radiological Terrorism. Dubrovnik, Croatia, 06-12 September
2003. — Dubrovnik, Croatia, 2003. — P. 142.
17. Буланова, E.B. Автоматизированная система диагностики DEPHOS 2 / Д.П. Панченко, Е.В. Буланова // Научно-технические аспекты обеспечения безопасности при уничтожении, хранении и транспортировке химического оружия: тез. докл. 2-й науч.-практ. конф. Москва 6—8 окт. 2004 г. — М.,
2004. —С. 180—181.
БУЛАНОВА Елена Владимировна
АЛГОРИТМЫ РАСПОЗНАВАНИЯ
ЭТИОЛОГИИ ОТРАВЛЕНИЙ ХИМИЧЕСКИМИ ВЕЩЕСТВАМИ
Автореферат
Подписано к печати 15.09.2005 г. Формат 60x84/16. Печать офс. Бум. офс. Усл. печ. л. 0,9. Уч.-изд. л. 1,0. Тираж 100 экз. За
ВГПУ. Издательство «Перемена» Типография издательства «Перемена» 400131, Волгоград, пр. им. В. И. Ленина, 27
8317
РНБ Русский фонд
2006:4 18448