Preview

Проблемы геронауки

Расширенный поиск

Использование моделей машинного обучения для поиска новых лабораторных маркеров возраст-ассоциированных заболеваний

https://doi.org/10.37586/2949-4745-4-2024-208-213

Аннотация

ВВЕДЕНИЕ. Глобальное старение населения ведет к росту возраст-ассоциированных заболеваний, таких как артериальная гипертензия. Существующие диагностические методы ограничены недостаточной чувствительностью клинико-лабораторных маркеров и ограничениями традиционных статистических методов, что подчеркивает необходимость новых подходов к анализу медицинских данных. Цель исследования — выявить новые лабораторные маркеры артериальной гипертензии с помощью моделей машинного обучения и сравнить их эффективность с традиционными методами. Проанализированы клинико-лабораторные данные 2228 пациентов старше 65 лет, обратившихся за медицинской помощью в клинику МНОИ МГУ. Были использованы логистическая регрессия с регуляризацией, случайный лес и градиентный бустинг. Эффективность оценивалась по AUC ROC, а вклад признаков — через SHAP-анализ. Модели машинного обучения превзошли традиционную логистическую регрессию. Градиентный бустинг достиг AUC ROC 0,85 против 0,78 у регрессионных методов. Ключевыми признаками АГ оказались возраст, показатель RDW-SD и уровень креатинина, тогда как традиционные методы фокусировались преимущественно на возрасте. Выводы подтверждают высокий потенциал методов машинного обучения в диагностике возраст-ассоциированных заболеваний. Модели обеспечивают более высокую точность и выявляют сложные взаимосвязи между показателями, что может улучшить раннюю диагностику и оптимизировать диагностические алгоритмы. Старение населения является глобальной демографической тенденцией, приводящей к росту и распространенности возраст-ассоциированных заболеваний [1]. Ранняя и точная диагностика данных заболеваний приобретает особую актуальность для эффективного лечения и снижения рисков осложнений у пожилых пациентов. Однако современные диагностические алгоритмы часто ограничены недостаточной чувствительностью и специ­ фичностью клинико-лабораторных маркеров, а стандартные методы анализа данных могут не всегда выявлять скрытые или нелинейные зависимости, существенные для диагностики и оценки прогноза [2]. В связи с этим возникает необходимость в разработке новых подходов к интерпретации медицинских данных и выявлению более точных диагностических критериев. Развитие методов машинного обучения (МО) и искусственного интеллекта открывает новые возможности для анализа больших и сложных массивов медицинской информации. Эти методы способны обнаруживать сложные и нелинейные взаимосвязи между различными параметрами, что может значительно расширить понимание патогенеза, повысить точность диагностики и эффективность лечения возраст-ассоциированных заболеваний в условиях глобального старения населения [3, 4].

ЦЕЛЬ ИССЛЕДОВАНИЯ. Поиск новых лабораторных маркеров, ассоциированных с артериальной гипертонией (АГ) с использованием моделей МО, а также оценка их эффективности в сравнении с традиционными статистическими методами.

МАТЕРИАЛЫ И МЕТОДЫ. В исследовании проведен ретроспективный анализ базы данных, включающей клинико-лабораторные показатели 2228 пациентов в возрасте старше 65 лет, прикрепленных к МНОИ МГУ им. М.В. Ломоносова и обращавшихся за медицинской помощью или обследованных в рамках профилактических осмотров в период с 2020 по 2021 год. Предварительная обработка данных включала удаление пропусков, обработку выбросов и нормализацию признаков. В представленном пилотном исследовании для отработки инструментов анализа в качестве целевой переменной рассматривался диагноз АГ. Использовалась бинарная логистическая регрессия, как стандартный и общепринятый метод поиска маркеров заболеваний, и модели МО, которые включали логистическую регрессию с регуляризацией, модель случайного леса и градиентный бустинг. Производительность методов оценивали с помощью AUC ROC. Вклад каждого признака интерпретировали путем SHAP-анализа.

РЕЗУЛЬТАТЫ. Модели МО показали превосходство по сравнению с традиционной логистической регрессией. Градиентный бустинг достиг AUC ROC 0,85, в то время как логистическая регрессия продемонстрировала AUC ROC 0,78 (рис. 1). Важнейшими признаками, ассоциированными с наличием АГ, стали возраст, показатель ширины распределения эритроцитов (RDW-SD) и уровень креатинина, в то время как стандартный регрессионный анализ опирался преимущественно на возраст (рисунки 2, 3). Возраст и уровень креатинина ожидаемо стали значимыми факторами, в то время как показатель RDW-SD, который обычно оценивается при анемиях и ассоциируется с состоянием эритропоэза, был также определен значимым маркером АГ. Полученные данные могут свидетельствовать о более широкой связи воспалительных процессов и состоянии эритропоэза с развитием АГ.

ВЫВОДЫ. Результаты исследования демонстрируют высокий потенциал применения моделей МО в медицинской диагностике для поиска новых лабораторных маркеров возраст-ассоциированных заболеваний. Методы МО не только обеспечивают более высокую точность предсказаний, но и позволяют выявлять сложные, ранее неизвестные взаимосвязи между клинико-лабораторными показателями и развитием и прогрессированием заболеваний. В отличие от традиционных статистических методов они учитывают нелинейные и многомерные взаимодействия между признаками. Полученные результаты могут служить основой для проведения дальнейших клинических исследований, направленных на подтверждение выявленных ассоциаций и разработку новых мишеней для вмешательств, а в перспективе — на изменение диагностических и терапевтических подходов. Применение моделей в клинической практике может способствовать улучшению процедуры ранней диагностики возраст-ассоциированных заболеваний, снижению заболеваемости и смертности, а также улучшению качества жизни пациентов.

Об авторах

С. А. Захарчук
Факультет фундаментальной медицины МГУ им. М.В. Ломоносова
Россия

Захарчук Софья Александровна

Москва



Н. А. Миронов
Факультет фундаментальной медицины МГУ им. М.В. Ломоносова
Россия

Москва



А. Г. Плисюк
Факультет фундаментальной медицины МГУ им. М.В. Ломоносова
Россия

Москва



Я. А. Орлова
Факультет фундаментальной медицины МГУ им. М.В. Ломоносова
Россия

Москва



Список литературы

1. World Health Organization. Global Report on Ageism. Geneva: WHO; 2021.

2. Farrag M.A., Al-Harthi R., Saeed M., et al. Machine Learning Applications in Geriatrics: A Systematic Review. Journal of the American Medical Directors Association. 2021;22(8):1621–1627.e1.

3. Wang F., Preininger A. AI in Health: State-of-the-Art, Challenges, and Future Directions. Yearbook of Medical Informatics. 2020;29(1):16–26.

4. Mesko B., Gorog M. A Short Guide for Medical Professionals in the Era of Artificial Intelligence. NPJ Digital Medicine. 2020;3:126.


Рецензия

Для цитирования:


Захарчук С.А., Миронов Н.А., Плисюк А.Г., Орлова Я.А. Использование моделей машинного обучения для поиска новых лабораторных маркеров возраст-ассоциированных заболеваний. Проблемы геронауки. 2024;(4):208-213. https://doi.org/10.37586/2949-4745-4-2024-208-213

For citation:


Zakharchuk S.A., Mironov N.A., Plisyuk A.G., Orlova Ya.A. Using machine learning models to discover new laboratory markers of age-related diseases. Problems of Geroscience. 2024;(4):208-213. (In Russ.) https://doi.org/10.37586/2949-4745-4-2024-208-213

Просмотров: 181


ISSN 2949-4745 (Print)
ISSN 2949-4753 (Online)