Патофизиология метаболического синдрома: новые возможности искусственного интеллекта
Аннотация
Актуальность. По сравнению с лабораторными методами проведения биохимических анализов крови алгоритмы искусственного интеллекта предлагают несколько ключевых преимуществ. Они сравнимы с традиционными методами по точности и эффективности, но значительно превосходят их по экономичности
Целью исследования является разработка интерпретируемой модели вычисления липидного профиля пациента с помощью машинного обучения на основе деперсонализированных данных о диспансеризации (возраст, пол, общий анализ крови (ОАК), общий холестерин, глюкоза крови).
Материалы и методы. Разработанный алгоритм представляет собой комплекс технологических решений, позволяющий рассчитывать взаимосвязь между различными биохимическими параметрами в организме человека с помощью передовых алгоритмов глубокого обучения, таких как градиентный бустинг на решающих деревьях и полносвязные нейронные сети. База данных включала в себя результаты лабораторных показателей 62 192 пациентов: холестерин (ХС), липопротеины высокой плотности (ЛПВП), триглицериды (ТГ), липопротеины низкой плотности (ЛПНП), ОАК, а также пол и возраст пациентов.
Результаты. Была проведена оценка качества моделей на тестовой выборке с использованием метрик, таких как коэффициент детерминации (R2), средняя абсолютная ошибка (MAE), средняя абсолютная ошибка в процентах (MAPE). R2 для корреляции между концентрацией ЛПНП и группы данных о диспансеризации составила 0,94 при MAE 0,20 и MAPE 0,06. Корреляция между ЛПВП и ТГ с данными о диспансеризации была значительно ниже (R2 составил 0,51 и 0,41 соответственно, MAE 0,20 и 0,53 соответственно, а MAPE 0,15 и 0,40 соответственно).
Заключение. Разработка алгоритма искусственного интеллекта, способного прогнозировать уровни ЛПНП, ЛПВП и триглицеридов на основе менее дорогостоящих лабораторных тестов, таких как уровень холестерина и глюкозы в крови, имеет огромный потенциал для повышения доступности здравоохранения. Хотя на сегодняшний день достигнута высокая точность (94%) только при прогнозировании ЛПНП, следующий важный шаг заключается в подборе способа обработки и расширении набора данных, используемого для обучения для более точного предсказания уровней ЛПВП и ТГ.