Применение машинного обучения для диагностики некоторых социально значимых заболеваний по выдыхаемому человеком воздуху методом инфракрасной лазерной спектроскопии
Министерство науки и высшего образования Российской Федерации, Программы стратегического академического лидерства «Приоритет-2030»
Голяк Иг.С.
1, Бережанский П.В.
2, Седова А.Ю.
2, Гутырчик Т.А.
2, Небритова О.А.
1, Морозов А.Н.
1, Анфимов Д.Р.
1, Винтайкин И.Б.
1, Коноплева А.А.
1, Дёмкин П.П.
1, Фуфурин И.Л.
11Московский государственный технический университет им. Н.Э. Баумана, Москва, Россия
2ГБУЗ Морозовская детская городская клиническая больница ДЗМ, Москва, Россия
Email: igorgolyak@yandex.ru, p.berezhanskiy@mail.ru, khiger.a@mail.ru, tanya_2904@list.ru, o.nebritova@outlook.com, amor59@mail.ru, diman_anfimov@mail.ru, vintaikin_ivan@mail.ru, konoplevaaaliiina@gmail.com, demkin.pavel1996@yandex.ru, igfil@mail.ru
Поступила в редакцию: 1 декабря 2022 г.
В окончательной редакции: 25 января 2023 г.
Принята к печати: 30 января 2023 г.
Выставление онлайн: 19 июля 2023 г.
Исследованы инфракрасные спектры воздуха, выдыхаемого несколькими группами волонтеров: страдающих диабетом первого типа, бронхиальной астмой и пневмонией. Для регистрации инфракрасных спектров применен перестраиваемый квантово-каскадный лазер, излучающий в диапазоне длин волн от 5.3 до 12.8 μm в импульсном режиме с шириной импульса 50 ns, мощностью до 150 mW и шагом перестройки 1 cm-1. Лазер оптически сопряжен с астигматической газовой кюветой типа Эрриота с длиной оптического пути 76 m. Обнаружено отличие интенсивности селективных линий молекул-биомаркеров в спектрах выдыхаемого воздуха здоровых волонтеров от аналогичных показателей волонтеров, страдающих определенным заболеванием. На примере таких методов, как метод опорных векторов (SVM), метод k-ближайших соседей (k-NN) и алгоритм случайного леса (RandomForest), показана возможность классификации волонтеров по инфракрасным спектрам их выдыхаемого воздуха. Применение методов понижения размерности (PCA и t-SNE) позволило повысить точность классификации болезней до 98% по метрике accuracy. Ключевые слова: инфракрасная спектроскопия, квантово-каскадный лазер, диагностика, выдыхаемый воздух, диабет первого типа, пневмония, хроническое заболевание, машинное обучение.
- T. Grant, E. Croce, E.C. Matsui. Annals of Allergy, Asthma \& Immunology, 128 (1), 5(2022). DOI: 10.1016/j.anai.2021.10.002
- E. Uphoff, B. Cabieses, M. Pinart, M. Vald?s, J.M. Anto, J. Wright. Eur. Respir. J., 46 (2), 364(2015). DOI: 10.1183/09031936.00114514
- И.И. Дедов, М.В. Шестакова, А.Ю. Майоров, О.К. Викулова, Г.Р. Галстян, Т.Л. Кураева, Е.А. Шестакова. Алгоритмы специализированной медицинской помощи больным сахарным диабетом. Под ред. И.И. Дедова, М.В. Шестаковой, А.Ю. Майорова. 9-й выпуск. Сахарный диабет, 22 (1S1), 1-144 (2019). DOI: 10.14341/DM221S1
- B. de Lacy Costello, A. Amann, H. Al-Kateb, C. Flynn, W. Filipiak, T. Khalid, D. Osborne, N. M. Ratcliffe. J. Breath Res., 8 (1), 014001 (2014). DOI: 10.1088/1752-7155/8/1/014001
- A. Bajtarevic, C. Ager, M. Pienz, M. Klieber, K. Schwarz, M. Ligor, A. Amann. BMC cancer., 9(1), 1(2009)
- R.H. Eckel, S.M. Grundy, P.Z. Zimmet. The Lancet, 365 (9468), 1415 (2005). DOI: 10.1016/S0140-6736(05)66378-7
- P.R. Galassetti, B. Novak, D. Nemet, C. Rose-Gottron, D.M. Cooper, S. Meinardi, D.R. Blake. Diabetes. Technol. Ther., 7(1), 115(2005)
- I. Ueta, Y. Saito, M. Hosoe, M. Okamoto, H. Ohkita, S. Shirai, H. Tamura, K. Jinno. Chromatogr. B, 877 (24), 2551 (2009). DOI: 10.1016/j.jchromb.2009.06.039
- M. P. Kalapos. Med. Hypotheses, 53 (3), 236(1999)
- A.K. Mork, G. Johanson. Toxicol. Lett., 164 (1), 6(2006)
- S.K. Kundu, J.A. Bruzek, R. Nair, A.M. Judilla. Clinic. Chem., 39 (1), 87 (1993)
- В.М. Ганузин, Н.Л. Черная, Г.С. Маскова. Доктор. Ру, 19 (3), 57 (2020). DOI:10.31550/1727-2378-2020-19-3-57-60
- P.V. Berezhanskij, T.A. Gutyrchik, Y.V. Vekshina, N.A. Gutyrchik, N.A. Shapiev, T.I. Ushina. Med. Pharm. J. "Pulse", 24(11), 101(2022). DOI: 10.26787/nydha-2686-6838-2022-24-11-101-107
- Y. Ohara, T. Ohara, K. Hashimoto, M. Hosoya. J. Med. Sci., 66(2), 78 (2020). DOI: 10.5387/fms.2019-02
- S.A. Kharitonov, D. Yates, R.A. Robbins, P.J. Barnes, R. Logan-Sinclair, E.A. Shinebourne. The Lancet, 343 (8890), 133(1994). DOI: 10.1016/S0140-6736(94)90931-8
- P.E. Silkoff, P. McClean, M. Spino, L.A. Erlich, A.S. Slutsky, N. Zamel. Chest, 119 (5), 1322 (2001). DOI: 10.1378/chest.119.5.1322
- S. Svensson, A. Olin, M. Larstad, G. Ljungkvist, K. Toren. J. Chromat. B, 809(2), 199 (2004). DOI: 10.1016/j.jchromb.2004.06.027
- J.K. Schubert, W.P.E. Muller, A. Benzing, K. Geiger. Intensive Care Med., 24(5), 415 (1998). DOI: 10.1007/s001340050589
- A. Reyes-Reyes, R.C. Horsten, H.P. Urbach, N. Bhattacharya. Analytical Chem., 87(1), 507 (2015). DOI: 10.1021/ac504235e
- L. Richard, D. Romanini, I. Ventrillard. Sensors, 18(7), 1997 (2018). DOI: 10.3390/s18071997
- I. Kononenko. Art. Intell. Med., 23(1), 89 (2001). DOI: 10.1016/S0933-3657(01)00077-X
- M. Shehab, L. Abualigah, Q. Shambour, M.A. Abu-Hashem, M.K.Y. Shambour, A.I. Alsalibi, A.H. Gandomi. Comp. Biol. Med., 145, 105458 (2022). DOI: 10.1016/j.compbiomed.2022.105458
- M. Gharaibeh, D. Alzu'bi, M. Abdullah, I. Hmeidi, M.R. Al Nasar, L. Abualigah, A.H. Gandomi. Big Data Cogn. Comp., 6(1), 29 (2022). DOI: 10.3390/bdcc6010029
- M. Li, Z.H. Zhou. IEEE Transactions on Systems, Man, and Cybernetics Part A, 37 (6), 1088 (2007). DOI: 10.1109/TSMCA.2007.904745
- A. Choudhury, D. Gupta. In Recent developments in machine learning and data analytics (Springer, Singapore, 2019). V. 67. DOI: 10.1007/978-981-13-1280-9_6
- A.V. Borisov, A.G. Syrkina, D.A. Kuzmin, V.V. Ryabov, A.A. Boyko, O. Zaharova, V.S. Zasedatel, Y.V. Kistenev, J. Breath Res., 15, 027104 (2021). DOI:10.1088/1752-7163/abebd4
- A. Kaplan, H. Cao, J. M. FitzGerald, N. Iannotti, E. Yang, J.W.H. Kocks, K. Kostikas, D. Price, H.K. Reddel, I. Tsiligianni, C.F. Vogelmeier, P. Pfister, P. Mastoridis/ J/ Allergy Clinic. Immunol. Pract., 9, 2255 (2021). DOI: 10.1016/j.jaip.2021.02.014
- Y.V. Kistenev, A.V. Borisov, D.A. Kuzmin, O.V. Penkova, N. Kostyukova, A.A. Karapuzikov. J. Biomed. Opt., 22 (1), 017002 (2017). DOI: 10.1117/1.jbo.22.1.017002
- I.L. Fufurin, D.R. Anfimov, E.R. Kareva, A.V. Scherbakova, P.P. Demkin, A.N. Morozov, I.S. Golyak. Opt. Engin., 60 (8), 082016 (2021). DOI: 10.1117/1.OE.60.8.082016
- I.S. Golyak, E.R. Kareva, I.L. Fufurin, D. R. Anfimov, A.V. Scherbakova, A.O. Nebritova, P.P. Demkin, A.N. Morozov. Comp. Opt., 46 (4), 650 (2022). DOI: 10.18287/2412-6179-CO-1058
- I.L. Fufurin, P.V. Berezhanskiy, I.S. Golyak, D.R. Anfimov, E.R. Kareva, A.V. Scherbakova, P.P. Demkin, O.A. Nebritova, A. Morozov. Materials, 15 (9), 2984(2022). DOI: 10.3390/ma15092984
- I.S. Golyak, I.L. Fufurin, E.R. Kareva, D.R. Anfimov, A.V. Scherbakova, A.N. Morozov, P.P. Demkin. In Saratov Fall Meeting 2020: Optical and Nanotechnologies for Biology and Medicine. Proc. SPIE. 11845, 169 (2021) DOI: https://doi.org/10.1117/12.2590835
- NIST Chemistry WebBook [Электронный ресурс]. URL: https://webbook.nist.gov/chemistry/
- S.E. Maxwell, H.D. Delaney, K. Kelley. Designing Experiments and Analyzing Data. A Model Comparison Perspective (Routledge, New York, 2017). DOI: 10.2307/2532173
Подсчитывается количество просмотров абстрактов ("html" на диаграммах) и полных версий статей ("pdf"). Просмотры с одинаковых IP-адресов засчитываются, если происходят с интервалом не менее 2-х часов.
Дата начала обработки статистических данных - 27 января 2016 г.