Сравнение подходов к повышению представительности спектроскопических данных с помощью вариационных автоэнкодеров
Российский научный фонд, Отдельные научные группы, 24-11-00266
Мущина А.С.1,2, Исаев И.В.1, Сарманова О.Э.1,2, Буриков С.А.1,2, Доленко Т.А.1,2, Доленко С.А.1
1Научно-исследовательский институт ядерной физики им. Д.В. Скобельцына Московского государственного университета им. М.В. Ломоносова, Москва, Россия
2Московский государственный университет им. М.В. Ломоносова (физический факультет), Москва, Россия

Email: anastasemusa@gmail.com
Поступила в редакцию: 7 февраля 2025 г.
В окончательной редакции: 7 февраля 2025 г.
Принята к печати: 7 февраля 2025 г.
Выставление онлайн: 24 апреля 2025 г.
Решение обратных задач оптической спектроскопии многокомпонентных растворов по определению концентраций компонентов представляет собой достаточно сложную проблему, один из эффективных способов решения которой состоит в использовании искусственных нейронных сетей. Однако одной из сложностей на этом пути может являться недостаточная представительность экспериментальных данных, связанная со сложностью и высокой стоимостью масштабного физического эксперимента. Рассмотрены и сравнены между собой алгоритмы генерации дополнительных модельных данных с помощью вариационных автоэнкодеров с целью повышения представительности обучающей выборки. Показано, что наиболее перспективным представляется использование обыкновенного (не обусловленного) вариационного автоэнкодера с генерацией примеров из равномерного распределения в латентном пространстве. Поиск оптимального распределения в латентном пространстве для генерации примеров должен стать предметом дальнейших исследований. Ключевые слова: генерация данных, обратная задача спектроскопии, многокомпонентные растворы, искусственные нейронные сети.
- Ю.Н. Водяницкий, Д.В. Ладонин, А.Т. Савичев. Загрязнение почв тяжелыми металлами (Типография Россельхозакадемии, М., 2012)
- Г.А. Теплая. Астраханский вестник экологического образования, 1 (23), 182 (2013)
- Y. Fa, Y. Yu, F. Li, F. Du, X. Liang, X. Liu. J. Chromatography A, 1554, 123 (2018). https://doi.org/10.1016/j.chroma.2018.04.017
- N.G. Carpenter, D. Pletcher. Anal. Chim. Acta, 317, 287 (1995). https://doi.org/10.1016/0003-2670(95)00384-3
- C. Pasquini, I.B.S. Cunha. Analyst, 120 (11), 2763 (1995). https://doi.org/10.1039/AN9952002763
- N. Porter, B.T. Hart, R. Morrison, I.C. Hamilton. Anal. Chim. Acta, 308, 313 (1995). https://doi.org/10.1016/0003-2670(94)00330-O
- C. Neuhold, K. Kalcher, W. Diewald, X. Cai, G. Raber. Electroanalysis, 6, 227 (1994). https://doi.org/10.1002/elan.1140060309
- B. Saad, F.W. Pok, A.N.A. Sujari, M.I. Saleh. Food Chem., 61 (1-2), 249 (1998). https://doi.org/10.1016/S0308-8146(97)00024-1
- V.K. Maurya, R.P. Singh, L.B. Prasad. Orient. J. Chem., 34 (1), 100 (2018). http://dx.doi.org/10.13005/ojc/340111
- C. Shorten, T.M. Khoshgoftaar. J. Big. Data, 6, 60 (2019). https://doi.org/10.1186/s40537-019-0197-0
- L. Nanni, G. Maguolo, M. Paci. Ecolog. Inform., 57, 101084 (2020). https://doi.org/10.1016/j.ecoinf.2020.101084
- Q. Wen, L. Sun, F. Yang, X. Song, J. Gao, X. Wang, H. Xu. Comp. Sci. Machine Learning, (2020). https://doi.org/10.48550/arXiv.2002.12478
- И.В. Исаев, С.А. Буриков, Т.А. Доленко, К.А. Лаптинский, С.А. Доленко. Повышение устойчивости нейросетевого решения обратной задачи спектроскопии комбинационного рассеяния света к искажениям, обусловленным смещением частоты каналов спектра. IV Междунар. конф. и молодежная школа "Информационные технологии и нанотехнологии" (ИТНТ-2018) (Новая техника, Самара, 2018), с. 2710-2715. [I.V. Isaev, S.A. Burikov, T.A. Dolenko, K.A. Laptinskiy, S.A. Dolenko. Improving the resilience of neural network solution of inverse problems in Raman spectroscopy to the distortions caused by frequency shift of the spectral channels (Samara, 2018), р. 2710-2715.]
- D.P. Kingma, M. Welling. Foundations and Trends in Machine Learning, 12 (4), 307 (2019). http://dx.doi.org/10.1561/2200000056
- I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, A. Courville, Y. Bengio. Commun. ACM, 63 (11), 139 (2020). https://doi.org/10.1145/3422622
- J. Li, A. Madry, J. Peebles, L. Schmidt. On the Limitations of First-Order Approximation in GAN Dynamics, Proceed. 35th Intern. Conf. Machine Learning, PMLR, 80, 3005-3013 (2018)
- M. Shanker, M.Y. Hu, M.S. Hung. Omega, 24 (4), 385 (1996). https://doi.org/10.1016/0305-0483(96)00010-2
- A. Efitorov, T. Dolenko, K. Laptinskiy, S. Burikov, S. Dolenko. Proceed. Sci., 410, art. 013 (2021). https://doi.org/10.22323/1.410.0013
- A. Efitorov, S. Burikov, T. Dolenko, S. Dolenko. Studies in Computational Intelligence, 1064, 557 (2023). https://doi.org/10.1007/978-3-031-19032-2_56
- S. Kullback, R.A. Leibler. Annals Mathemat. Statistics, 22, 79 (1951)
- K. Sohn, X. Yan, H. Lee. Learning structured output representation using deep conditional generative models Advances in Neural Information Processing Systems, ed. C. Cortes, N. Lawrence, D. Lee, M. Sugiyama, R. Garnett (Curran Associates, Inc. 28, 2015)
- Qing-Song Xu, Yi-Zeng Liang. Chemometrics and Intelligent Laboratory Systems, 56 (1), 1 (2001). https://doi.org/10.1016/S0169-7439(00)00122-2
- I. Isaev, S. Burikov, T. Dolenko, K. Laptinskiy, A. Vervald, S. Dolenko. (2018). Joint Application of Group Determination of Parameters and of Training with Noise Addition to Improve the Resilience of the Neural Network Solution of the Inverse Problem in Spectroscopy to Noise in Data. In: V. Kurkova, Y. Manolopoulos, B. Hammer, L. Iliadis, I. Maglogiannis. (eds) Artificial Neural Networks and Machine Learning --- ICANN 2018. (Lecture Notes in Computer Science, 11139, 435 (2018) Springer, Cham.)
- D.P. Kingma. (2014). Adam: A method for stochastic optimization arXiv preprint. https://doi.org/10.48550/arXiv.1412.6980
Подсчитывается количество просмотров абстрактов ("html" на диаграммах) и полных версий статей ("pdf"). Просмотры с одинаковых IP-адресов засчитываются, если происходят с интервалом не менее 2-х часов.
Дата начала обработки статистических данных - 27 января 2016 г.