Программный комплекс для имитационного моделирования сайтов однонуклеотидного генетического полиморфизма

Яцков Н. Н., Сарнацкий Д. Д., Скакун В. В., Гринев В. В.
2025

Цели. В настоящее время высокопроизводительные методы секвенирования широко используются в фундаментальных и прикладных исследованиях различных заболеваний человека. Секвенирование функционально значимых регионов генома человека позволяет одновременно идентифицировать множество сайтов генетического полиморфизма, имеющих диагностическую и (или) прогностическую значимость в отношении генетических заболеваний человека. В числе приоритетных целей в этой области стоит разработка эффективных программных инструментов обработки геномных данных и идентификации сайтов однонуклеотидного полиморфизма с использованием методов компьютерного моделирования и анализа больших данных.Методы. Разработан программный комплекс для имитационного моделирования и идентификации сайтов однонуклеотидного полиморфизма с использованием методов машинного обучения. Реализована методика подхода имитационного моделирования и анализа сайтов однонуклеотидного полиморфизма в молекулах ДНК на основе бета-распределения или нормального закона распределения, параметры которых определяются по имеющимся экспериментальным данным, и методов интеллектуального анализа, обученных на смоделированных данных и применяемых для точной идентификации сайтов однонуклеотидного полиморфизма. Комплекс включает R-пакет, веб-приложение и вспомогательные программные средства для обработки экспериментальных данных геномного секвенирования.Результаты. Проверка работоспособности представленного программного комплекса проведена на наборах смоделированных и экспериментальных данных геномного секвенирования клеток человека. Выполнен сравнительный анализ наиболее эффективных алгоритмов идентификации сайтов однонуклеотидных полиморфизмов. Наилучшие результаты получены для моделей машинного обучения.Заключение. Применение программного комплекса повышает точность определения сайтов генетического полиморфизма в ходе анализа больших данных геномного секвенирования. Комплекс может использоваться для моделирования синтетических данных по экспериментальным данным или самостоятельно с целью всестороннего тестирования и выбора наилучших алгоритмов идентификации однонуклеотидных полиморфизмов, а также для генеративного моделирования данных, используемых при обучении алгоритмов идентификации на основе методов интеллектуального анализа

Яцков Н. Н., Сарнацкий Д. Д., Скакун В. В., Гринев В. В. Программный комплекс для имитационного моделирования сайтов однонуклеотидного генетического полиморфизма. Информатика. 2025;22(2):81-94. https://doi.org/10.37661/1816-0301-2025-22-2-81-94
Цитирование

Список литературы

Похожие публикации

Источник