%0 article %A Закирова В. Р., %A Сырокваш Д. А., %A Гилевский С. В., %A Назаров П. В., %A Яцков Н. Н., %T Разработка алгоритмов и программных средств классификации кодирующих и некодирующих нуклеотидных последовательностей %D 2019 %J Информатика %X Проведено исследование кодирующих и некодирующих нуклеотидных последовательностей референсного генома человека. Разработаны семь моделей векторизации нуклеотидных последовательностей на основе частот моно-, би- и триграммов нуклеотидов, параметров модели частот и позиций сочетаний нуклеотидов (category-position-frequency model), длин последовательностей, корреляционных факторов нуклеотидов, статистических признаков кодирующих и некодирующих участков молекул ДНК. Определены наиболее информативные признаки моделей векторизации c использованием алгоритмов автоматического выбора признаков и классификации на основе методов случайного леса и опорных векторов. Установлено различие кодирующих и некодирующих фрагментов нуклеотидных последовательностей. Ошибка классификации последовательностей с использованием метода случайного леса на наборе из 23 наиболее информативных признаков составила 2,93 %. %U https://www.academjournals.by/publication/18343