УСОВЕРШЕНСТВОВАНИЕ МОДЕЛИ ДЛЯ АНАЛИЗА СОДЕРЖАНИЯ ОРГАНИКИ В ПОЧВЕ МЕТОДОМ СПЕКТРОМЕТРИИ В ВИДИМОМ И БЛИЖНЕМ ИК ДИАПАЗОНАХ ЗА СЧЕТ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ СПЕКТРОВ, ВЫБОРА ОБРАЗЦОВ И ОПТИМИЗАЦИИ ДЛИН ВОЛН
При создании модели для анализа методом спектрометрии в видимом и ближнем ИК диапазонах содержания органических веществ (OMC) в черноземе с известковыми включениями использованы 130 образцов поверхностного слоя почвы, взятых в графстве Гуоян провинции Аньхой, Китай. Для минимизации несоответствующей и бесполезной информации в полученных из спектров данных и повышения степени их корреляции с измеряемыми величинами проведена предварительная обработка спектров. Для выбора обучающего набора использованы метод Кеннарда-Стоуна (KS) и разбиение набора образцов с совместным учетом расстояний по x-y (SPXY). C помощью алгоритма последовательных проекций (SPA) и генетического алгоритма (GA) осуществлена оптимизация длин волн. В итоге построена модель регрессии на главные компоненты (PCR), в которой оптимальное число главных компонент определено с помощью методики перекрестной проверки с исключением по одному. Показано, что комбинация фильтра Савицкого-Голея (SG) для сглаживания и мультипликативной поправки на рассеяние (MSC) может исключить влияние шума и дрейфа базовой линии; метод SPXY имеет преимущество перед KS при выборе образцов; SPA и GA могут значительно уменьшить число переменных по длинам волн и эффективно повысить точность GA и анализа OMC в почве до коэффициентов корреляции (Rcc), среднеквадратичной ошибки предсказания (RMSEP) и остаточной погрешности прогноза (RPD) 0.9316, 0.2142 и 2.3195 соответственно.