Природные закономерности помогут учёным ТУСУРа усовершенствовать машинное обучение

Поиск новостей по категории "IT-бизнес"

Томский государственный университет систем управления и радиоэлектроники Центр информационно-технического сопровождения

Дата публикации: 11 октября 2021

Аспирантка ТУСУРа уверена, что изучение метаэвристических алгоритмов, имитирующих природные явления, поведение групп животных и социальные механизмы, поможет строить точные и компактные нечёткие системы для решения разнообразных задач анализа данных.

Машинное обучение используется для решения задач классификации и аппроксимации в разнообразных сферах жизни. Это и отслеживание мошеннических транзакций, и прогнозирование поведения рынка, и определение риска развития заболеваний, и многое другое. Одним из эффективных инструментов решения таких задач являются нечёткие системы. Неудивительно, что сегодня нечёткими системами занимаются группы учёных в разных странах мира: Японии, России, Китае, Испании и других.

Каждая задача, которая решается с помощью машинного обучения, индивидуальна. Элитный аспирант кафедры КИБЭВС Марина Бардамова рассказывает, что в одних случаях достаточно высокой точности, в других необходимо задействовать меньшее количество вычислительных ресурсов, а иногда важно гарантировать доверие пользователя к итоговой системе.

«Доверие достигается тогда, когда пользователь понимает логику получения результата. Именно нечёткие системы позволяют обеспечить три условия: высокую точность, низкую сложность и лёгкую интерпретируемость, — разъясняет Марина Бардамова. — В то время как популярные нейронные сети являются «чёрным ящиком», то есть не предоставляют возможности отследить, как из конкретного входа получается конкретный вывод, нечёткие системы формируют перечень логических правил, имитирующих человеческое мышление».

Главным источником знаний для систем машинного обучения с учителем являются накопленные данные. В любой задаче можно столкнуться с трудностями при обработке данных — они могут обладать слишком большой или, наоборот, слишком маленькой размерностью, возможны пропуски, дисбаланс, пересечение классов и другие проблемы. Поэтому разработчику интеллектуальных систем важно иметь широкий арсенал всевозможных алгоритмов, способных преодолеть такие недостатки.

«Я разрабатываю алгоритмы оптимизации, помогающие улучшить качество нечётких классификаторов. Исследую и подходы к уточнению структуры классификатора, и возможности отбора признаков, и способы предобработки данных», — поясняет элитный аспирант.

При этом главная особенность разработок учёных ТУСУРа — в применении оригинальных методов, позволяющих строить компактные модели, и использование метаэвристик — алгоритмов оптимизации, основанных на имитации физических процессов, поведения животных и социальных механизмов.

«Изучение метаэвристик — это в некоторой степени творческая задача, — уверена Марина Бардамова. — Оказывается, приложение законов природы или общества к задачам оптимизации позволяет достичь результатов не хуже, чем при использовании методов, основанных на вычислении производных».

В настоящее время Марина Бардамова вместе с коллегами из лаборатории съёма, анализа и управления биологическими сигналами изучают перспективы применения нечётких классификаторов для диагностики нейродегенеративных заболеваний, таких как болезнь Паркинсона и болезнь Альцгеймера. По мнению учёных, анализ динамических данных, снимаемых во время выполнения рукописной подписи или рисунка, позволит упростить процесс определения тяжести заболевания пациента.

Построением нечётких классификаторов Марина Бардамова впервые заинтересовалась, работая над проектом в рамках ГПО в 2015 году под руководством профессора, доктора технических наук Ильи Александровича Ходашинского. Сегодня на счету аспирантки — пять зарегистрированных в Роспатенте программ, более 30 публикаций, а также выступления на конференциях в различных городах России. При участии Марины Бардамовой нечёткие классификаторы получили апробацию в рамках научных проектов для анализа сетевого трафика, аутентификации пользователя по динамическим характеристикам рукописной подписи, прогнозированию риска развития сердечно-сосудистых заболеваний, определению состояния системы свёртывания крови по результатам диагностических исследований.

Возврат к списку