Программный комплекс представляет собой гибкий аппарат решения классификационных задач с возможностью автоматического извлечения информативных признаков.
При решении задач классификации целесообразно осуществлять предобработку данных, используемых алгоритмом обучения, поскольку атрибуты могут иметь низкий уровень вариации, коррелировать друг с другом или содержать зашумленные измерения, снижающие точность классификатора.
В случае, когда стандартные методы извлечения информативных признаков (метод главных компонент, факторный анализ) не демонстрируют приемлемой эффективности, для решения данной задачи могут быть применены алгоритмические схемы, основанные на эвристических процедурах оптимизации.
В программной системе реализуется два подхода: согласно первому процедура отбора признаков осуществляется с привлечением классификатора, с помощью которого оценивается релевантность извлеченных атрибутов; второй же подход соответствует этапу предобработки данных и для сравнения различных вариантов подсистем информативных признаков использует статистические характеристики, что требует меньше вычислительных ресурсов. Для оптимизации введенных критериев качества применяются многокритериальные эвристические процедуры (генетические алгоритмы).
В качестве классификаторов предлагается широкий спектр моделей.
Разработанные подходы позволяют:
1. эффективно решать классификационные задачи;
2. существенно сокращать размерность привлекаемых баз данных;
3. использовать данную систему лицом, не являющимся экспертом в сфере настройки генетических операторов (за счет реализованных механизмов адаптации алгоритмов).
Разработано три конфигурации программного комплекса:
- автономная;
- поддерживающая интеграцию с Weka;
- ориентированная на решение задач распознавания человека и его персональных характеристик по речи.