Комбинации особенностей

У меня есть список набора особенностей (40 особенностей), и моя идея во-первых состояла в том, чтобы оценить классификатор на всех комбинациях, которые я могу получить. Однако после того, как я сделал некоторые вычисления, я нашел, что комбинации достигнут миллионов!! Таким образом это возьмет навсегда!!!!

Я читал о способности об использовании случайного метода поиска для, выбрал случайные особенности. Однако каждый раз, когда я запускаю случайный поиск, я получил те же самые наборы особенностей. Я должен изменить число семени или какой-либо выбор??

Кроме того, использует случайный эффективный поиск и может заменить подходом выбора всех комбинаций???

Я ценил бы ваших экспертов по помощи.

Большое спасибо заранее,

Ахмад

3
nl ja de

1 ответы

Когда вы хотите выполнить выбор признака в WEKA, эй должен принять во внимание 2 алгоритма, искателя и оценщика признака (я буду говорить об этом позже).

Как вы сказали, возможно вы не можете попробовать Исчерпывающий поиск , потому что это занимает много времени, есть жадные альтернативы, чтобы получить хорошие результаты (в зависимости от проблемы) как Лучше всего сначала (на основе восхождение на вершину ). Выбором, который вы комментируете ( Случайный поиск ) является другой подход, чтобы сделать подмножества выбора, это делает случайные повторения, чтобы выбрать подмножества, которые будут оценены.

Почему вы получаете то же самое подмножество отобранных признаков? Поскольку Случайный поиск выбирает всегда те же самые подмножества, и оценщик определяет лучший один (окончательный результат). Но если я изменяю семя параметр, это должно измениться. Возможно, или... возможно, нет. Почему? Поскольку, если алгоритм выполняет достаточно количества повторений (хотя он начинается с различного семени) это получит те же самые подмножества, чем предыдущий один (сходимость) и оценщик выберет то же самое подмножество в качестве предыдущего выполнения.

Если вы не хотите добираться, сходимость в отборщике произвела, просто изменяет семя , но выбирает меньшее процент поиска , чтобы ограничить исследование и получить различные результаты.

Но, по-моему, если вы добираетесь всегда, те же самые результаты то, потому что оценщик (я не знаю, какой алгоритм вы использование), решил, что это подмножество является "лучшим", учитывая ваш набор данных. Я также рекомендую вам судить другого отборщика как Лучше всего сначала или Генетический поиск как ваш метод поиска.

4
добавлено
Если вы хотите проверить "все различные комбинации", просто пробуют Исчерпывающий поиск . Но если вы хотите результаты, сортированные в порядке убывания, который не является материалом метода поиска, он зависит от оценщик . Если вы хотите получить статистическую идею, которой признаки лучше, просто пробуют Ranker как метод поиска и Основные компоненты как оценщик, это дает вам корреляции и собственные векторы для каждого признака.
добавлено автор arutaku, источник
Спасибо за ваш ответ Arutaku. Действительно цените его. Вещь состоит в том, что моя идея состояла в том, чтобы проверить все различные комбинации на 40 особенностей и отождествить лучший результат комбинации с чувствительными к стоимости классификаторами. Если я применю Лучше всего Первый или Генетический поиск, то законченные особенности не перечислят самые возможные комбинации. Нижняя строка, whhat вы рекомендуют примениться, чтобы перечислить большинство комбинаций особенностей?? Большое спасибо!!
добавлено автор Ahmad Azab, источник
Оценщик обеспечит лучший результат в зависимости от обеспеченного набора данных. Вещь, я должен поддержать большинство комбинаций особенностей (даже при том, что она может обеспечить очень низкие результаты точности),
добавлено автор Ahmad Azab, источник