подготовка дерева решений

Я пытаюсь начать с Machine Learning.

У меня есть некоторые данные обучения, представляющие значения пикселей цифр в изображениях, и я пытаюсь обучить дерево решений из этого. Что было бы хорошим способом начать работу? Какие инструменты следует учитывать (указатели на соответствующую документацию помогут)?

Я также хочу обучить случайный лес данным, чтобы сравнить производительность и дерево решений. Любое руководство будет очень полезно.

1
nl ja de

3 ответы

Лучший способ начать работу, вероятно, Weka . Помимо предоставления реализаций случайного классификатора леса, а также нескольких деревьев решений (среди множества других алгоритмов), он также предоставляет инструменты для обработки и визуализации данных. Он поставляется с относительно простым графическим интерфейсом.

2
добавлено

В случайном лесу используются деревья, поэтому я, вероятно, советую вам заставить деревья работать в первую очередь. Когда вы знаете все о деревьях, вы можете прочитать о лесах, и это будет очень просто. Однако вы должны начать с того, что пытаетесь узнать о машинах, а не просто прыгать в библиотеку. Я хотел бы начать с понимания того, как использовать деревья решений в булевых функциях (намного проще) с помощью метода максимизации энтропии. Как только вы поймете этот алгоритм достаточно хорошо, чтобы вручную запустить его на небольшом наборе данных, ознакомьтесь с тем, как использовать деревья решений на реальных значащих функциях. Затем проверьте библиотеку.

0
добавлено

В случайном лесу используются деревья, поэтому я, вероятно, советую вам заставить деревья работать в первую очередь. Когда вы знаете все о деревьях, вы можете прочитать о лесах, и это будет очень просто. Однако вы должны начать с того, что пытаетесь узнать о машинах, а не просто прыгать в библиотеку. Я хотел бы начать с понимания того, как использовать деревья решений в булевых функциях (намного проще) с помощью метода максимизации энтропии. Как только вы поймете этот алгоритм достаточно хорошо, чтобы вручную запустить его на небольшом наборе данных, ознакомьтесь с тем, как использовать деревья решений на реальных значащих функциях. Затем проверьте библиотеку.

0
добавлено
AI / Big Data / Machine Learning
AI / Big Data / Machine Learning
2 978 участник(ов)

Всё об AI, бигдата, о машинном обучении, и как правильно всё это готовить. For english: @bigdata_en По любым вопросам: @hitmaker Список интересных групп и каналов: https://github.com/goq/telegram-list

Data Science Chat
Data Science Chat
2 902 участник(ов)

Добро пожаловать в чат по анализу данных и машинному обучению. Вопросы или предложения по сотрудничеству: @ralovets Вакансии и реклама мероприятий разрешены только после согласования. Анти-спам бот для групп: @ProtectronBot

Нейронные сети (AI Community)
Нейронные сети (AI Community)
2 121 участник(ов)

Это чат про нейронные сети для членов AI Community.