ID3 (алгоритм)


Алгоритм ID3 — один из алгоритмов для построения дерева принятия решений. Разработан Джоном Р. Квинланом (англ. John R. Quinlan). Впоследствии Квинлан создал усовершенствованную версию — алгоритм C4.5.

Алгоритм

  • Взять все неиспользованные признаки и посчитать их энтропию относительно тестовых образцов
  • Выбрать признак, для которого энтропия минимальна (а информационная выгода соответственно максимальна)
  • Сделать узел дерева, содержащий этот признак
  • Алгоритм следующий:

    ID3(Таблица примеров, Целевой признак, Признаки)

  • Если все примеры положительны, то возвратить узел с меткой «+».
  • Если все примеры отрицательны, то возвратить узел с меткой «-».
  • Если множество признаков пустое, то возвратить узел с меткой, которая больше других встречается в значениях целевого признака в примерах.
  • Иначе:
  • A — признак, который лучше всего классифицирует примеры (с максимальной информационной выгодой).
  • Создать корень дерева решения; признаком в корне будет являться A {displaystyle A} .
  • Для каждого возможного значения A {displaystyle A} ( v i {displaystyle v_{i}} ):
  • Добавить новую ветвь дерева ниже корня с узлом со значением A = v i {displaystyle A=v_{i}}
  • Выделить подмножество E x a m p l e s ( v i ) {displaystyle Examples(v_{i})} примеров, у которых A = v i {displaystyle A=v_{i}} .
  • Если подмножество примеров пусто, то ниже этой новой ветви добавить узел с меткой, которая больше других встречается в значениях целевого признака в примерах.
  • Иначе, ниже этой новой ветви добавить поддерево, вызывая рекурсивно ID3( E x a m p l e s ( v i ) {displaystyle Examples(v_{i})} , Целевой признак, Признаки)
  • Возвратить корень.

  • Код Левенштейна
  • Адаптивный алгоритм Хаффмана
  • Алгоритм соединения хешированием
  • Согласованность данных
  • GLR-парсер

  •  

    • Яндекс.Метрика
    • Индекс цитирования