Метод k-медиан

4-05-2021, 19:39

Метод k {displaystyle k} -медиан — применяемая в статистике и машинном обучении вариация метода k {displaystyle k} -средних для задач кластеризации, где для определения центроида кластера вместо среднего вычисляется медиана. Такой подход соответствует минимизации ошибки по всем кластерам в метрике с 1-нормой, вместо метрики с 2-нормой, используемой в стандартном методе k {displaystyle k} -средних.

Задача определения k {displaystyle k} -медиан состоит в поиске таких k {displaystyle k} центров, что сформированные по ним кластеры будут наиболее «компактными». Формально, при заданных точках данных x i {displaystyle x_{i}} , k {displaystyle k} центров c j {displaystyle c_{j}} должны быть выбраны так, чтобы минимизировать сумму расстояний от каждой x i {displaystyle x_{i}} до ближайшего c j {displaystyle c_{j}} .

Метод иногда работает лучше, чем метод k {displaystyle k} -средних, где минимизируется сумма квадратов расстояний. Критерий суммы расстояний широко используется для транспортных задач.

Ещё альтернатива — метод k {displaystyle k} -медоидов, в котором ищут оптимальный медоид, а не медиану кластера (медоид является одной из точек данных, в то время как медианы таковыми быть не обязаны).


  • Метод Ритца
  • H-пространство
  • Минимизирующая последовательность
  • Хеммингова сфера
  • Обратимая функция

  •  

    • Яндекс.Метрика
    • Индекс цитирования