Кластерный анализ. Иерархическая кластеризация. Метод k-средних.
0:00 - Введение. Многомерные классификации.
7:25 - Кластерный анализ. Основные сведения.
26:51 - Иерархическая агломеративная кластеризация.
41:24 - Кластеризация методом k-средних (k-means).
Пікірлер: 13
Спасибо, очень хорошо объяснил
Спасибо! Самое понятное объяснение на ютубе. Если у вас будет возможность разберите пожалуйста метод случайного леса.
@learningmeansdoing
Жыл бұрын
Спасибо за хороший отзыв. Про метод случайного леса учту. По возможности сделаю.
Добрый день. Спасибо за видео. Отправьте пожалуйста файл excel, в котором производили расчёты.
Отличное видео, а что же ссылку не дали на ексель документ?
@learningmeansdoing
11 ай бұрын
Спасибо. Да как-то и не спрашивал никто. Цель была показать.
А что делать, если у объектов 26 иксов (x1-x26)? Можно как-то с вами проконсултироваться?
@learningmeansdoing
2 жыл бұрын
Если у объектов много иксов, то в целом алгоритм расчета остается прежним. Немного меняется формула расчета расстояний между объектами. Когда у нас было 2 икса, то в формуле Евклидова расстояния для объектов А и В был корень((x1A-x1B)^2 + (x2A-x2B)^2). Если иксов больше, то просто по аналогии добавляйте x3, x4, x5,... Ну и еще один момент в том, что вам не удастся нарисовать точки на графике, так как измерений больше, чем 3 штуки. Придется довольствоваться только результатами расчетов.
Здравствуйте, подскажите, пожалуйста, как считать по центроидному методу, когда в таблице 8 переменных и 8 объектов: при срзнач, нужно ли скрещивать еще столбцы, или только строки?
@learningmeansdoing
Жыл бұрын
Здравствуйте. Как я понял, речь идёт о методе k-средних? Когда мы считаем координаты центроида, то среднее берется по каждой переменной отдельно, то есть по одному столбцу. В этом столбце выбираем те объекты, которые относятся к данному центроиду.
@user-ei1xi7ns1u
Жыл бұрын
@@learningmeansdoing О методе древовидной кластеризации. На шаге, когда после создания матрицы евклидового расстояния нужно рассчитать расстояние между кластерами(в моем случае центроидным методом). А ситуация в таблице такова: при объединении двух схожих объектов в один кластер и при расчете по формуле среднего значения, я не могу понять нужно ли рассчитывать только срзнач в строках или в столбцах также, поскольку у меня симметричная матрица 8х8(в том числе исходная матрица такого размера, то есть у меня столбцы от х1 до х8, а у вас от х1 до х2), и возникает пересечение на стыке столбца и строки объединенных в один кластер объектов. Таким образом, я не могу понять мне следует рассчитывать среднее в столбцах и строках, или только в столбцах, или только в строках. Но если и в строках и в столбцах одновременно, то какую формулу для расчета срзнач выбрать, как при расчете строк или как при расчете столбцов?
@learningmeansdoing
Жыл бұрын
Когда мы считаем координаты центроидов, то берется среднее значение по каждой переменной отдельно. То есть у вас всегда будет 8 столбцов, они не должны смешиваться друг с другом. Для расчета среднего значения берутся только объекты, принадлежащие определенному кластеру.
@user-ei1xi7ns1u
Жыл бұрын
@@learningmeansdoing Спасибо вам большое.