Кластерный анализ. Иерархическая кластеризация. Метод k-средних.

0:00 - Введение. Многомерные классификации.
7:25 - Кластерный анализ. Основные сведения.
26:51 - Иерархическая агломеративная кластеризация.
41:24 - Кластеризация методом k-средних (k-means).

Пікірлер: 13

  • @urmat6397
    @urmat63972 ай бұрын

    Спасибо, очень хорошо объяснил

  • @ivansmirnov3950
    @ivansmirnov3950 Жыл бұрын

    Спасибо! Самое понятное объяснение на ютубе. Если у вас будет возможность разберите пожалуйста метод случайного леса.

  • @learningmeansdoing

    @learningmeansdoing

    Жыл бұрын

    Спасибо за хороший отзыв. Про метод случайного леса учту. По возможности сделаю.

  • @user-pq8oo9ye7h
    @user-pq8oo9ye7h2 жыл бұрын

    Добрый день. Спасибо за видео. Отправьте пожалуйста файл excel, в котором производили расчёты.

  • @user-fr8cz7dp4g
    @user-fr8cz7dp4g Жыл бұрын

    Отличное видео, а что же ссылку не дали на ексель документ?

  • @learningmeansdoing

    @learningmeansdoing

    11 ай бұрын

    Спасибо. Да как-то и не спрашивал никто. Цель была показать.

  • @alexeygutsulyak4852
    @alexeygutsulyak48522 жыл бұрын

    А что делать, если у объектов 26 иксов (x1-x26)? Можно как-то с вами проконсултироваться?

  • @learningmeansdoing

    @learningmeansdoing

    2 жыл бұрын

    Если у объектов много иксов, то в целом алгоритм расчета остается прежним. Немного меняется формула расчета расстояний между объектами. Когда у нас было 2 икса, то в формуле Евклидова расстояния для объектов А и В был корень((x1A-x1B)^2 + (x2A-x2B)^2). Если иксов больше, то просто по аналогии добавляйте x3, x4, x5,... Ну и еще один момент в том, что вам не удастся нарисовать точки на графике, так как измерений больше, чем 3 штуки. Придется довольствоваться только результатами расчетов.

  • @user-ei1xi7ns1u
    @user-ei1xi7ns1u Жыл бұрын

    Здравствуйте, подскажите, пожалуйста, как считать по центроидному методу, когда в таблице 8 переменных и 8 объектов: при срзнач, нужно ли скрещивать еще столбцы, или только строки?

  • @learningmeansdoing

    @learningmeansdoing

    Жыл бұрын

    Здравствуйте. Как я понял, речь идёт о методе k-средних? Когда мы считаем координаты центроида, то среднее берется по каждой переменной отдельно, то есть по одному столбцу. В этом столбце выбираем те объекты, которые относятся к данному центроиду.

  • @user-ei1xi7ns1u

    @user-ei1xi7ns1u

    Жыл бұрын

    @@learningmeansdoing О методе древовидной кластеризации. На шаге, когда после создания матрицы евклидового расстояния нужно рассчитать расстояние между кластерами(в моем случае центроидным методом). А ситуация в таблице такова: при объединении двух схожих объектов в один кластер и при расчете по формуле среднего значения, я не могу понять нужно ли рассчитывать только срзнач в строках или в столбцах также, поскольку у меня симметричная матрица 8х8(в том числе исходная матрица такого размера, то есть у меня столбцы от х1 до х8, а у вас от х1 до х2), и возникает пересечение на стыке столбца и строки объединенных в один кластер объектов. Таким образом, я не могу понять мне следует рассчитывать среднее в столбцах и строках, или только в столбцах, или только в строках. Но если и в строках и в столбцах одновременно, то какую формулу для расчета срзнач выбрать, как при расчете строк или как при расчете столбцов?

  • @learningmeansdoing

    @learningmeansdoing

    Жыл бұрын

    Когда мы считаем координаты центроидов, то берется среднее значение по каждой переменной отдельно. То есть у вас всегда будет 8 столбцов, они не должны смешиваться друг с другом. Для расчета среднего значения берутся только объекты, принадлежащие определенному кластеру.

  • @user-ei1xi7ns1u

    @user-ei1xi7ns1u

    Жыл бұрын

    @@learningmeansdoing Спасибо вам большое.

Келесі