001. Методы сокращения дисперсии, и зачем это нужно - Анатолий Карпов
Доклад с совместного митапа Expfest x Яндекс.Практикум. Про эксперименты
Жүктеу.....
Пікірлер: 22
@user-xo3lb2tl8s3 жыл бұрын
Анатолий Карпов просто супер! Курс на степике от него крайне рекомендую, мастхэв начинающим
@igumnov.daniel
11 ай бұрын
На степике там 1000 и 1 ошибка
@oleksandrasaskia3 жыл бұрын
Очень классный презентующий, просто супер!
@andrewtennikov77602 жыл бұрын
Анатолий всегда на высоте)
@AnklaveRif4 жыл бұрын
Спасибо за материал! Очень полезно.
@denistalko6585 Жыл бұрын
Отличное объяснение, спасибо!
@xarvaksis Жыл бұрын
Спасибо большое. Готовлюсь к собесу. прям круто.
@pavelvashchenko63010 ай бұрын
На 6:45 говорится, что увеличение выборки с 10 до 20 человек даст большее снижение стандартной ошибки среднего, чем увеличение выборки с 100000 до 200000 человек. Что неверно, так как в обеих случаях ошибка среднего унизится в \sqrt{2}...
@satankov3 жыл бұрын
А в случае стратифицированной выборки, когда мы оцениваем среднее, N в знаменателе, это количество классов (по которым мы сгруппировали -- mobile, web, ...) или количество пользователей всего? И как в таком случае оценивать дисперсию: в пределах класса или по всей совокупности? Просто по-другому посчитав среднее дисперсия не уменьшиться, разве не так?
@pazakharov2 жыл бұрын
...и потом считали бы взвешенное среднее, то средние выборочные были бы одинаковы в среднем, но дисперсия выборочных средних... tom, while den had had had had had had had had had had had a better effect on the teacher
@user-lp5uy8kl7f2 жыл бұрын
Ребят - не могли бы Вы мне внести некоторую ясность. В формуле спикера, на мой взгляд, есть некоторая неточность - НА МОЙ взгляд, а именно - при вычислении стандартной ошибки, в числителе стоит сигма, т.е. стандартное отклонение генеральной совокупности, т.е. собственно параметр, КОТОРЫЙ делится на корень из счета выборки. НО! разве в числителе не должно стоять стандартное отклонение ВЫБОРКИ, т.е. статистки. Просто стандартное отклонение генсовокупности - это как раз цель расчета, посредством приближенного вычисление стандартного отклонения выборки (Sx) на корень из счета выборки. Можете меня поправить, если я неверно понял?! Спасибо заранее.
@aleksandrsmurov5135
Жыл бұрын
Мне кажется, все так как ты описал, стандартная ошибка среднего рассчитывается на основе стандартного отклонения по выборке
@user-lp5uy8kl7f
Жыл бұрын
@@aleksandrsmurov5135 СПАСИБО! А то я даже разуверился в верности тех базовых понятий, которые я думал-таки уловил из универа...
@aleksandrsmurov5135
Жыл бұрын
@@user-lp5uy8kl7f можешь просто загуглить для уверенности, там информация вполне доступная, много сайтов с формулами
@n0rmaLman2 жыл бұрын
T-критерий превратился в p-value?
@Israel_Mil Жыл бұрын
Кто это?
@yuriykovalev98337 ай бұрын
«И поэтому внизу корень» - почему, бл*ть, поэтому? Вообще не следит за тем, что говорит, где логика?
@AskoLd1ee3 жыл бұрын
слов много, толку мало, где практика, формулы во второй части?
@IllIll..
2 жыл бұрын
Кому как.
@artur_alf8 ай бұрын
Подскажите. Анатолий говорит, что дисперсия выборки всегда меньше дисперсии генеральной совокупностию. Допустим генеральная совокупность состоит из 10 человек, рост людей. Столько людей осталось на земле. 180, 170, 175, 168, 172, 173, 179, 181, 175, 174. Отсюда возьмем выборку 180, 175, 168, 175, 174. Посчитаем дисперсию с учетом деления на n-1 и получим, что дисперсия по выборке стала больше, чем дисперсия по генеральной совокупности.
@wad881988
5 ай бұрын
Ну скажем так, обычно меньше, или, если еще точнее, то при многократных выборках выборочная дисперсия будет стремиться к значению, меньшему, чем значение дисперсии ген. совокупности. Например мы можем взять выборку 180, 175, 168, 174, и у нее дисперсия будет больше без всякого деления на n-1, но в среднем при многократных выборках она будет стремиться к меньшему значению. Тут суть в том, что дисперсия это сумма квадратов разностей между каждым элементом выборки и выборочным средним (деленная на кол-во элементов), и так получается, что если вместо выборочного среднего подставить любое другое значение (в том числе и среднее генеральной совокупности), то итоговое выражение уже будет больше. А значит при многократных выборках среднее будет стремиться к истинному среднему, а вот дисперсия будет несколько занижена по сравнению с истинной.
Пікірлер: 22
Анатолий Карпов просто супер! Курс на степике от него крайне рекомендую, мастхэв начинающим
@igumnov.daniel
11 ай бұрын
На степике там 1000 и 1 ошибка
Очень классный презентующий, просто супер!
Анатолий всегда на высоте)
Спасибо за материал! Очень полезно.
Отличное объяснение, спасибо!
Спасибо большое. Готовлюсь к собесу. прям круто.
На 6:45 говорится, что увеличение выборки с 10 до 20 человек даст большее снижение стандартной ошибки среднего, чем увеличение выборки с 100000 до 200000 человек. Что неверно, так как в обеих случаях ошибка среднего унизится в \sqrt{2}...
А в случае стратифицированной выборки, когда мы оцениваем среднее, N в знаменателе, это количество классов (по которым мы сгруппировали -- mobile, web, ...) или количество пользователей всего? И как в таком случае оценивать дисперсию: в пределах класса или по всей совокупности? Просто по-другому посчитав среднее дисперсия не уменьшиться, разве не так?
...и потом считали бы взвешенное среднее, то средние выборочные были бы одинаковы в среднем, но дисперсия выборочных средних... tom, while den had had had had had had had had had had had a better effect on the teacher
Ребят - не могли бы Вы мне внести некоторую ясность. В формуле спикера, на мой взгляд, есть некоторая неточность - НА МОЙ взгляд, а именно - при вычислении стандартной ошибки, в числителе стоит сигма, т.е. стандартное отклонение генеральной совокупности, т.е. собственно параметр, КОТОРЫЙ делится на корень из счета выборки. НО! разве в числителе не должно стоять стандартное отклонение ВЫБОРКИ, т.е. статистки. Просто стандартное отклонение генсовокупности - это как раз цель расчета, посредством приближенного вычисление стандартного отклонения выборки (Sx) на корень из счета выборки. Можете меня поправить, если я неверно понял?! Спасибо заранее.
@aleksandrsmurov5135
Жыл бұрын
Мне кажется, все так как ты описал, стандартная ошибка среднего рассчитывается на основе стандартного отклонения по выборке
@user-lp5uy8kl7f
Жыл бұрын
@@aleksandrsmurov5135 СПАСИБО! А то я даже разуверился в верности тех базовых понятий, которые я думал-таки уловил из универа...
@aleksandrsmurov5135
Жыл бұрын
@@user-lp5uy8kl7f можешь просто загуглить для уверенности, там информация вполне доступная, много сайтов с формулами
T-критерий превратился в p-value?
Кто это?
«И поэтому внизу корень» - почему, бл*ть, поэтому? Вообще не следит за тем, что говорит, где логика?
слов много, толку мало, где практика, формулы во второй части?
@IllIll..
2 жыл бұрын
Кому как.
Подскажите. Анатолий говорит, что дисперсия выборки всегда меньше дисперсии генеральной совокупностию. Допустим генеральная совокупность состоит из 10 человек, рост людей. Столько людей осталось на земле. 180, 170, 175, 168, 172, 173, 179, 181, 175, 174. Отсюда возьмем выборку 180, 175, 168, 175, 174. Посчитаем дисперсию с учетом деления на n-1 и получим, что дисперсия по выборке стала больше, чем дисперсия по генеральной совокупности.
@wad881988
5 ай бұрын
Ну скажем так, обычно меньше, или, если еще точнее, то при многократных выборках выборочная дисперсия будет стремиться к значению, меньшему, чем значение дисперсии ген. совокупности. Например мы можем взять выборку 180, 175, 168, 174, и у нее дисперсия будет больше без всякого деления на n-1, но в среднем при многократных выборках она будет стремиться к меньшему значению. Тут суть в том, что дисперсия это сумма квадратов разностей между каждым элементом выборки и выборочным средним (деленная на кол-во элементов), и так получается, что если вместо выборочного среднего подставить любое другое значение (в том числе и среднее генеральной совокупности), то итоговое выражение уже будет больше. А значит при многократных выборках среднее будет стремиться к истинному среднему, а вот дисперсия будет несколько занижена по сравнению с истинной.