Выбор факторов, влияющих на результативный показатель
Прежде чем строить зависимость между показателем У и набором факторов Хi, необходимо убедиться, что каждый из предложенных факторов действительно оказывает существенное влияние на У. В итоговое уравнение не должны включаться факторы, не влияющие на показатель У, либо сильно взаимозависимые между собой. Критерием нашего отбора будет выступать парный коэффициент корреляции. Обо всем этом вы узнаете из нашего видеоурока
В нашей подборке вы можете найти больше видеоуроков по работе с электронными таблицами Microsoft Excel:
bit.ly/2MecPWZ
Еще больше других обучающих видеоуроков вы сможете найти на нашем сайте: videolections.blogspot.com/
ПОДПИШИСЬ НА КАНАЛ - / studyprof
Мой Twitter - / studyprof_
Мой Instagram - / study_prof
Мой FB - / studyprof
Пікірлер: 41
Дружище, всего тебе самого наилучшего. Твоё видео просто меня спасло, от всей души
Самое понятное объяснение, которое я когда-либо слышала. Большое спасибо!
Спасибо Вам за видеоматериал и внятное объяснение!
Спасибо, освежил знания) Доступно и поэтапно)
Добрый вечер! Замечательное видео. Спасибо! Но у меня такой вопрос (извините, если буду не права): у меня есть 12 анкет с 65 параметрами. Они выбиты в excel с ответами респондентов. При помощи корреляции необходимо отбросить ненужные факторы на основе ответов респондентов (при этом нет зависимой переменной). В случает отсутствия y, как производить отброс факторов между которыми присутствует сильная зависимость (если по y мы не можем сравнить)?
@StudyProf
4 жыл бұрын
Здравствуйте. Берете матрицу размером 65*65 и в каждой ячейке рассчитываете корреляцию между соответствующей парой факторов. Для той пары факторов, где значение будет близким к 1 или -1 один из факторов нужно исключить из рассмотрения
Здравствуйте! Следует ли понимать так, что ежели коэффициент корреляции составил 0,841, то связь между двумя показателями всё-таки есть, просто слабее, чем "соседний"(где 0,85) и данный фактор нельзя сбрасывать со счетов, т.к. он работает? И второй вопрос, если позволите. Не мешают ли нулевые значения, присутствующие в ряде данных? Спасибо.
Excel автоматично считатает таблицу составленную из коэффициентов корреляции. Нужно выбрать вкладку Данные -> Корреляция
Спасибо очень полезный видео
Спасибо, помогли!!!
Доброго времени суток. Хорошо рассказываете. Если коэффициент корреляции по модулю больше 0,85, то он оказывает влияние. Подскажите, пожалуйста, может я пропустил что-то, почему именно 0,85?
@StudyProf
7 жыл бұрын
Здравствуйте. На практике придерживаются такой градации коэффициента корреляции, взятого по модулю: меньше 0,2 - очень слабая корреляция, практически отсутствует; 0,2 - 0,5 - слабая; 0,5 - 0,7 - средняя; 0,7 - 0,9 - сильная; 0,9 - 1,0 - очень сильная. Поскольку в реальной практике редко когда коэффициент корреляции между исследуемыми показателями будет превышать 0,9, считают, что корреляция на уровне 0,8 - 0,9 также достаточно хороший показатель и его можно принимать во внимание
@CooperTony13
7 жыл бұрын
Спасибо за быстрый, подробный и понятный ответ)
Здравствуйте! Подскажите, пожалуйста, что делать, если при выявлении факторов остается только 1 подходящий ? (то есть они все между собой очень сильно коррелируют и их значения больше 0,8) спасибо за ответ!
@StudyProf
6 жыл бұрын
Добрый день. Из теории, если факторы очень сильно коррелируют, то оставляют только один. Так как, зачем нам добавлять в модель другие взаимосвязанные между собой факторы. Но на практике добавление второго фактора может улучшить адекватность вашей модели. Если вам уж очень нужно построить множественную регрессию (с несколькими факторами), то в качестве второго фактора выберите тот, который даст лучшую адекватность полученного уравнения исходным данным. Чтобы проверить адекватность, посмотрите вот этот видеоурок: kzread.info/dash/bejne/iJ12x9agk87InMY.html
@safinson97
6 жыл бұрын
Study Prof спасибо огромное за оперативный ответ!
@milanafortunskaya5875
5 жыл бұрын
Скажи, пожалуйста, как заполнить эту таблицу изначально? Откуда он взял все эти значения?
Здравствуйте! Я пишу работу с использованием многофакторного анализа, хотела бы с Вами посоветоваться на счет технологии. Как с Вами можно было бы связаться?
@StudyProf
7 жыл бұрын
Здравствуйте. Можете изложить ваш вопрос и отправить мне на почту marcellidenumana@gmail.com
Можно подсчитать корреляцию между показателем, выраженным числом и между временем, выраженным датой?
@StudyProf
6 жыл бұрын
Если время выражено в формате даты, то ничего рассчитать не получится. Если время заменить на порядковый номер периода (1, 2, ...), то механически рассчитать можно будет, но такой показатель не будет иметь никакого экономического смысла
@milanafortunskaya5875
5 жыл бұрын
Study Prof , скажите, пожалуйста, откуда он взял эти значения в таблице изначально : 14200,13600, 13800 и т.д.?
подскажите пожалуйста можно ли поставить условие неотрицательности коэффициентов регрессии? и если да, то как. спасибо.
@StudyProf
3 жыл бұрын
Здравствуйте. Метод наименьших квадратов подбирает коэффициенты таким образом, чтобы построенная зависимость максимально хорошо соответствовала исходным наблюдениям. То есть, данный метод предполагает единственное решение. Гипотетически, наложить ваши ограничения на коэффициенты и найти их можно, решив оптимизационную задачу Поиском решений. Но нужно понимать, что полученные ответы не будут уже иметь никакого отношения к методу наименьших квадратов и построенная зависимость может совсем не соответствовать исходным данным.
@bee_dmytro
3 жыл бұрын
@@StudyProf спасибо большое за обширный ответ!
Здравствуйте откуда взяли показатель 0,85??
@user-wr7vn3ve5e
4 жыл бұрын
Анна, вы немного не так задали вопрос. Лучше так: В связи с чем границей для учета/не учета фактора в модели является значение 0,85? Где про это написано (учебник, статья и т.д.)? Х1 и Х2 имеют сильную связь - 0,82 и эта связь очень близка к 0,85. В данном случае я бы строил однофакторную модель, скорее всего от Х1, но можно и от Х2 или Х3, так как связь с Y у всех факторов на высоком уровне. Если строить двухфакторную модель (Х1 и Х2), то тут явно скажется мультиколлинеарность.
у меня вопрос, можно ли с вами связаться по скайпу? интересуют корреляция временного ряда...
@StudyProf
8 жыл бұрын
+Ilya M Опишите пожалуйста более подробно, что конкретно вас интересует. Я так понимаю, речь идет об автокорреляции? Какую задачу нужно решить?
@ilyasikm
8 жыл бұрын
+Study Prof Конечная цель найти взаимосвязи, или же закономерность циклов во временных рядах, допустим есть время - основная составляющая (дата рождения), и есть парни и девушки со своими критериями (многофакторность?) возраст, интересы, и т.д. Найти среди всего временного ряда одинаковые модели по максимальным схожим критериям...
@StudyProf
8 жыл бұрын
+Ilya M То есть, у вас имеется множество объектов (людей), каждый из которых характеризуется набором показателей (возраст, пол, вес, интересы и пр.) И вам нужно находить "похожих людей"? Людей у которых набор показателей имеет общие черты. И вы схожесть между людьми пытаетесь оценить коэффициентом корреляции. Я правильно понял? В данной ситуации у нас динамических рядов нет, так как динамический ряд - это один показатель, который изменяется во времени. А у нас имеется объект со множеством показателей на конкретную дату. В такой ситуации, думаю, коэффициент корреляции вам не поможет. Здесь нужно применять методы распознавания. Рассчитывать расстояния между разными объектами (людьми) и по расстоянию судить о степени их схожести.
@ilyasikm
8 жыл бұрын
+Study Prof Да именно так, поэтому мне показалось что корредяция не справится с этим...Знать бы как это правильно делается...
@StudyProf
8 жыл бұрын
+Ilya M Если вас устраивают вот такие условия консультации videolections.blogspot.com/p/blog-page_3.html, то мы можем обсудить вашу проблему на выходных по скайпу, предварительно договорившись о времени по почте
А как вы заполнили саму таблицу? Пожалуйста, ответьте
@StudyProf
5 жыл бұрын
Здравствуйте. На пересечении строк и столбцов рассчитывается значение корреляции между соответствующими факторами с помощью функции КОРРЕЛ
@milanafortunskaya5875
5 жыл бұрын
Study Prof , спасибо))
А почему межфакторные коэффициенты корреляции вы берете не более 0,85, хотя в учебниках значиться r(xi,xj)
@StudyProf
Жыл бұрын
Добрый день. Чем больше абсолютное значение коэффициента корреляции, тем выше уровень достоверности. Уровень достоверности легко оценить, если возвести полученное значение коеффициента корреляции в квадрат. Полученный показатель назвается коэффициентом детерминации. В вашем случае 0,7*0,7=0,49 или примерно 0,5. То есть, один фактор объясняет дисперсию (колебания) другого на 50%. Если для вас такой уровень достоверности приемлемый, значит можете использовать Ккор=0,7 как пороговое значение. В моем случае 0,85*0,85=0,72. То есть, уже выше 70%. И так далее. То есть, единого порогового значения в природе не существует. Вы сами его определяете исходя из уровня достоверности, который хотите обеспечить в результате расчетов.
Все никак не могу найти нормальные таблицы для практики, может кто-нибудь подкинуть?)
а если все корреляции больше 0,85
@StudyProf
4 жыл бұрын
Здравствуйте. Это означает, что все отобранные вами факторы имеют высокую статистическую взаимосвязь друг с другом. Поэтому, когда вы строите модель, оставлять нужно только один фактор.