Stichprobengröße bei der multiplen linearen Regression mit G*Power

// Stichprobengröße bei der multiplen linearen Regression mit G*Power //
Immer wieder erhalte ich Anfragen, wie groß die Stichprobe denn für (Multiple) Regressionsanalysen sein sollte. Daumenregeln wie 50 oder 75 sind im wahrsten Sinne Daumenregeln und sind meist nicht ausreichend. Auf Basis von Green (1991) und Maxwell (2000) und der sog. statistical power (= 1-Beta), zeige ich in diesem Video, dass die Mindeststichprobengröße für eure multiple Regression besonders von der Anzahl unabhängiger Variablen und deren Korrelation untereinander abhängt. Das Ergebnis dürfte für viele ernüchternd sein, da es sehr große Stichproben sein sollten. Aber keine Angst, ihr liefert unter gewissen Voraussetzungen dennoch einen wichtigen wissenschaftlichen Beitrag, wenn eure Untersuchung in einer Meta-Regression integriert wird.
Zusatzinfos:
==========
Alphafehler: Wahrscheinlichkeit, Nullhypothese abzulehnen, obwohl sie gilt
Betafehler: Wahrscheinlichkeit, Nullhypothese beizubehalten, obwohl die Alternativhypothese gilt
Downloadlink:
============
www.psychologie.hhu.de/arbeit...
Weiterführende Blogbeiträge
=======================
📌 Einführung zu G*Power noch mal zum Nachlesen auf meiner Homepage: www.bjoernwalther.com/eine-ku...
📌Blogbeitrag zur Berechnung: bjoernwalther.com/stichproben...
Literatur:
========
📚 Zhang, Y., Hedo, R., Rivera, A., Rull, R., Richardson, S., & Tu, X. M. (2019). Post hoc power analysis: is it an informative and meaningful analysis?. General psychiatry, 32(4), e100069. doi.org/10.1136/gpsych-2019-1...
⭐Kanalmitglied⭐ werden:
=======================
/ @statistikampc_bjoernw...
Zeitstempel ⏰
============
0:00 Einleitung
0:12 Regression auswählen
0:57 Effektstärke festlegen
2:20 Alpha-Fehler festlegen
2:32 Statistische Power festlegen
2:53 Anzahl Prädiktoren eingeben
2:58 Beispielrechungen
4:09 Ein "Worst Case"
4:47 Fazit
Kanal unterstützen? 🙌🏼
===================
Paypal-Spende: www.paypal.com/paypalme/Bjoer...
Amazon Affiliate-Link: amzn.to/2iBFeG9
Danke für eure Unterstützung! ♥

Пікірлер: 27

  • @Marcus_R
    @Marcus_R2 жыл бұрын

    Kurz, prägnant und so hilfreich! Tausend Dank und weiter so.

  • @salinalulu
    @salinalulu Жыл бұрын

    Ein Video zur Stichprobenziehung für eine logistische Regression mit g power wäre wichtig super :) Deine Videos sind echt eine große Hilfe 👍🏼

  • @larissastahler5777
    @larissastahler57772 жыл бұрын

    Zunächst einmal super und verständlich erklärt! Kannst Du noch ein Video zur Ermittlung der stichprobengröße bei bivariater Regression machen? Also linear bivariate regression: one group, size of slope. Das wäre super

  • @zmindrick1
    @zmindrick12 ай бұрын

    Super vielen Dank. Frage: Ich habe bei meiner explorativen Studie 5 reine exogene Variablen und 2 die endogen und exogen sind. Weiter kommen noch Single-Items wie Geschlecht, Alter, und Dienstjahre hinzu, hier bin ich mir atm noch nicht sicher, ob ich die nicht als Vergleichsparameter zwischen die PLS SEMs setze (also die Modelle mit unterschiedlichen Geschlecht, Altersgruppe etc. durchrechne) gehe ich dann von 7 oder von 10 Prädiktoren aus. Ach ja, es ist eine Masterarbeit in Wirtschaftsinformatik (Technologieakzeptanz mit IAT-Messung und Befragung). Jetzt schon vielen Dank für deine Antwort.

  • @littlejack1310
    @littlejack13102 жыл бұрын

    Hi, erst mal ein dickes Lob und Dankeschön von mir. Der Kanal ist echt super. Ich mache zur Zeit ein Praktikum, in dem ich Regressionsanalysen in R durchführen muss, und deine Videos haben mir echt dabei geholfen, den Uni-Stoff zu reaktivieren bzw. zu erweitern. Vielen Dank dafür. Habe dich dementsprechend auch abonniert. Leider habe ich auf eine zentrale Frage keine Antwort gefunden. Passt nicht ganz zu dem Video hier, aber es geht immerhin um Multivariate Regressionsanalysen in R. Es ist nämlich so, dass ich eine Variable namens "Hochrechnungsfaktor" in meinem Datensatz habe und ich nicht recht weiß, wie ich mit dieser in Bezug auf meine Regressionsanalysen umgehen muss. Zu der Variable selbst: Sie hat Ausprägungen, die zusammen die Anzahl der Grundgesamtheit ergeben. Die einzelnen Ausprägungen dieser Variable sind fast nur Kommazahlen. Diese sind selten kleiner 1 und gehen tlw. auch in die 1000er. Sind Hochrechnungsfaktoren eine Art Gewicht oder ist das was anderes? Und wie muss ich im Kontext der lm()-Funktion damit umgehen. Ich weiß, dass die lm()-Funktion das Argument weights hat. Muss ich dann bei diesem Argument einfach die Variable "Hochrechnungsfaktor" angeben? Oder ist das alles falsch und ich muss mit dem survey-Paket arbeiten? Oder muss ich was ganz anderes machen? Kannst du mir da weiterhelfen oder mir einen Tipp geben, wo ich Infos dazu finde. Habe noch nie mit so komplexen und großen Survey-Daten gearbeitet und bin ein bisschen überfordert.

  • @aldoraine7848
    @aldoraine78487 күн бұрын

    Danke für das tolle Video. Kann ich damit auch die benötigte Stichprobengröße für eine einfache lineare Regression berechnen? (Indem ich bei Anzahl an Prädiktoren einfach 1 nehme) Interessant finde ich: Regorz-Statistik nutzt den T-Test für die Berechnung (linear multiple regression: fixed model, single regression coefficient). Geht beides? Kann eigentlich nicht sein, da andere Werte rauskommen... Muss man das Alphafehlerniveau nicht anpassen, abhängig davon, ob man gerichtete oder ungerichtete Hypothesen hat?

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    4 күн бұрын

    Wenn du einen Prädiktor einträgst, sollte das passen. Alpha ist immer derselbe Wert, unabhängig von der Richtung der Hypothese - nur dein p-Wert halbiert sich bei einseitiger Testung. Allerdings ist der Unterschied zu der Berechnung über Test Family t-Tests genau jener - ob du ein- oder zweiseitig testest. Über Test family F tests ist immer zweiseitig eingestellt und nicht auf einseitig umstellbar. Viele Grüße, Björn.

  • @dilarackr67
    @dilarackr672 жыл бұрын

    Erst einmal vielen Dank für die R- und G-Power-Videos. Die haben mir sehr geholfen. Ich hätte lediglich eine Frage, ob ich bei einer Regression z.B. bei einer Hypothese= Je stärker die Arbeitsmotivation, desto stärker die Arbeitszufriedenheit, bei dem Prädiktor eine "1" eintragen muss?

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    2 жыл бұрын

    Hallo Dilara, jede UV = Prädiktor. Wenn du nur eine Hypothese und damit nur einen Prädiktor hat, trägst du eine 1 ein. Das wäre dann allerdings keine multiple Regression mehr. Viele Grüße, Björn.

  • @aldoraine7848
    @aldoraine7848 Жыл бұрын

    Danke für das tolle Video! Eine Frage hätte ich noch: Soll ich mich für die Angabe der Effektgröße f^2 an dem R^2 oder dem korrigierten R^2 orientieren? Bei vielen Prädiktoren sind diese ja oft deutlich unterschiedlich.

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    Жыл бұрын

    Hallo, du orientierst dich dennoch am normalen R-Quadrat. Viele Grüße, Björn.

  • @bcaster8711
    @bcaster87112 жыл бұрын

    Servus Björn, wie immer perfekt erklärt :) Kurze Frage: Kann ich auch nachträglich eine Power Analyse machen, indem ich mein f^2 über mein berechnetes R^2 hernehme? Muss ich dann das R^2 oder das korrigierte R^2 nehmen? Vielen Dank und LG, Benjamin

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    2 жыл бұрын

    Hallo Benjamin, Poweranalyse im Nachhinein gilt nicht mehr als zeitgemäß und ist im Vorfeld zur Ermittlung der Stichprobengröße anzuwenden, siehe dazu die Literatur in der Beschreibung. Viele Grüße, Björn

  • @bcaster8711

    @bcaster8711

    2 жыл бұрын

    @@StatistikamPC_BjoernWalther Danke Dir für die Antwort :)

  • @Chris18254
    @Chris182542 жыл бұрын

    Super Einführung. Ich habe ein paar Vertiefungsfragen: - Zählt bei einem Experimentaldesign, bei dem die Experimentalbedingungen in Dummies umcodiert werden, jede Gruppe als Prädiktor? Ursprünglich war es ja mal die multikategoriale die Einzelvariable "Versuchsbedingung". - Wie werden Interaktionsterme im Rahmen einer moderierten Regression behandelt? In einem solchen Fäll kämen UVs/Moderatoren ja mehrfach vor, wenn sowohl Interaktionsterme als auch Einzelvariablen als Prädiktoren zählen würde.

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    2 жыл бұрын

    Hallo Christopher, danke für dein Lob! Die Anzahl der aufgenommenen Dummies musst du bei den Prädiktoren ebachten. Wenn du also eine kategoriale Variable mit 3 Ausprägungen hast, nimmst du ja 2 Dummies ins Modell auf. Demzufolge hast du 2 Prädiktoren mehr, die alleinig auf den Dummy zurückzuführen sind. Ähnlich verhält es sich bei einer Interaktion. Bei einer Interaktion nimmst du statistisch betrachtet die X-Variable, die M-Variable und die X*M-Variable als Prädiktor auf. Macht also 3 Prädiktoren. Viele Grüße, Björn.

  • @jamesryan7477
    @jamesryan7477 Жыл бұрын

    Danke für das gute Video! Wie kann ich von einer vorgegebenen Studie das R Quadrat aus dem B (unstandardisierten Regressionskoeffizienten) berechnen? In der Studie, in der der Effekt gefunden wurde beträgt das B=-4.21 und der SE von B ist 2.44. Mehr Angaben liegen leider nicht vor

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    Жыл бұрын

    Hallo, anhand dieser beiden Werte kann kein R² ermittelt werden. Dies muss von Autoren angebenen sein; im Zweifel können vollständige Ergebnisse erfragt werden. Wissenschaftliche Standards verlangen Vollständigkeit der Ergebnisse - unklar, warum "die Hälfte" fehlt. Viele Grüße, Björn.

  • @fabiankieper2456
    @fabiankieper24562 жыл бұрын

    Kann ich dies auch für die A priori Berechnung einer einfachen Moderation nutzen? Müsste ich hierbei 3 Prädiktoren wählen (UV, MED & UV*Med)?

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    2 жыл бұрын

    Hallo Fabian, genau so kannst du es machen. Viele Grüße, Björn.

  • @dustinbottcher9839
    @dustinbottcher98392 жыл бұрын

    Bei Bootstrapping für eine Mediation geht das aber nicht so oder?

  • @dp2xw
    @dp2xw2 ай бұрын

    Hallo Björn, sehr hilfreiches Videos! Eine kurze Frage: Wenn ich ein R2 von .08 habe und umgerechnet ein f2 von 0.09 habe, kann ich dann auch 0.09 eingeben oder muss man hier aufrunden auf einen mittleren Effekt und dann .15 eingeben?

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    2 ай бұрын

    Hallo Greta, danke für dein Feedback. Du verwendest immer den exakten Wert, bei dir also die umgerechneten 0.09, zur Berechnung. Wenn du Grund zur Annahme hast, das der Wert etwas zu hoch für das Modell / die AV ist, kannst du auch noch einen kleinen Abschlag vornehmen. Viele Grüße, Björn.

  • @dp2xw

    @dp2xw

    2 ай бұрын

    Vielen Dank für dein Feedback Björn 😊

  • @dp2xw

    @dp2xw

    Ай бұрын

    Hallo Björn, ich habe doch noch eine Frage: Dürfte man eigentlich auch den angegeben p wert (true score correlation) innerhalb einer Meta Analyse verwenden, um das R2 (das p einfach quadrieren, um R2 zu erhalten) zu berechnen für eine notwendige Stichprobe ?

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    Ай бұрын

    @@dp2xw Hallo, unter true score correlation kenne ich die sog. korrigierte Korrelation bzw,.Attenuitätskorrektur, also die Korrelation geteilt durch das Produkt der Reliabilitäten. Im einfachen linearen Regressionskontext wäre R² die quadrierte Korrelation, nicht aber die quadrierte korrigierte Korrelation. Letzteres würde ich vermutlich nicht verwenden, weil es evtl. zu hohe Effekte annimmt. Schwierig zu beantworten, um ehrlich zu sein. Viele Grüße, Björn.

  • @dp2xw

    @dp2xw

    Ай бұрын

    Okay danke für die hilfreich Antwort 😊. Dann sollte man vielleicht doch eher auf den r Wert innerhalb der Meta Analyse gehen oder lieber keine Meta Analysen heranziehen für die Stichprobenberechnung.