Auf der Suche nach Hilfestellungen zu statistischen Auswertungen? Dann wird euch hier mit einer Vielzahl von Tutorial-Videos geholfen. Der Fokus liegt auf SPSS und R. In Microsoft Excel kann man auch sehr viele Analysen durchführen. Abgerundet wird dies mit Tutorials zum wissenschaftlichen Arbeiten bzw. wissenschaftlichen Schreiben mit z.B. Microsoft Word.
Wenn euch das kostenlose Angebot gefällt und ihr den Kanal unterstützen wollt, würde ich mich freuen, wenn ihr über eine Spende nachdenkt oder Kanalmitglied werdet:
⭐ www.paypal.me/BjoernWalther
⭐ kzread.info_BjoernWalther/join
⭐ www.youtube.com/@statorials
Blogbeiträge sowie Datensätze gibt es auf meiner Homepage: www.bjoernwalther.com
HINWEIS: Anfragen zu Methodenberatung können gerne über das Kontaktformular meiner Homepage gestellt werden. Allerdings kann ich aus zeitlichen Gründen keine kostenfreie Beratung leisten.
Пікірлер
Hallo! Bin auf der Suche nach einem Erklärvideo für eine ANCOVA in R. Ich habe für meine Masterarbeit Text A oder B lesen lassen, das wahrgenommene Wissen und das tatsächliche Wissen erfasst. Meine Hypothese ist nun, dass bei Text B mehr wahrgenommenes Wissen bei gleichem tatsächlichen Wissen als bei Text A ist. Darüber hinaus soll ich testen, ob es vielleicht sogar mehr wahrgenommenes Wissen und weniger tatsächliches Wissen gibt. Ich würde mich sehr über ein Video auch bezüglich Voraussetzungstestung und Post hoc Tests freuen. Und was macht man bei Voraussetzungsverletzung? Danke schonmal!
"Weiß" PROCESS, dass beim Modell zwischen einer dichotomen unabhängigen Variablen und einer dichotomen Mediatorvariablen eine logistische Regression durchgeführt werden muss?
Du meinst, dass die AV dichotom ist und dann entsprechend eine binär-logistische Regression gerechnet wird? Wenn ja, ist die Antwort ja. Viele Grüße, Björn.
Hallo, vielen Dank erstmal für die wirklich hilfreichen Videos! Eine Frage: Wenn ich in SPSS einen Fragebogen auswerten möchte anhand Regression/ Korrelation und z.B. die Mitarbeiterorientierung durch 3 Items (M1,M2,M3) gemessen wurde. Alle Items/ Variablen sind ordinal skaliert. Bilde ich für die anschließende Regression/Korrelation den Mittelwert oder die Summe? Oder gar nicht von beidem, da ordinal skaliert? bin tatsächlich ratlos und finde nur diese Lösung.. Über eine Rückmeldung freue ich mich sehr! :)
und nochmal hinterher: wenn ich doch ordinal skalierte items zusammenfasse, bleiben diese doch ordinal? warum werden sie hier metrisch?
Normalerweise gibt das dein Skalenhandbuch vor, ob Summe oder Mittelwert. Zum Skalenniveau: (Bortz, Schuster (2010), S. 22-23) Zusammengefasst: der Skalenmittelwert wird als quasimetrisch angesehen und damit können parametrische Methoden verwendet werden. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank für die Antwort. Eine andere Möglichkeit, wie ich Ordinale Items zusammenfasse, gibt es aber nicht oder? Es geht mir nur darum, ob ich später bei der Korrelationsanalyse nach Spearman oder Pearson rechne, aber da ich durch die Aggregation ja von quasi-metrischen Daten ausgehe, spricht vermutlich alles für Pearson. Oder?
Danke für das tolle Video. Kann ich damit auch die benötigte Stichprobengröße für eine einfache lineare Regression berechnen? (Indem ich bei Anzahl an Prädiktoren einfach 1 nehme) Interessant finde ich: Regorz-Statistik nutzt den T-Test für die Berechnung (linear multiple regression: fixed model, single regression coefficient). Geht beides? Kann eigentlich nicht sein, da andere Werte rauskommen... Muss man das Alphafehlerniveau nicht anpassen, abhängig davon, ob man gerichtete oder ungerichtete Hypothesen hat?
Wenn du einen Prädiktor einträgst, sollte das passen. Alpha ist immer derselbe Wert, unabhängig von der Richtung der Hypothese - nur dein p-Wert halbiert sich bei einseitiger Testung. Allerdings ist der Unterschied zu der Berechnung über Test Family t-Tests genau jener - ob du ein- oder zweiseitig testest. Über Test family F tests ist immer zweiseitig eingestellt und nicht auf einseitig umstellbar. Viele Grüße, Björn.
Danke für das hilfreiche Video! Was bedeutet es wenn in meiner Moderationsanalyse der Interaktionseffekt signfikant ist, jedoch bei model summary der p-Wert des F-Tests über 0.05 liegt?
Hallo Laura, wenn der F-Test keinen hinreichend kleinen p-Wert hat, leistet das Modell keine hinreichend große Aufklärung. Das kann an der Auswahl der Prädiktoren liegen, der Stichprobe usw. Eine Auswahl an Gründen gibt es hier: kzread.info/dash/bejne/pqGGt7aeh5DOhMY.html Die signifikante Interaktion wäre im Falle eines zu hohen p-Wertes beim F-Test daher nicht zu interpretieren. Viele Grüße, Björn.
❤
funktioniert bei mir nicht, da die Datei noch ein € vor jeder Zahl stehen hat und das als Text erkannt wird. Dadurch steht nach JSON überall ERROR
Hy, ich möchte meine Daten in der Spalte Netto von €149.99 zu 149,99 (von Text zu Währung) formatieren. Er erkennt aber den Punkt nicht als Komma, sondern als Zählzeichen für tausender. Wie kann ich das in diesem bearbeitungsfenster lösen?
woran kann es liegen, dass die Wertebeschriftung bei mir nicht funktioniert?Sehe nur die Zahlen und nicht die Antworten dazu.
Hast du Wertelabels vergeben? Siehe hier: kzread.info/dash/bejne/f4N3p5SggcisYLQ.htmlfeature=shared Viele Grüße, Björn.
Ich war mir wedesr des Paketes noch der Funktion bewusst und für mich ist sie ein deal changer. Vielen, vielen Dank.
Danke aber wie ändert man dass nicht immer calibri als Schriftart verwendet wird?
kurz und gut💞
Hi! Kann ich den Spearman auch anwenden, wenn ich eine metrische Skala & eine dichotome Variable korrelieren möchte? Wenn ja, woher weiss SPSS wie er die dichotome Variable „zu bewerten“ hat? Wäre total dankbar über eine Antwort 😊
Super Video, Dankschön 🙏🏻 , hatten korrelationsstatistik im Studium gar nicht und dummerweise habe ich für meine Bachelor Arbeit ein Pilotprojekt gestartet und bei der Auswertung festgestellt dass zwei Ergebnisse wohl signifikant sind und war etwas überfordert 😅 wie gebe ich das Ergebnis jetzt in der Arbeit an? Schreibe ich einfach p<0,05 oder schreibe ich den genauen Wert also z.B. p=3,23755E-08 (mein Ergebnis)? Weiß man dann was gemeint ist? Und für was steht eigentlich das E?
Hallo und danke für dein Lob! Das E bedeutet, dass das Komma verschoben wird. 3,2 E-08 bedeutete, dass es um 8 Stellen nach links verschoben wird, also sehr klein ist. Typischerweise würde ich exakte Signifikanzen angeben, wenn es <0,001 ist, würde ich p<0,001 verwenden. Das hat sich in den meisten Disziplinen eingebürgert. Viele Grüße, Björn.
Dankeschön! Die Videos haben mir immer wieder für meine Masterarbeit geholfen!
Freut mich, wenn meine Videos helfen konnten! :-) Viele Grüße, Björn.
Hallo Björn, vielen Dank für deine super Erklärungen! Leider bin ich mir aktuell sehr unsicher, ob ich meine Daten alle Dummy-kodieren muss, oder ich mit den Ausgangsdaten arbeiten kann. Ich analysiere die Auswirkungen gewisser Kriterien (z.B. Wohnlage) auf den Kaufpreis von Wohnungen. Die Kriterien enthalten jeweils ein 5stufiges Benotungssystem (1-5) mit einer wörtlichen Beschreibung zur Einstufung. Ich dachte eigentlich ich müsste Dummy-Kodieren, jedoch nutzt du in diesem Video (kzread.info/dash/bejne/iIV_pKd_eK_dZso.html) für die 3-stufige Motivation auch keine Dummy-Kodierung. Bei 14 Variablen wäre die multiple Regression mit Dummy-Variablen sehr unübersichtlich. Wie gehe ich in diesem Fall damit um, dass einzelne Dummys nicht signifikant sind? Muss ich dann das komplette Kriterium ausschließen? Kann ich mit dieser Anzahl an Dummy-Variablen auch eine schrittweise Regression (kzread.info/dash/bejne/f56q0Nmco8rectI.html) durchführen?
Hallo Björn, was kann man tun, wenn keine Normalverteilung vorliegt? Mann Whitney U Test? Und wenn ja, fehlt dann nicht der Faktor Zeit? Lg,Max
Hallo Max, das kommt drauf an, wie stark die Verletzung ist. Wenn es nur bei wenigen Zeitpunkten pro Gruppe ist, ist es vernachlässigbar, insbesondere, wenn es sich um eine große Stichprobe handelt. Man kann auch eine rangtransformierte gemsichte ANOVA rechnen, allerdings nur in R. Viele Grüße, Björn.
Ist es immer am besten, eine neutrale Antwort (wie hier 0 = Can't choose) als ersten Wert zu kodieren oder wäre es auch okay, diesen als letzten Punkt zu haben also z.B. 1 = sehr unzufrieden bis 5 = sehr zufrieden und dann 6 = can't choose?
ich versuche nach aufsteigendem Datum zu sortieren und bei mir kommt die Fehlermeldung: Für diese Aktion müssen alle verbundenen Zeilen die selbe Größe haben. Wie kann ich das beheben?
Du bist ein Life saver!
Danke für das Video! Ich habe eine Frage: ich habe aktuell eine Excel Datei bei der Unternehmen und deren ISIN aufgelistet ist. Daneben gibt es Spalten, die den Esg score, environmental score, social score und governance score für die Jahr 2002 bis 2023 ausgeben.. Eine Spalte heißt z.B „ESG score (FY 2002)“ Ich möchte aber dass in den Spalten nur noch das Jahr steht (2002-2023) und zusätzlich eine Spalte hinzugefügt wird, die den „ESG datatype enthält“. Also ob es sich um den esg score, environment score etc handelt. Hast du eine Idee wie ich das umsetzen kann?
Bei mir sind 58 Personen ausgeschlossen von den fragen. Beeinflusst dies mein Crobachs Alpha?
Hallo, die Berechnung von Cronbachs Alpha wird mit listenweisem Fallausschluss vorgenommen. Wenn dann nur noch sehr wenige Beobachtungen verbleiben, kann dies zu einer ungenügenden Berechnung führen. Viele Grüße, Björn.
gibt es eine Möglichkeit, dass ganz rechts nur zahlen und keine längeren Tabellenbeschriftungen stehen? Ansonsten super Video! Ich bin dann noch auf folgendes gekommen: ab und zu wollte er keinen Tabstopp setzen. da hilft dann Strg + Tab. Außerdem sind die Leerzeichen zwischen dem Tabellen-Doppelpunkt und dem Tabstopp wichtig. Bei mir haben die 1,9 cm nicht funktioniert; bei 2 cm war dann alles super. Danke für das Video!
Danke 🫶
Hilfeeeeeeeeeeeeeeeeee😭
Hallo und vielen Dank erstmal für die hilfreichen Videos. Ich habe folgende Frage: In der ersten Erklärstufe des Schemas ist davon die Rede, dass a x b signifikant sein muss. Bedeutet, dass dass beide Regressionskoeffizienten unabhängig voneinander signifikant sein müssen, um hier 'ja' anzunehmen oder werden die Koeffizienten nochmal miteinander verrechnet?
Hallo Sophia, damit ist gemeint, dass beide Pfade jeweils einen hinreichend kleinen p-Wert aufweisen sollten. Viele Grüße, Björn.
Danke
Schüler Adolf, wer kennt´s nicht?
📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]
Verbesserungsvorschlag: Langsamer ;)
Danke für dein Feedback. Im Falle schon veröffentlichter Videos kannst du unten rechts über das Zahnrad die Geschwindigkeit auf z.B. 0,75 verringern. Viele Grüße, Björn.
Hallo Björn, ich hab eine kurze Frage: Wenn man eine Variable hat bei der Mittelwerte gebildet werden sollen und eine hat bei der Summenwerte gebildet werden sollen (Vorschrift der Skalenberechnung von den Autoren). Dann muss man sich daran halten oder? Oder kann es da ansonsten zu Problemen kommen, wenn z.B. Regressionen und Korrelationen berechnet mit einer Variable die aus Summenwerten berechnet wurde und die andere aus Mittelwerten?
Hallo Greta, nein, da kommt es idR nicht zu Problemen bei Folgeberechnungen, also Korrelationen, Regressionen usw. Die Summe ist ja nur eine Transformation des Mittelwertes und umgekehrt. Allerdings gebe ich zu Bedenken, dass bei einzelnen fehlenden Item-Werten der Summenwert potentiell verzerrt ist, sofern kein listenweises Löschen vorgenommen wird. Viele Grüße, Björn.
Die Aussage, dass bei fehlender Signifikanz keine Effektstärke berechnet werden soll, ist völlig falsch. Effektstärken müssen immer in Verbindung mit p-Werten betrachtet werden. Aus dem einfachen Grund, weil p-Werte von der Fallzahl/Stichprobengröße abhängen. Das bedeutet: Jeder noch so kleine Unterschied wird signifikant, wenn ich nur genügend Beobachtungen habe. Um aber beurteilen zu können, wie praxisrelevant der Unterschied ist, brauche ich die Effektstärken. Diese sind unabhängig von der Stichprobengröße und geben Auskunft über die Größe des Unterschieds. Es ist also auch dann sinnvoll und notwendig, eine Effektstärke zu berechnen, wenn der Effekt nicht signifikant ist, um beurteilen zu können, ob einfach zu wenige Beobachtungen vorliegen.
Danke für den Kommenatar, Kristofer. Prinzipiell gebe ich dir Recht und ich predige auch immer, dass der p-Wert nur eine Funktion der Stichprobengröße für Effekte verschieden von 0 ist. Ich war in der Formulierung auch extra vorsichtig: "[...] Und deswegen sollte man auch eigentlich keine Effektstärke berechnen, weil, da wo kein Effekt ist, eine Effektstärke durchaus infrage zu stellen [...]." Ich wiederhole mich auch im Video mit dem infrage zu stellen nur, weil es eben Gutachter und Disziplinen und gibt, die das wieder anders sehen wollen. Einen Konsens gibt es ja selbst bei so grundlegenden Dingen wie dem p-Wert nicht mal. Ich gebe im Zweifel auch immer eine Effektstärke an, weil ein p-Wert für sich genommen einfach zu kurz greift. Im Zweifel sollte man natprlich immer die fachspezifischen Vorgaben befolgen (Seitenhiebe sind erlaubt) und im Vorfeld gerne mithilfe von Tutorials wie oben im Internet zu den Ergebnissen gelangen. Viele Grüße, Björn.
Das Beispiel ist etwas unglücklich. Die Fehler "passieren" beim testen nicht, weil wir eine falsche Stichprobe ziehen, sondern schlicht und ergreifend weil wir "Pech" haben. Nicht "wir machen" einen Fehler (und die Stichprobe wäre natürlich ein schwerer Fehler), sondern der Fehler passiert.
Vielen Dank, sie haben mir sehr weitergeholfen!
Das freut mich! Viele Grüße, Björn.
Wie mache ich das wenn ich eine Likertskala habe (Bewertung 1-5) und mit einer anderen Nominalskala Kreuze. Zb Vollzeit, Teilzeit, geringfügige Beschäftigung. Kann man hier auch eine Signifikanz ausrechnen? Also zb, dass Vollzeit Kräften zufriedener sind als geringfügig beschäftigte. Ich versteh das alles irgendwie nicht. Eine Kreuztabelle habe ich schon aber ich komm statistisch einfach nicht weiter
Danke für das informative Video! Könnte jetzt noch untersuchen welchen Einfluss andere Variablen wie Alter, Geschlecht, Bildung auf die Gruppen haben? Also ich habe einmal meine zwei Gruppen mit den unterschiedlichen Messzeitpunkten und möchte dann noch zusätzlich weitere Einflussfaktoren untersuchen?
Hallo Viktoria, gerne, du kannst im Feld Kovariate noch weitere Einflussfaktoren hinzufügen. Unter dem Button Modell kann man dann noch weitere Interaktionen aufnehmen, sofern sie herleitbar sind. Es müssen auch nicht zwingend nur Interaktionen bestehend aus 2 Variablen sein, sondern können auch beliebig viele sein. Die Haupteffekte müsen übrigens noch mal separat auch dort definiert werden. Viele Grüße, Björn.
ich verstehe nicht wieso auf einmal bei der funktion: rang.mittelwert bei werten von 1 bis 7 auf einmal zahlen wie 44 36 etc. auftauchen??
Ich schreibe gerade meine Bachelorarbeit in Psychologie und mein Erstprüfer möchte die Stichprobengröße anhand meiner vier aufgestellten Hypothesen errechnet haben. Nachfragen meinerseits haben mich nur noch mehr verwirrt. Ich soll anhand verfügbarer Studien die Effektstärke pro Hypothese errechnen und mit der größten Stichprobengröße, die mir g*power gibt, arbeiten. Welche Werte brauche ich genau aus den Studien und wie errechne ich die Effektstärke dann am einfachsten? Was mache ich wenn ich nur eine Gruppe in einer Studie habe? Ich habe zwei Unterschiedshypothesen (Frauen leiden unter mehr Stresssymptomen als Männer & Frauen haben eine höhere wahrgenommene Stressbelastung als Männer) und zwei Zusammenhangshypotehsen (Alkoholkonsum geschlechterübergreifend-> Stresslevel & social support geschlechterübergreifend -> Stresslevel) Für kompetente Hilfe bzw. simple Antworten wäre ich wirklich sehr dankbar!
Hallo, das grundlegende Vorgehen wäre folgendes: 1) Studien raussuchen, die deine Hypothesen schon mal (in etwa so) getestet haben. 2) Prüfen, ob eine Effektstärke angegeben ist. 2a) Wenn ja, diese in G*Power nutzen - je nach Hypothese wird ein unterschiedlicher statistiischer Test gerechnet. Zu allen gängien Test gibt es Videos zu G*Power auf dem Kanal. 2b) Wenn nicht (was der häufigere Fall ist), kann man sie idR aus den gegebenen Daten errechnen, z.B. Cohen's d beim unabhängigen t-Test, und diese dann in G*Power nutzen. 3) Für jede Hypothese wiederholen. 4) Die größte errechnete Stichprobengröße ist dann maßgeblich und bei der Datenerhebung anzustreben. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen lieben Dank für diese top Hilfestellung!
Welcher Test muss berechnet werden, wenn ich zusätzlich zwei Gruppen habe? (Eine KG, eine EG und zwei Messzeitpunkte). Lg, Max
Hallo Max, in dem Fall läuft es auf eine gemischte ANOVA hinaus. Hier ein Video, wo alles zur gemischten ANOVA in SPSS gezeigt wird: kzread.info/dash/bejne/ipVmp8SfntWYYrA.html Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank!
Das ist großartig, genau das habe ich jetzt gebraucht!
📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]
Mein Löwe mein Bär, das Video kommt genau rechtzeitig für mich, vielen Dank!!
Das freut mich! Viel Erfolg damit! Viele Grüße, Björn.
Bei mir werden alle anderen 7 Grafiken der Streudiagramms angezeigt, aber nicht das kategorisierte Punktdiagramm. Bei dem "normalen" lässt sich keine 3. Variable in das "Farbe ändern" - Feld ziehen. Habt ihr eine Lösung für das Problem?
📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]
📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]