Chi-Quadrat-Test in R rechnen - Analysieren von Daten in R (49)

// Chi-Quadrat-Test in R rechnen //
Der Chi-Quadrat-Test prüft, ob bei zwei nominal/ordinalen Merkmalen, zwischen erwarteten und beobachteten Häufigkeiten statistisch signifikante Unterschiede bestehen. Dazu bedient er sich der Chi²-Verteilung. Er wird auch Chi-Quadrat-Unabhängigkeitstest genannt, weil er schaut, ob die beiden Merkmale und deren Ausprägungen unabhängig voneinander auftreten.
Die Nullhypothese lautet, dass es keine statistisch signifikanten Unterschiede zwischen erwarteter und beobachteter Häufigkeit gibt. Demzufolge ist es das Ziel, die Nullhypothese nicht verwerfen zu können, um Gleichheit nachweisen zu können oder sie zu verwerfen, wenn man einen Zusammenhang zwischen den Variablen und deren Ausprägungen zeigen möchte.
HINWEIS: im Video spreche ich fälschlicherweise von den beobachteten Häufigkeiten kleiner 5. Es sollten allerdings die erwarteten Häufigkeiten (unter Annahme von Unabhängigkeit der Merkmale) sein.
Bei Fragen und Anregungen zum Chi-Quadrat-Test in R nutzt bitte die Kommentarfunktion. Ob ihr das Video hilfreich fandet, entscheidet ihr mit einem Daumen nach oben oder unten. #statistikampc
Noch mal zum Nachlesen auf meiner Homepage:
========================================
💡 Chi-Quadrat-Test auf Unabhängigkeit in R:
www.bjoernwalther.com/chi-quadrat-test-in-r-rechnen/
Mehr Tutorials und Begleitmaterial:
============================
🌐Meine Homepage: bjoernwalther.com/
📘 Für die Leser unter euch:
=======================
Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]
⭐Kanalmitglied⭐ werden:
=======================
kzread.info/dron/K1rZmGakkss0bvnxspzg3g.htmljoin
Kanal unterstützen? 🙌🏼
===================
Paypal-Spende: www.paypal.com/paypalme/BjoernWalther/5
Amazon Affiliate-Link: amzn.to/2iBFeG9
Danke für eure Unterstützung! ♥

Пікірлер: 39

  • @StatistikamPC_BjoernWalther
    @StatistikamPC_BjoernWalther4 ай бұрын

    HINWEIS: im Video spreche ich fälschlicherweise von den beobachteten Häufigkeiten kleiner 5. Es sollten allerdings die erwarteten Häufigkeiten (unter Annahme von Unabhängigkeit der Merkmale) sein, für die bei einer Zählung von unter 5 der Fisher-Test empfohlen wird. Ich empfehle pauschal den Fisher-Test anzufordern, um auf der sicheren Seite zu sein. Auch wenn sämtliche erwarteten Häufigkeiten > 5 sind, kann es in Einzelfällen zu Verzerrungen der approximativen Schätzung des p-Wertes kommen und damit einem Fehler 1. oder 2. Art.

  • @cicerawmmxx380
    @cicerawmmxx3803 жыл бұрын

    Deine Videos haben mir dabei geholfen mein Psychologie Studium zu bestehen. Dafür bin ich dir auf ewig dankbar. Ich wünsche dir nur das Beste und Massiven Erfolg. Danke!

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    3 жыл бұрын

    Das freut mich zu hören! :-) Viele Grüße, Björn.

  • @sinisterblister9981

    @sinisterblister9981

    2 жыл бұрын

    @@StatistikamPC_BjoernWalther kann mich dem nur anschließen, hat mir deutlich beim Studienabschluss geholfen. Danke dafür!

  • @djstyro2775
    @djstyro27753 жыл бұрын

    Du hilfst uns Geographen massiv beim Studium danke Meister

  • @laurapetri9243
    @laurapetri92433 жыл бұрын

    Vielen Vielen Dank für die ausführlichen tutorials!!!! Sie retten meine Masterarbeit!

  • @sally0115
    @sally01153 жыл бұрын

    10000 Dank für diese Videos

  • @lena77556
    @lena77556Ай бұрын

    DANKE! Die Videos sind eine große Hilfe. Ich teste gerade meine Hypothesen für die Bachelorarbeit und langsam ist ein Ende in Sicht bei meiner Arbeit. Riesige Hilfe! bin sehr dankbar!! :)

  • @lena77556

    @lena77556

    Ай бұрын

    Hallo Herr @StatistikamPC_BjoernWalther, welchen Statistik-Test kann ich für eine metrische Variable (Alter) und ordinale Variable nehmen? ich hätte schon versucht es selbst herauszufinden, aber nichts passendes gefunden... Danke! und LG!

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    Ай бұрын

    Hallo Lena, was möchtest du untersuchen, also was ist deine Hypothese? Möchtest du sie korrelieren, dann sind Rangkorrelationskoeffizienten wie Spearman oder Kendall's Tau sinnvoll. Sollen Altersunterschiede über deine ordinale Variable untersucht werden, wäre ein Zweistichproben t-Test möglich. Viele Grüße, Björn.

  • @lena77556

    @lena77556

    Ай бұрын

    Hallo Herr Walther, danke für Ihre Rückmeldung (habe ich erst jetzt gesehen). Meine Nullhypothese: Unabhängig vom Alter der Konsumenten, variiert die Wichtigkeit von Rückverfolgbarkeit beim Lebensmitteleinkauf. Alternativhypothese: Abhängig vom Alter der Konsumenten, variiert die Wichtigkeit von Rückverfolgbarkeit beim Lebensmitteleinkauf. Variablen: Alter (metrische Variable), Wichtigkeit von RV (ordinale Variable); Für meine anderen Hypothesen habe ich den Chi²-Quadrat-Test genutzt. Ergänzung: Ich bin mir nicht sicher, ob meine Hypothesen so in Ordnung sind und ob meine statistischen Auswertungen korrekt sind. Das muss ich noch meinem Betreuer zeigen. Die Hypothesen sind nur ein kleiner Teil meiner Arbeit- ich sollte 3 testen. Der Großteil meiner Empirie basiert auf meiner Konsumentenumfrage. Vielleicht können Sie mir trotzdem sagen, welchen Test Sie für am geeignetsten sehen? Laut Ihrem Kommentar vorhin, wird wohl Spearman oder Kendall's Tau sinnvoll sein, oder? Vielen Dank und LG, Lena 🙂

  • @lena77556

    @lena77556

    22 күн бұрын

    @@StatistikamPC_BjoernWalther Hallo Herr Walther! Danke für Ihre Nachricht. Nullhypothese: "Unabhängig vom Alter der Konsumenten, variiert die Wichtigkeit von Rückverfolgbarkeit beim Lebensmitteleinkauf." Alternativhypothese: "Abhängig vom Alter der Konsumenten, variiert die Wichtigkeit von Rückverfolgbarkeit beim Lebensmitteleinkauf." Variablen: Alter (metrische Variable), Wichtigkeit von Rückverfolgbarkeit (ordinale Variable). Laut Ihrer vorherigen Nachricht würden dann: Spearman oder Kendall's Tau funktionieren. Dann muss ich mir diese Videos von Ihnen noch ansehen. Danke! Kenne mich leider nicht sehr gut aus bei der Statistikauswertung, haben die Basics in einem Kurs gelernt. Entschuldigen Sie bitte für die späte Rückmeldung, meine Antwort vorhin hat irgendwie nicht geklappt. LG Lena 🙂

  • @lena77556

    @lena77556

    22 күн бұрын

    @@StatistikamPC_BjoernWalther Hallo Herr Walther! danke für Ihre Nachricht. Nullhypothese: Unabhängig vom Alter der Konsumenten, variiert die Wichtigkeit von Rückverfolgbarkeit beim Lebensmitteleinkauf. Alternativhypothese: Abhängig vom Alter der Konsumenten, variiert die Wichtigkeit von Rückverfolgbarkeit beim Lebensmitteleinkauf. Variablen: Alter (metrische V.), Wichtig von RV (ordinale V.); Laut Ihrem letzten Kommentar wird wohl Spearman oder Kendall's Tau das Richtige sein. Danke! Ich kenne mich leider in der Statistik nicht so gut aus. Komischerweise schreib ich schon zum dritten Mal die AW auf KZread, die ist nach paar Stunden immer weg.. LG Lena :)

  • @gonzillagamer
    @gonzillagamer3 жыл бұрын

    Wirklich sehr gut erklärt vielen Dank!:)

  • @olgah.7507
    @olgah.75073 жыл бұрын

    Wow, das ist ja Mal eine tolle Software! :-)

  • @StatistikamPC_BjoernWalther
    @StatistikamPC_BjoernWalther3 жыл бұрын

    Bei Fragen und Anregungen zu Chi-Quadrat-Test in R rechnen, nutzt bitte die Kommentarfunktion.

  • @manuelleitner3196

    @manuelleitner3196

    3 жыл бұрын

    Ich hätte eine Frage: geht es bei den Werten < 5 nicht um die erwarteten Häufigkeiten (also, dass nicht mehr als 20% der Zellen, erwartete Häufigkeiten

  • @MrRaikyon
    @MrRaikyon2 жыл бұрын

    Tolles Video, eine Frage: ist es nötig eine Kreuztabelle zu erstellen, wenn man die Exceldatei direkt in Rstudio importiert hat und sie als Tabelle im oberen Fenser sieht? Also quasi den Test einfach nur die mit "dateiname$ `relevanter spaltenname etc."? durchführt?

  • @DenikaTheLovely
    @DenikaTheLovely3 жыл бұрын

    Hallo Björn, vielen Dank für das Video! Ich möchte Geschlechtsunterschiede für die sexuelle Orientierung (4-stufig) untersuchen. Der Chi^2 Test wird signifikant, also haben die Männer und Frauen in meiner Stichprobe signifikant unterschiedliche Ausprägungen. Wenn ich jetzt beschreiben will, wo genau der Unterschied liegt (z.B. es gibt mehr Frauen die sich als homosexuell identifizieren als Männer), wie gehe ich dann vor? Vergleiche ich einfach die beobachteten Werte mit den erwarteten Werten bei Unabhängigkeit? Oder brauche ich eine Art "post-hoc Test" um zu schauen bei welchen sexuellen Orientierungen sich Männer und Frauen unterscheiden? Ich würde mich über deine Hilfe sehr freuen! :)

  • @manuelleitner3196
    @manuelleitner31963 жыл бұрын

    Vielen Dank für das Video. Wie kann ich einen Post-Hoc Test rechnen, wenn der Chi-Quadrat-Test signifikant wird, um herauszufinden, zwischen welchen genau Abweichungen von einer Gleichverteilung gibt? LG

  • @marlenestadler4991
    @marlenestadler4991 Жыл бұрын

    erst mal ganz vielen Dank für die vielen so hilfreichen Video's ! Wenn ich den Chi Quadrat Test rechne und den Fisher test.. dann unterscheiden sich die Werte teilweise sehr stark… ich verwende sowohl für den Chi Quadrat als auch den Fisher test schon die Monte Carlo Simulation und hab auch schon bis zu 50000 Simulationen laufen lassen.. wenn die Unterschiede dann immer noch so groß sind ( in 2 Fällen) dann gehe ich nach dem Fisher test letztendlich weil der genauer ist ? würde mich sehr über eine Antwort freuen..

  • @katharinaowls5504
    @katharinaowls55043 жыл бұрын

    Vielen Dank für das tolle Video :-) Eine Frage habe ich noch welcher Unterschied besteht zwischen dem xchisq.test und dem chisq.test in R?

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    3 жыл бұрын

    Hallo Katharina, soweit ich das sehe, hat xchisq.test nur einen erweiterten Output. Der Kern des Tests sollte freilich zum selben Ergebnis kommen. Viele Grüße, Björn.

  • @CundSS
    @CundSS2 жыл бұрын

    Hi, wie ermittle ich hier denn die Effektstärke? (Und allgemeine Frage/Anregung: machst du auch mal ein Video zu einer Post-Hoc Analyse in Multilevel-Analysen)?

  • @beatricelaudensack2440
    @beatricelaudensack24403 жыл бұрын

    Gibt es eine einfache und elegante Methode, die Ergebnisse zu Exportieren? Oder muss man den Consolen-Text per Copy-Paste in seine Thesis einfügen? lg!

  • @burlesqueL
    @burlesqueL3 жыл бұрын

    Hallo :) macht es einen Unterschied, ob die Levels der dichotomem Variable als 0/1 oder 1/2 definiert ist? DANKE!!

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    3 жыл бұрын

    Hallo, nein, das macht keinen Unterschied. Viele Grüße, Björn.

  • @allegrokater
    @allegrokater3 жыл бұрын

    Wie erstellt man in R eine Mittelwerttabelle ?🤷🏻‍♀️

  • @FaxeAxe01
    @FaxeAxe013 жыл бұрын

    was sagt der x-squared wert aus?

  • @user-ci6qw6dc3x
    @user-ci6qw6dc3x4 ай бұрын

    Wenn ich für 2 Stichproben schauen möchte, ob sich die Geschlechterverteilung oder die Verteilung in den Bildungsabschlüssen ähnelt oder unabhängig ist, kqnn ich auch diesen Test nutzen?

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    4 ай бұрын

    Möglicherweise, wenn ich dich richtig verstanden habe. Hast du zwei Merkmale -> Chi²-Unabhängigkeitstest. Hast du ein Merkmal aber eine Information für dieses aus der Grundgesamtheit -> Chi-Quadrat Anpassungstest. Viele Grüße, Björn.

  • @manulasser6281
    @manulasser62813 жыл бұрын

    Wieso klappt bei dir, dass Gröẞe steht und nicht Gr(komische Zeichen)e? Umlaute und Eszett nimmts bei mir nicht an.

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    3 жыл бұрын

    Hallo Manu, ich habe mit read_excel aus einer .xlsx importiert. Bei .csv werden soweit ich weiß Sonderzeichen in keinem sonderlich kompatiblen Format gespeichert. Viele Grüße, Björn.

  • @MS-db9xk
    @MS-db9xk3 жыл бұрын

    Tolle Videos allerdings benötigt man bei dem Interpretationsteil der vorgestellten Themen im Videos Vorwissen.

  • @user-ci6qw6dc3x
    @user-ci6qw6dc3x4 ай бұрын

    Wenn ich etwas recherchiere, dann steht teilweise, dass die erwartete Zellhäufigkeit nicht unter 5 sein darf, du sprichst nun von den beobachteten Häufigkeiten, die nicht kleiner 5 sein sollten. Ich frage mich nun, was stimmt...?

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    4 ай бұрын

    Hallo, ja, das habe ich missverständlich ausgedrückt. Es sind die erwarteten Häufigkeiten

  • @thenotoriousrkf3012
    @thenotoriousrkf30122 жыл бұрын

    Sehr geehrter Herr Walther, vielen Dank für dieses tolle Video und die vielen weiteren, die sie hier zur Verfügung stellen! Ich habe leider auch das Problem, dass teilweise Zellhäufigkeiten von kleiner 5 auftreten. Des Weiteren ist hat eine Variable sehr viele Ausprägungen, weshalb die Berechnung des Fisher-Tests nicht von meinem Rechner durchgeführt werden kann. So erscheint eine Fehlermeldung, dass ich entweder den Workspace vergrößern müsse oder den Parameter 'simulate.p.value' auf TRUE setzen soll. Leider hat auch die Vergrößerung meines Workspaces nicht ausgereicht, um den Fisher-Test durchführen zu können, weshalb ich wohl auf die zweite Variante zurückgreifen muss. In diesem StackOverflow-Beitrag wird auch ein sinnvoller Wert für den Parameter B, also die Anzahl der Wiederholungen in der Monte-Carlo-Simulation genannt: stackoverflow.com/questions/17052639/fisher-test-error-ldstp-is-too-small Gerne würde ich Sie jedoch fragen, was diese "Simulierten p-Werte" bedeuten, wie deren Güte einzuschätzen ist und wie die Resultate im Vergleich zu einem "normalen" Fisher-Test einzuschätzen sind. Über eine Antwort würde ich mich sehr freuen, vielen Dank im Voraus!

  • @StatistikamPC_BjoernWalther

    @StatistikamPC_BjoernWalther

    2 жыл бұрын

    Hallo, in der Dokumentation wird "simulate.p.value = TRUE may then often be sufficient and hence advisable" geschrieben, was auf die Publikation von Patefield (1981) zurückgeht. Ich kann auf das Paper leider nicht zugreifen, vermute aber, dass es hinsichtlich der Güte, wenn überhaupt, nur in wenigen Ausnahmefällen geringe Einschränkungen geben wird. Viele Grüße, Björn.

  • @thenotoriousrkf3012

    @thenotoriousrkf3012

    2 жыл бұрын

    @@StatistikamPC_BjoernWalther Hallo Herr Walter, vielen Dank für Ihre Antwort! Das Paper konnte ich mir tatsächlich über unsere Campus-Lizenz besorgen und werde mich noch einmal mit diesem auseinandersetzen. Jedoch glaube ich auch, dass sich die Güte nicht groß unterscheiden dürfte, aus der Dokumentation geht dies auch teilweise hervor: fisher.test(Job) # 0.7827 fisher.test(Job, simulate.p.value = TRUE, B = 1e5) # also close to 0.78 Viele Dank noch einmal für die Auskunft, Ihnen weiterhin alles Gute und viel Erfolg!