Statistik : Prof. Dr. Jan Kirenz Variablen und Skalenniveaus Photo Credit: Unsplash, Roman Mager Analytics Grundlagen
Statistik
: Prof. Dr. Jan Kirenz
Variablen und Skalenniveaus
Photo Credit: Unsplash, Roman Mager
Analytics Grundlagen
Prof. Dr. Jan Kirenz
Was ist eigentlich eine Variable?
In der Datenanalyse wird häufig die Bezeichnung Variable verwendet.
Variable
Der Begriff „Variable“ bedeutet dasselbe wie Merkmal.
Prof. Dr. Jan Kirenz
Was ist ein Merkmal?
Merkmale sind bestimmte Informationen (z.B. Alter, Interessen,…) über Personen, die Teil einer Personengruppe (Grundgesamtheit) sind, über die man mehr erfahren möchte.
Merkmal
Unter Grundgesamtheit versteht man die Gesamtmenge aller Personen, über die eine Aussage getroffen werden soll (also die gesamte Zielgruppe).
Prof. Dr. Jan Kirenz
Grundgesamtheit
Tools zur Bestimmung der Grundgesamtheit
Verbraucheranalyse (VA)https://online.mds6.de/mdso6/b4p.php
Facebook Werbeplaner (enthält nur Personen, die bei FB sind)https://www.facebook.com/business/products/ads
Gruner und Jahr Zählservice guj.zaehlservice.de/perl/index.pl
Übersicht über verschiedene Zielgruppenmodellewww.verbraucheranalyse.de/publikationen/zielgruppenmodelle
Prof. Dr. Jan Kirenz
Bei einer Befragung ist ein Merkmal einfach eine gestellte Frage in einem Fragebogen (z.B. Alter, Geschlecht, Nutzung digitaler Medien,…)..
Was bedeutet Ausprägung?
MerkmalsausprägungPhoto Credit: Unsplash, Helloquence
Prof. Dr. Jan Kirenz
Merkmale haben unterschiedliche Ausprägungen.
Was bedeutet Ausprägung?
Merkmalsausprägung
Das Merkmal „Haarfarbe“ kann beispielsweise die Ausprägungen „braun, brünett, …“ haben.
Photo Credit: Unsplash, Helloquence
Prof. Dr. Jan Kirenz
Welche Berechnungen mit Variablen durchgeführt werden können, hängt von deren Skalenniveau ab.
Variablen haben Skalenniveaus
Jede Variable hat ein sogenanntes Skalenniveau. Üblicherweise unterscheidet man zwischen 4 verschiedene Skalenniveaus:
1. Nominal 2. Ordinal3. Intervall4. Verhältnis
Skalenniveau
Prof. Dr. Jan Kirenz
Skalenniveaus: Beispielhafte Fragen
Nominal
Prof. Dr. Jan Kirenz
Skalenniveaus
Eine Variable ist nominalskaliert, wenn die möglichen Ausprägungen nur benannt werden können (sie haben eine „Identität“).
Nominal
„sind die Ausprägungen gleich oder unterschiedlich?“
Prof. Dr. Jan Kirenz
Skalenniveaus
Es ist nicht möglich, die Werte in einer Rangfolge zu bringen.
D.h. die Ausprägungen können nicht „sortiert“ werden (z.B. von klein nach groß).
Nominal
„sind die Ausprägungen gleich oder unterschiedlich?“
Prof. Dr. Jan Kirenz
Skalenniveaus
NominalMit nominalskalierten Daten lassen sich keine Rechenoperationen (Addition, usw.) durchführen, sondern nur Aussagen über Häufigkeiten machen (z.B. wie viele Personen sind weiblich oder männlich?).Beispiele: Geschlecht, Haarfarbe, Augenfarbe, Nationalität, Geburtstort, Telefonnummer,…
Prof. Dr. Jan Kirenz
Skalenniveaus: Beispielhafte Fragen
Ordinal
Prof. Dr. Jan Kirenz
Eine Variable ist ordinalskaliert, wenn die möglichen Ausprägungen in eine Rangfolgegebracht werden können.
„ist eine Ausprägung gleich, kleiner oder größer als eine andere?“
Skalenniveaus
Ordinal
Prof. Dr. Jan Kirenz
Die Abstände zwischen den Werten sind jedoch ohne Aussagekraft.
D.h. es kann nicht bestimmt werden, wieviel besser/schlechter eine Ausprägung im Vergleich zu einer anderen ist.
„ist eine Ausprägung gleich, kleiner oder größer als eine andere?“
Skalenniveaus
Ordinal
Prof. Dr. Jan Kirenz
Werte können sortiert werden. Es können keine Rechenoperationen durchgeführt werden (z.B. Addition und Subtraktion).
Beispiele: Schulnoten, Markenpräferenzen, Einstellungen,…
Skalenniveaus
Ordinal
Prof. Dr. Jan Kirenz
Eine Intervallskala ist eine sinnvolle Rangordnung von Ausprägungen mit gleichen Abständen zwischen den Werten.
„wie groß ist die Differenz zwischen Ausprägungen?“
Skalenniveaus
Intervall
Prof. Dr. Jan Kirenz
Es gibt jedoch keinen „natürlichen" Nullpunkt.
D.h. der Nullpunkt ist willkürlich gesetzt (oftmals gibt es auch negative Werte).
„wie groß ist die Differenz zwischen Ausprägungen?“
Skalenniveaus
Intervall
Prof. Dr. Jan Kirenz
Es können zwar Angaben zur Größe von Unterschieden gemacht werden (zwischen 10 und 20 Grad Celsius beträgt der Unterschied 10 Grad), nicht jedoch zu Verhältnissen: 20 Grad Celsius ist nicht (physikalisch) doppelt so warm wie 10 Grad.
Beispiele: Geburtsjahr, Raumtemperatur in Celsius
Skalenniveaus
Intervall
Prof. Dr. Jan Kirenz
Eine Verhältnisskala ist eine sinnvolle Ordnungvon Messwerten mit gleichen Abständen.
„wie ist das Verhältnis zwischen Ausprägungen?“
Skalenniveaus
Verhältnis
Prof. Dr. Jan Kirenz
Der Nullpunkt ist natürlich.
Eine Ausprägung von 0 bedeutet daher, dass der Messwert nicht vorhanden ist. Es existieren keine negativen Werte.
Skalenniveaus
Verhältnis
„wie ist das Verhältnis zwischen Ausprägungen?“
Prof. Dr. Jan Kirenz
Es können Aussagen über Verhältnissegetroffen werden.
Beispielsweise ist eine 20 Jahre alte Person doppelt so alt wie eine 10 jährige Person.
Beispiele: Alter, Körpergröße, Mediennutzung in Minuten.
Skalenniveaus
Verhältnis
Prof. Dr. Jan Kirenz
Prof. Dr. Jan Kirenz
Übersicht über die SkalenniveausSkalenniveau
Skalenniveau Operationen Interpretation Beispiele
Nominalskala =/≠ gleich oder ungleich
Geschlecht (Mann/Frau)
Ordinalskala =/≠; </> kleiner, gleich oder größer
Schulnoten (sehr gut, gut, …)
Intervallskala =/≠; </>; +/− Bildung von Differenzen
Temperatur (Celsius)
Verhältnisskala =/≠; </>; +/−; ×/÷
Aussagen zu Verhältnissen
Alter (Jahre), Körpergröße (cm)
Prof. Dr. Jan Kirenz
Informationsgehalt
Nicht metrische Daten Metrische Daten
Messniveau Nominalniveau Ordinalniveau Intervallniveau Verhältnis-/ Relationsniveau
Beschreibung der Messwert-eigenschaften
Bestimmung von Gleichheit und Ungleichheit (z.B: A≠B)
Zusätzlich: Bestimmung
einer Rangfolge (z.B. A<B)
Zusätzlich: Gleiche Intervalle
zwischen den Messwerten und
willkürlicher Nullpunkt
(z.B. (10-5)∼ (15-10))
Zusätzlich: Bestimmung von Verhältnissen und
natürlicher Nullpunkt
(z.B. (A÷B) ∼(A=2B)
IdentitätRang
AbstandVerhältnis
x xx
xxx
xxxx
Beispiele für Variablen
Geschlecht, Wochentag,…
Schulnoten, Präferenzen,…
Temperatur, Kalenderzeit,…
Gewicht, Alter, Umsatz,…
Prof. Dr. Jan Kirenz
In einer Umfrage wurden 15 Personen nach ihrem Familienstand befragt
Beispiel
Variable bzw. Merkmal = Familienstand
Ausprägung = ledig, verheiratet, geschieden, verwitwet.
Skalenniveaus
Photo Credit: Unsplash, Helloquence
Prof. Dr. Jan Kirenz
Welches Skalenniveau hat die Variable „Familienstand“?
Frage: Skalenniveau
Folgende Informationen haben wir durch die Befragung erhalten:
Ausprägung = 8 ledig, 4 verheiratet, 2 geschieden, 1 verwitwet.
Photo Credit: Unsplash, Roman Mager
Prof. Dr. Jan Kirenz
Antwort: Skalenniveau = Nominal.
Merkmalsausprägung Häufigkeit
Verheiratet 4
Ledig 8
Geschieden 2
Verwitwet 1
Frage: Skalenniveau
Prof. Dr. Jan Kirenz
Wiederholungsfragen
l In einem Fragebogen wurden die unten aufgeführten Merkmale erhoben. Bitte geben Sie jeweils das entsprechende Skalenniveau pro Merkmal an:
1. Körpergröße : _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
2. Alter: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
3. Geschlecht: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
4. Note in dem Fach Sport: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
5. Punkte (0-100) in der letzten Deutsch-Prüfung: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
6. Nationalität: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
7. Telefonnummer: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
8. Studiengang: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
9. monatliche Miete in Euro: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
10. Entfernung zwischen Wohnung und Arbeitsstätte (in Meter): _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
28