Top Banner
Metodiske overvejelser ved kvantitative analyser IKT Analysegruppen, 2008 Notat om metodiske overvejelser ved kvantitative analyser af Emil Stamp & Anders Mikkelsen IKT Analysegruppe 2008
27

Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Jul 04, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved kvantitative analyser

IKT Analysegruppen, 2008

Notat om metodiske overvejelser ved kvantitative analyser

af

Emil Stamp & Anders Mikkelsen

IKT Analysegruppe 2008

Page 2: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Indholdsfortegnelse Forord ................................................................................................................................................... 1 

1. Valg af kvalitativ eller kvantitativ metode ....................................................................................... 2 

2. Undersøgelsesdesign ........................................................................................................................ 3 

2.1 Undersøgelsesforskning (exploratory research) ......................................................................... 3 

2.2 Beskrivende forskning (descriptive research) ............................................................................ 3 

2.3 Forklarende/kausal forskning (causal research) ......................................................................... 3 

3. Datatyper .......................................................................................................................................... 4 

3.1 Interval skalerede data (tal) ........................................................................................................ 4 

3.2 Ratio skalerede data (tal) ............................................................................................................ 5 

3.3 Nominal data (split-variable) ..................................................................................................... 6 

3.4 Ordinal skalerede data ................................................................................................................ 8 

4. Stikprøven ........................................................................................................................................ 9 

4.1 Stikprøvestørrelse ....................................................................................................................... 9 

4.2 Respondentudvælgelse ............................................................................................................. 10 

4.2.1 Tilfældig stikprøveudvælgelse (Random Sampling) .......................................................... 11 

4.2.2 Klyngestikprøver (Cluster Sampling) ............................................................................... 12 

4.2.3 Stratificeret stikprøve (Stratified Random Sampling) ....................................................... 13 

4.2.4 Bekvemmelig stikprøve (Convenience Sampling) ............................................................. 14 

4.3 Valid og Konsistent .................................................................................................................. 15 

5. Udarbejdelse af spørgeskema......................................................................................................... 16 

5.1 Overvejelser i forbindelse med opsætningen at spørgeskemaet .............................................. 17 

5.2.1 Svarrum ............................................................................................................................. 17 

5.2.2 Tidsrum ............................................................................................................................. 17 

5.2.3 Ledende spørgsmål ........................................................................................................... 17 

5.2.4 Etiske spørgsmål ............................................................................................................... 18 

5.2.5 To spørgsmål – og kun én svarmulighed .......................................................................... 18 

5.2.6 Warming up - spørgsmål ................................................................................................... 18 

5.2.7 ”Ved ikke” svar og svar på vegne af andre ...................................................................... 18 

5.2.8 Irrelevante spørgsmål ....................................................................................................... 18 

5.2.9 Anonymitet ........................................................................................................................ 19 

Page 3: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

5.2 Likert skala ............................................................................................................................... 19 

6. Dataindsamling .............................................................................................................................. 20 

6.1 Data indsamlingsmetoder ......................................................................................................... 21 

6.1.1 Telefon ............................................................................................................................... 21 

6.1.2 Spørgeskema via post – selvudfyldning ............................................................................ 22 

6.1.3 ”Supermarkedsmetoden” – assisteret udfyldelse ............................................................. 22 

6.1.4 Online spørgeskema .......................................................................................................... 23 

6.2 Valg af dataindsamlingsmetode ........................................................................................... 23 

7. Yderligere information og litteratursøgning .................................................................................. 24 

Page 4: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 1

Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere samt Ph.d.-studerende, der står overfor at skulle gennemføre en kvantitativ analyse, hvor undersøgelsens data ønskes indsamlet ved udsendelse af spørgeskemaer. Notatet er primært målrettet til personer, der ingen statistisk erfaring har, og derfor ønsker en introduktion af grundlæggende metodiske overvejelser, som forskeren med fordel vil kunne gøre sig inden dataindsamlingen og analyseprocessen igangsættes. Dele af notatet vil muligvis fremstå som ”børnelærdom” for nogle forskere, men eftersom modtagerne af dette notat antages at have en meget forskelligartet lærings- og erfaringsmæssig baggrund fokuseres der på at beskrive de enkelte emner i en sammenhængende kontekst. Notatet bør imidlertid ikke anvendes som en facitliste eller en simpel step-by-step manual til at udfærdige og gennemføre en kvantitativ analyse. Derimod anbefales det, at bruge notatet som en inspiration til hvilke metodiske og statistiske muligheder, som forskeren gennem undersøgelsesprocessen kan gøre nytte af. Ydermere har notater også til formål at give læseren en forståelse af, at der inden for den kvantitative metode eksisterer en lang række faldgruber, som i værste fald vil kunne lede i forkerte og inkonsistente konklusioner. Notatet er opbygget således, at det gennemgår de faser og de overvejelse som en forsker bør gøre sig i forbindelse med udarbejdelsen af en kvantitativ analyse. Notatet starter med at berøre valget mellem en kvantitativ eller kvalitativ undersøgelse og beskriver hvilke muligheder og karakteristika der er forbundet med de to tilgange. Gennem notatet guides læseren gennem overvejelser vedrørende bl.a. undersøgelsesdesign, valg af datatype, metode til udvælgelse af respondenter samt gode råd til opsætning af selve spørgeskemaet. Under optimale forhold bør det overvejes, om det er muligt at inddrage en statistisk kyndig person i analyseprocessen. Dette notat skal hjælpe forskeren til at gøre sig nogle grundlæggende overvejelser før hele analyseprocessen igangsættes, herunder overvejelse om ekstern assistance. Hvis den pågældende forskers evner og kompetencer ligger udenfor den kvantitative metode bør forskeren ikke afskære sig muligheden for at anvende sådanne metoder. I analyseprocessen er selve identifikationen af problemstillingen det komplekse omdrejningspunkt; “The formulation of a problem is far more often essential than its solution, which may be merely a matter of mathematical or experimental skills. To raise new questions, new possibilities, to regard old problems from a new angle require creative imagination and marks real advance in science”1 Som dette citat antyder, så er der forholdsvis faste rammer for hvorledes forskellige kvantitative metoder skal anvendes – og disse kan forskeren om nødvendigt få assistance til. På denne måde vil forskeren i høj grad kunne koncentrere sig om at anvende sine kernekompetencer i en kvantitativ kontekst.

1 Albert Einstein and L. Infeld, The evolution of Physics. New York: Simon & Schuster, 1938, side 95.

Page 5: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 2

1. Valg af kvalitativ eller kvantitativ metode Valget af metodisk tilgang er meget afgørende for hvorledes hele undersøgelsesprocessen forløber. Forskeren vil oftest meget tidligt i undersøgelsesprocessen afgøre om der skal arbejdes ud fra en kvantitativ eller kvalitativ tilgang og beslutningen herom beror oftest på den enkelte forskers antagelser og forudsætninger vedrørende den konkrete problemstilling. For at træffe det mest korrekte metodevalg er det særdeles vigtigt, at forskeren har kendskab til hvilke analysemuligheder samt hvilke begrænsninger de respektive metoder har. I tabel 1.1 ses en række væsentlig forskelle, der inddrages i overvejelser vedrørende valg at metode. Tabel 1.1 Karakteristika for kvantitativ og kvalitativ metode

Det er væsentlig at notere sig, at formålet med en kvantitativ og kvalitativ metode er forskellige, og det er derfor vigtigt at klargøre, hvad det egentlig formål med selve undersøgelsesprocessen er. I nogle tilfælde kan det være fordelagtigt at gøre nytte af både kvantitative og kvalitative metoder, hvilket i litteraturen beskrives som metodetriangulering.

Kvantitativ metode

Kvalitativ metode

Data-indsamling Observation Optællinger, stikprøve Spørgeteknik Spørgeskema

Observation Feltnoter Spørgeteknik Interview

Data Numeriske Frekvenser, fordelinger

Ikke-nummeriske Interviewudskrifter, collager, fotos, video

Data-analyse Statistiske metoder Beregning af procenter, gennemsnit, korrelationer, regressioner, signifikans-niveauer

Kodning og kategorisering Direkte fremstilling Sammenskrivning Fortolkning

Formål med analyse Forklaring Handler ikke om at forstå, hvorfor folk mener, som de gør. I stedet handler det om at observere og forklare folks holdninger eller adfærd. Årsagssammenhæng og kausaliteter

Forståelse Forstå de overvejelser, tanker og følelser, respondenter gør sig.

Kvalitetskriterier (den korte version)

Reliabilitet Er den tekniske udførelse af undersøgelsen pålidelig? Validitet Måler vi det, vi gerne vil, dvs. er der sammenhæng mellem undersøgelsens forskellige trin?

Troværdighed/Gennemsigtighed Kan andre se, hvordan undersøgelsen er gennemført? Sammenhæng Hænger undersøgelsens successive trin logisk sammen, dvs. undersøger vi det, vi gerne vil?

Page 6: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 3

2. Undersøgelsesdesign Selvom alle undersøgelsesprocesser er forskellig fra hinanden er der dog stadig ligheder der gør det er muligt at kategorisere dem. I opstartsfasen er det væsentlig at klargøre, hvilken type af undersøgelsesdesign man ønsker at udarbejde, hvilket samtidigt også hænger sammen med de målsætninger der er opstillet for undersøgelsen. Der skelnes primært mellem 3 former for undersøgelsesdesign: undersøgelsesforskning, beskrivende forskning og forklarende/kausal forskning.

2.1 Undersøgelsesforskning (exploratory research) Denne type undersøgelse anvendes ofte som et forstudie til en større undersøgelse, hvor man i begyndelsesfasen ikke ved ret meget om den konkrete problemstilling. På baggrund af undersøgelsesforskningen opstilles der ofte begreber og hypoteser til mere omfattende undersøgelser. De data der indsamles defineres som forholdsvis ustrukturerede og ofte anvendes der sekundær data til at skabe et overblik over hvilke variable/faktorer der er af relevans for undersøgelsen.

2.2 Beskrivende forskning (descriptive research) Beskrivende forskning dækker over en tilgang, hvor forskeren direkte ønsker at beskrive udvalgte variable. Formålet med undersøgelsen kan være at give svar på spørgsmål som:

- Hvem? - Hvad? - Hvor? - Hvornår? - Hvordan?

Denne undersøgelsestype beskriver for eksempel forbrugernes holdning, adfærd eller måske antallet af konkurrenter. Oftest anvendes der meget simpel statistik som andele og gennemsnit til at illustrere en bestemt variabel. Et eksempel på beskrivende forskning kunne være hvis DSB ønskede at undersøge ”hvem” der har set den nyeste Harry og Bendtsen reklame eller ”hvor” har folk set den nye reklame?

2.3 Forklarende/kausal forskning (causal research) Kausal forskning er baseret på at teste og bevise relationer og effekter mellem udvalgte variable. På denne måde kan forskeren teste opstillede hypoteser, som eksempelvis antager, at der er en sammenhæng mellem to eller flere variable. Det er oftest dette research design der anvendes i forskningsmæssige sammenhænge, da det giver forskeren et statistisk grundlag for at forklare og bevise formodede sammenhænge og relationer. Et eksempel på en forklarende undersøgelse kunne være hvis TDC ønskede at undersøge om forbrugernes opfattelse af DSB påvirkes af Harry og Bendtsen reklamerne.

Page 7: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 4

3. Datatyper Der findes helt grundlæggende 4 datatyper der kan inddrages i et spørgeskema: nominal, ordinal, internal og ratio. Hvilke datatyper der er optimale, er afhængig af de resultater man ønsker at ende ud med i den sidste ende. Når man laver en spørgeskemaundersøgelse, er det derfor generelt en god idé at starte ”baglæns”. Dvs. at starte med at spørge:

- Hvad vil jeg gerne have svar på? (Research Questions) - Hvilke analyser kræver disse svar?

Hvilket leder til spørgsmålet:

- Hvilke datatyper kræver denne slags analyser? - Kan jeg stille et spørgsmål så det giver mig den rigtige datatype?

Disse datatyper bør så danne udgangspunkt for spørgerammen og selve udarbejdelsen af spørgeskemaet. Mange forskere uden kendskab og erfaring med kvantitativ metode begår ofte den fejl at spørgeskemaet opstilles og udsendes, uden at man har gjort sig nogle tanker om, hvad man egentlig ønsker at vide noget om. Dette resulterer uheldigvis i, at man i selve analyseprocessen ikke har mulighed for at udarbejde de analysemodeller, som ville kunne give svar på de opstillede undersøgelsesspørgsmål. Denne fase af undersøgelsesprocessen er et kritisk punkt, hvor det er meget væsentligt, at forskeren får identificerede de korrekte og mest effektive datatyper. Det kan derfor være en fordel i netop denne fase at involvere en statistisk kompetent person, som vil kunne hjælpe med at identificere hvilke typer af data der skal indhentes for at kunne udføre de ønskede statistiske analyser. Ofte fravælges den eksterne support grundet knappe ressourcer, men virkeligheden er ofte, at de ganske få metodevejledningstimer der investeres i starten af undersøgelsesprocessen oftest bliver betalt mange gange igen. Både i form af bedre resultater, men også af en mere effektiv analyseproces. De forskellige datatyper beskrives i det følgende, og der gives eksempler på, hvorledes de enkelte datatyper kan opstilles i et spørgeskema.

3.1 Interval skalerede data (tal) Den mest umiddelbare form for data i en spørgeskemaundersøgelse er naturligvis tal. Fordelen ved intervalskalerede data er, at det er muligt at bedømme ”afstanden” mellem de forskellige udfald. Der skelnes mellem interval skalerede tal, som behandles i dette afsnit og ratio tal, som behandles i afsnit 3.2. Den mest intuitive måde at forstå hvad interval skalerede data er ved at se dette eksempel: Hvor enig er du i følgende udsagn? Helt Uenig Helt enig Jeg elsker at lave mad 1 2 3 4 5 Jeg dyrker meget sport 1 2 3 4 5 Jeg ser aldrig fjernsyn 1 2 3 4 5

Page 8: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 5

Eksempelet giver respondenten mulighed for at svare indenfor et givet interval, som går fra 1-5. Det er karakteristisk for interval data, at der ikke eksisterer et egentlig startpunkt og det er netop derved, at interval adskiller sig fra ration skalerede data. Bag holdningerne ”Helt uenig” til ”Helt enig” ligger der en skjult ”karakterskala”, hvor 1 repræsenterer Meget Uenig og 2 Uenig etc. Dette gør det muligt, at anvende interval skalerede data i statistiske analyser og beregninger. Det gør det muligt blandt andet at lave gennemsnit samt inddrage spørgsmålene i nogle andre analyser. Det er ofte denne slags spørgsmål der fylder mest i et spørgeskema, og det er typisk også dem, der er mest krævende for respondenterne, idet disse er tvunget til at tage stilling til nye påstande og meninger hele tiden. Dog er det ofte også disse der er de mest interessante, når specielt sprog- og kommunikationsforskere laver deres undersøgelser. Dog skal man være meget opmærksom på, ikke at lade det løbe løbsk. Et spørgeskema med 200 af denne slags spørgsmål virker voldsomt uoverskueligt for respondenten. Samtidig bør man være kritisk og kun stille de spørgsmål der virkelig skærer ind til benet af den/de hypoteser man vil undersøge. Teknisk set er der en forskel på interval og ratioskaleret data. I analysesammenhæng kan interval skaleret data dog approksimativt anvendes til de samme analyseredskaber, som anvendes til ratio skalerede data. Derfor vil de analyseredskaber, som beskrives i slutningen af afsnit 3.2 også kunne anvendes på interval skalerede data.

3.2 Ratio skalerede data (tal) Ratio skalerede data er karakteriseret ved at angive den aktuelle værdi af en variabel, hvilket betyder at denne har et naturligt nulpunkt. Dette kan eksempelvis være højde i cm, indtægt i kroner, vægt i kg etc. Disse data er faktuelle tal, der ikke er udsat for hverken vurdering eller skøn. Inden man stiller spørgsmålet bør man dog overveje om det er realistisk at respondenten kan svare korrekt, f.eks. ”Hvor mange penge brugte du sidste år på indkøb af mælk?” De fleste respondenter vil ikke kunne svare præcist på dette spørgsmål, så man bør være opmærksom på, at respondenten muligvis ikke lige sidder med tallene ved hånden eller i hovedet. Dette kan give respondenten grund til undgå at besvare spørgsmålet eller give et ukorrekt svar. I et spørgeskema kunne ratio skalerede spørgsmål se således ud: Hvor gammel er du? _____ Hvor mange penge bruger du ca. på mad om ugen? _____ Hvor mange gange handlede du ind i sidste uge? 0 1 2 3 4 Flere (_____)

Page 9: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 6

Som det ses, er der mange muligheder for at indhente ratio data og det er endda muligt at ”hjælpe respondenten til at huske ved at opstille potentielle svar. Ratio data giver uendeligt mange analysemuligheder. Oftest beregnes gennemsnit, varians og standard afvigelse, da disse giver om en beskrivende information om de pågældende data. Hvis man f.eks. har lavet to spørgsmål, som er ratio skalerede, så kunne det undersøges om der er en sammenhæng mellem de to spørgsmål, hvilket kaldes korrelation. I eksemplet har vi indsamlet data på respondentens alder (”Hvor gammel er du?”) og på hvor mange penge respondenten bruger på mad om ugen. (”Hvor mange penge bruger du ca. på mad om ugen). Hvis vi ønsker at undersøge om der er en sammenhæng/korrelation mellem respondentens alder og respondentens ugentlige forbrug på mad kan vi regne en korrelationskoefficient. Korrelationskoefficienten ligger altid mellem -1 og 1, hvor; 1: Positiv korreleret 0: Ingen korrelation -1: Negativ korreleret I eksemplet på korrelation mellem alder og ugentlig forbrug på mad kan det antages at vi ville få en korrelationskoefficient på 0,55. Dette ville fortælle, at der er en positiv korrelation, hvilket betyder, at jo ældre man er des højere er ens ugentlige forbrug på mad. På sammen måde som korrelationskoefficienten kan man også anvende Simpel Regression til at forklare sammenhængen mellem forskellige variable/(spørgsmål). Ved simpel regression kunne vi have forklaret størrelse af respondenternes ugentlige forbrug på mad ud fra deres alder. Hvis vi derimod ønskede at undersøge om der er flere faktorer, som påvirker respondenternes ugentlig forbrug på mad, så kunne vi anvende en multipel regression. I en sådan analyse kunne man evt. foruden variablen Alder også anvende variablen, ”Hvor mange gange handlede du ind i sidste uge?”. På denne måde kan man altså undersøge om de to variable Alder og Antal handler i sidste uge kan forklare respondentens Ugentlige forbrug på mad.

3.3 Nominal data (split-variable) Nominal data kaldes også for kategoriske data eller spilt-variable, hvilket skyldes at de kan anvendes til at opdele respondentmassen. Disse nominale variable klassificerer respondenterne på eksempelvis demografiske variable som køn, religion, bopæl, og det det er karakteristisk, at der kun er et forudbestemt antal udfald. Variablen ”landsdel” kunne eventuelt have følgende mulige udfald: 1=Jylland 2=Fyn 3=Øerne Variable som ”køber/ikke-køber” og ”ja/nej” spørgsmål klassificeres også som nominal data, da man herved også har et begrænset antal svarmuligheder.

Page 10: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 7

I sig selv giver nominal data ikke store muligheder for at fortage avancerede analytiske tests. Trods dette er disse variable dog ofte særdeles anvendelig, da de kan anvendes til at ”splitte” sine analyser op. Eksempelvis kan man undersøge om der forskel på mænds og kvinders holdning til den nyeste DSB reklame. Endvidere ville man også kunne bruge bopælen til at undersøge om der er forskellige geografiske tendenser – altså om folk holdning er anderledes i Jylland end på Fyn. Denne slags ”split-spørgsmål” kan naturligvis også være mere emne-specifikke. Eksempelvis kunne et spørgeskema om indkøbsmuligheder, medtage en klassificering af butikstypen (discount, supermarked etc.). Tal data (interval skalerede data), som beskrevet i afsnit 3.1, kan godt transformeres til klassifikationsdata (nominal data). Dette sker ved at opdele sine tal data ud til forskellige grupper. F.eks. kan variablen ”indkomst” opdeles følgende grupperne:

• Personer der tjener op til 240.000 før skat om året • Personer der tjener mellem 240.000 og 400.000 før skat om året • Personer der tjener mere end 400.000 før skat om året

Denne nye klassifikationsvariabel har så 3 udfald, dvs. vi har 3 forskellige indkomsttyper: Lav indkomst = 1 Middel indkomst = 2 Høj indkomst = 3 I et spørgeskema kunne man indhente nominal data ved at stille følgende spørgsmål: 1.Angiv dit køn: Mand __X__ Kvinde ______ 2. Hvilke af følgende mærker kenders du? Nike _____ Adidas __X__ Puma _____ Reebok _____ Hummel __X__ 3. Har du tidligere købt Hummel tøj? Ja _____ Nej __X__

Page 11: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 8

For at beskrive normal data anvendes oftest Andele, eller den procentvise andel af en stikprøve. Dette beskriver hvor mange ud af en stikprøve, som har et givet karakteristika. I Eksemplet blev respondenten bedt om at angive sit køn. Derved er det muligt, at udregne andelen af f.eks. kvinder ud af alle respondenterne i stikprøven. Hvis der er 100 respondenter i stikprøven og deraf har 55 angivet at der er kvinder, så kan den procentvise andel udregnes til 55%. Inden for statistik kan man ikke afgøre om to andele er forskellige fra hinanden ved bare at konkludere ud fra den beregnede andel. I eksemplet med respondenternes køn kan vi udregne andelene til at være: kvinder = 55% og mænd=45%. Selvom det ser ud som om, at der er en forskel, så kan denne forskel skyldes tilfældighed. Det er derfor muligt at test om to andele er signifikant forskellige fra hinanden.

3.4 Ordinal skalerede data Denne datatype tvinger respondenten til at rangere deres svar. Det giver forskere mulighed for at vurdere hvad respondenten vægter højere end andet. De ordinal skalerede data angiver dog ikke ”afstanden”, hvilket bedst illustreres ved dette eksempel: Rangér disse lande efter hvor du helst vil holde ferie, hvor 1= Første valg og 2=Andet valg etc. Spanien __2__ Tyskland __1__ Frankrig __5__ Holland __4__ Danmark __3__ Rangér disse sportsmærker efter din smag, hvor 1= Første valg og 2=Andet valg etc. Hummel __1__ Adidas __4__ Nike __3__ Puma __5__ Reebok __2__ Ved denne rangering kan vi altså se, at respondenten hellere vil til Tyskland end til Spanien, men det er ikke muligt at konkludere, ”hvor meget” hellere respondenten vil til Tyskland end til Spanien. Med andre ord kan man altså ikke måle ”afstanden”. Ønskes dette bør man i stedet anvende interval skaleret data. Der findes dog diverse statistiske test, som vil kunne afgøre om der er en forskel i hvorledes et større antal respondenter rangerer disse 5 lande (Kruskal Wallis Test)

Page 12: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 9

4. Stikprøven Hvis en undersøgelsens formål er at kunne udtale sig om en den fulde population kunne forskeren starte fra en ende af og udspørge alle de personer, som er inkluderet i populationen. I mange tilfælde er populationen så stor, at dette rent praktisk ikke er umuligt. Et eksempel kunne være, hvis man ønsker at undersøge: ”hvilken rolle fisk spiller i danskernes kost”. Til denne undersøgelse er hele Danmarks befolkning populationen, som man ønsker at udtale sig om. Dog ville det være ekstremt tidkrævende og omkostningsfuldt at spørge alle mennesker i Danmark. Derfor udvælger man en stikprøve, for ikke at skulle involvere så mange mennesker i undersøgelsen. Denne stikprøve skal være repræsentativ, således at den afspejler den fulde population. For at stikprøven er repræsentativ, er det derfor af største vigtighed, at stikprøven udvælges korrekt. Population Stikprøve ”Sampling Error” er en af de faldgrupper, som forskere uden kvantitativ erfaring navnlig bør have fokus på. Betegnelsen sample error dækker over det utal af fejl og unøjagtigheder, der kan opstå, som følge af forkert stikprøvestørrelse eller stikprøveudvælgelse. I løbet at hele undersøgelsesprocessen bør forskeren kontinuerligt vurdere om den indsamlede data, altså stikprøven, stemmer over ens med den population, som man ønsker at undersøge og udtale sig omkring. I forhold tidligere eksempel omkring hvilken rolle fisk spiller i danskernes kost, er det f.eks. væsentligt at vurdere hvilke typer af respondenter, som stikprøven består af. Hvis stikprøvens respondenter f.eks. kun består af kvinder, så ville den ikke være repræsentativ for Danmarks befolkning. Fasen som omhandler fastlæggelse undersøgelsens stikprøvestørrelse og stikprøveudvælgelse er af meget stor vigtighed. Det kan derfor være anbefalelsesværdigt at inddrage en person, som har erfaring med fastlæggelse af stikprøvestørrelse og udvælgelse af respondenter.

4.1 Stikprøvestørrelse Det er stort set umuligt at sætte en magisk grænse på hvor mange respondenter der er ”nok” for en undersøgelse. Dette afhænger ganske enkelt af analysebehovet. Dog er der nogle ting man kan/skal være opmærksom på i forbindelse med dette emne. Det er svært at bevise noget statistisk med meget få respondenter. Har man en undersøgelse med 10-15 svar, er det meget svært at drage nogle brugbare konklusioner. Derfor bør man stræbe efter et noget højere antal. Undersøgelsens formål er ligeledes vigtig i forhold til hvor mange respondenter man bør have. Er der tale om en forskningsartikel hvor man ønsker at kunne bevise nogle opstillede hypoteser, stilles der relativt store krav til respondentmassen. Er man derimod blot i gang med at

Page 13: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 10

foretage en præliminær undersøgelse, der skal forsøge at kortligge nogle grundlæggende tendenser, er kravene til respondentmassen knap så store. Der findes statistiske formler, der kan give et estimat på den optimale stikprøvestørrelse ud fra de givne forhold. Disse er dog yderst komplicerede og beror på en betingelse om, at man kender den endelige population, så disse vil ikke blive gennemgået i dette notat. Det er dog stadigt værdifuldt rent intuitivt at kunne danne sig en ide om, hvor mange respondenter der skal indgå i stikprøven. Hvis man kunne interviewe alle personen i populationen ville man have en Sampling Error = 0. Så målet er altså at minimere Sample Error. Via figur 4.1 ses det, at Sample Error falder, når vi øger antallet respondenter (horisontale akse), hvilket er logisk da man herved kommer tættere og tættere på den endelige population. Det der er værd at bemærke fra figur 4.1 er, at kurver falder meget kraftigt i starten, hvorefter den flader ud, når vi når en stikprøvestørrelse på 1000 respondenter. Figur 4.1 Marginal Sampling Error ved stigende stikprøvestørrelser

Den faldende kurve skal forstås på den måde, at i starten fra 50-100 respondenter falder Sampling Error meget kraftigt fra 7% til ca. 5%. Men øget vi antallet på 500-550 respondenter, så falder Sampling Error kun med ganske lidt, måske 0,1%. I denne illustration er det ikke procenterne det er væsentlige, men forståelsen af, at det er de første respondenter, som er de ”vigtigste”. Med andre ord betyder det altså, at det ikke betyder så meget om man interviewer 50 respondenter mere, hvis man allerede har interviewet 500, som det gør hvis man kun har interviewet 50.

4.2 Respondentudvælgelse Det er de færreste der er i tvivl om målgruppen for deres undersøgelse. Dog kan det være svært at vælge hvorvidt man ønsker at undersøge hele ens målgruppe (populationen) eller om man ønsker at udvælge en del af denne i form af en stikprøve. I tilfældet hvor der vælges en stikprøve (hvilket man ofte gør) melder der sig nye spørgsmål: Hvordan skal de vælges?

Page 14: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 11

Det er vigtigt at have i tankerne, at hvis man ønsker at udvælge en stikprøve, for f.eks. at kunne udtale sig om alle danskere, så er det vigtigt at få stor variation i sine respondenter. Ønskes der f.eks. at undersøge danskernes præferencer for økologiske varer, ville det ikke repræsentative resultater (med henblik på at kunne generalisere til alle danskere), hvis der kun anvendes respondenter i aldersgruppen 18 – 25 år, som bor i Århus. Dette ville højst sandsynligt give et misvisende resultat, da en stor del af disse formentligt ville være studerende, som ofte har færre penge til rådighed end gennemsnits personen, og derfor sjældent købe dyre økologiske varer. Dette resultat ville altså ikke repræsentere hele den danske befolkning. Der eksisterer en lang række sofistikerede metoder til at udvælge sine respondenter til en given stikprøve. I dette notat præsenteres de mest anvendte metoder ud fra grafiske illustrationer, som viser hvorledes stikprøven vælges ud fra en population. Figur 4.2 viser en population, som f.eks. kunne være en skoleklasse på 25 elever. Hvis det antages, at alle eleverne er blevet introduceret til en ny sodavand ved navn Koka Kola, som de har fået lov til at smage. Derefter er de blevet bedt om at angive deres mening om smagen af den nye sodavand. Super god Ikke noget specielt Forfærdelig Figur 4.2 Endelig population

Som tidligere beskrevet er det oftest umuligt at spørge alle i populationen, og hvis det derfor antages, at stikprøvestørrelsen er blevet fastlagt til 5 respondenter kan vi derefter udvælge respondenterne. Her står valget mellem følgende metoder for stikprøveudvælgelse.

4.2.1 Tilfældig stikprøveudvælgelse (Random Sampling) Ved tilfældig stikprøve udvælgelse har alle respondenter i populationen samme sandsynlighed for at blive valgt. I praksis findes der et uendeligt antal måder til at udvælge sine respondenter ved tilfældig stikprøveudvælgelse, men omdrejningspunktet er, at alle respondenter skal have samme sandsynlighed for at blive valgt. En oftest anvendt metode er lodtrækning – illustreret på den måde,

Page 15: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 12

at navnene på alle respondenterne (30) lægges i en ”pose”, hvorefter der udtrækkes det antal respondenter, som man har valgt at stikprøven skal udgøre (5). Sandsynligheden for at en given respondent udvælges kan derfor beregnes efter følgende formal:

Sandsynlighed for udvælgelse = Stikprøvestørrelse / Populationsstørrelse Tilfældig stikprøveudvælgelse er meget nem at anvende, og bør i de fleste tilfælde opfylde kravet om, at stikprøven skal være repræsentativ for populationen. Dog er det altid meget væsentlig, at man i forbindelse med valg af metode for stikprøveudvælgelse gør sig nogle overvejelser om, hvorledes den endelige population ser ud. I figur 4.3 ses det, at de 5 respondenter er valgt tilfældigt fra populationen, og stikprøven kan nu anvendes til at give et billede på, hvorledes populationen ser ud. Population Tilfældig udvalgt stikprøve Figur 4.3 Tilfældig stikprøveudvælgelse

Som tidligere antaget har vi i dette eksempel kun ressourcer til at spørge 5 respondenter om deres mening. Selvom disse 5 respondenter ikke giver et total korrekt billede af, hvorledes den endelige population ser ud, så er det stadigt muligt at få en indikation af, hvorledes den endelige population på 25 respondenter der ud.

4.2.2 Klyngestikprøver (Cluster Sampling) Klyngestikprøver anvendes, hvis det antages, at populationen kan opdeles i mindre sub-grupper. Et eksempel kunne være en klasse på 25 elever, hvor eleverne er delt op i grupper på 5, således at der eksisterer 6 grupper (A, B, C, D og E). Hvis det antages at sammensætningen af grupperne er

Page 16: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 13

Figur 4.4 Klynge stikprøveudvælgelse A Klynge stikprøve B C D E nogenlunde ens, så vælges ved tilfældig udvælgelse f.eks. 2 af grupperne. Fra disse 2 grupper udvælges derefter tilfældigt det antal respondenter, som skal bruges. Dvs. sandsynligheden for at den enkelte gruppe bliver valgt er ens for alle grupperne og sandsynligheden for, at den enkelte respondent fra en af de valgte grupper bliver valgt, er også ens for respondenterne i de udvalgte grupper. I klyngeudvælgelse anvendes ofte geografiske arealer, som antages at være nogenlunde ens. Hvis man f.eks. ville have respondenter fra et bestemt byområde, kunne man evt. opdele disse efter forskellige villakvarterer. Derefter ville man ved tilfældigudvælgelse kunne udvælge f.eks. 2 villakvarterer, hvorfra man kunne udtrække respondenter. På denne måde ville man kun skulle ”besøge” 2 af villakvartererne frem for (hvis vi havde anvendt almindelig tilfældig stikprøveudvælgelse) at skulle ”besøge” dem alle. Klyngestikprøve anvendes derfor nogle gange frem for almindelig tilfældig udvælgelse, da den kan være mindre ressourcekrævende.

4.2.3 Stratificeret stikprøve (Stratified Random Sampling) En stratificeret stikprøve anvendes når der er stor forskel i populationen. Hvis det er antages, at der i en klasse går 25 elever, hvor 15 er mænd og 10 er kvinder. Hvis det antages, at der kunne være en forskel i hvad kvinder og mænd mener, at man konstruerer stikprøve, således at man tager højde for at der er et større antal mænd end kvinder i klassen. Med andre ord, så deles populationen altså op en to heterogene sub-grupper. Antallet af respondenter der vælges fra hver af sub-grupperne afhænger af, hvor mange respondenter der er i den enkelte gruppe. Hvis det antages at stikprøvestørrelsen er fastsat til 5 respondenter, så kan antallet af respondenter til hver sub-gruppe udregnes som følgende:

(Antal personer i sub-gruppen / Populationen) * Samlet stikprøvestørrelse

Page 17: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 14

Mand: (15/25) * 5 = 3 respondenter Kvinde: (10/25) * 5 = 2 respondenter Figur 4.5 stratificeret stikprøveudvælgelse

Stratificeret stikprøve Mand Kvinde Respondenterne fra den enkelte sub-grupper udvælges derefter tilfældigt, således at respondenterne i sub-gruppe ”mand” alle har samme sandsynlighed for at blive valgt.

4.2.4 Bekvemmelig stikprøve (Convenience Sampling) I nogle tilfælde er ressourcerne til dataindsamling meget begrænsede, og det kan derfor være nødvendigt, at gå på kompromis med repræsentativiteten af stikprøven. I disse tilfælde er det muligt at udføre en bekvemmelig stikprøve. Et eksempel på en bekvemmelig stikprøve kunne være, hvis man stiller sig i indgangen til Føtex og spørger forbipasserende kunder. Som figur 4.6 viser kommer man til at interviewe folk netop handler i Føtex denne dag, hvilket er illustreret ved, at man kun undersøger nederste venstre hjørne af populationen. Figur 4.6 Bekvemmelig stikprøveudvælgelse Bekvemmeligheds stikprøve

Når bekvemmelig stikprøveudvælgelse anvendes er det meget vigtigt, at man er opmærksom på, at stikprøven muligvis ikke er repræsentativ for hele populationen. Denne form for stikprøveudvælgelse er dog stadigt anvendelig, hvis man gør sig grundige overvejelse omkring, hvilke bias (fejl), der kan tænkes at være indbygget i stikprøven.

Page 18: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 15

4.3 Valid og Konsistent Inden for den statistiske verden vurderer man sine resultater efter validitet og efter hvor konsistente de er. Et perfekt resultat har en høj validitet og er meget konsistent. Men hvad betyder mere konkret disse kvalitetskriterier? Konsistent:

- At være konsistent betyder, at man rammer samme resultat hver gang. Hvis en stikprøve er konsistent vil man forvente at opnå det samme resultat, hvis man laver en tilsvarende stikprøve igen og igen.

Valid:

- Validitet er derimod en betegnelse for, hvor præcist resultatet er – eller med andre ord er det en betegnelse for hvor akkurat en stikprøve er i forhold til populationen. Hvis der er høj validitet, så svarer stikprøvens resultater til de resultater vi havde fået, hvis vi havde anvendt hele populationen.

Disse lidt uhåndgribelige begreber kan illustreres på en mere konkret måde ved at forestille sig, at man befinder sig på en skydebane. Jf. figur 4.7 er målet at ramme den røde cirkel, som er placeret i midten af hver af firkanterne. Den røde cirkel symboliserer den fulde populationen, og hvert skud symboliserer en stikprøve. På denne måde ses det af figur 4.7, at: Validitet HØJ: Vi rammer tæt på den røde cirkel – altså måler vi på det rigtige! Konsistent HØJ: Vi rammer cirka det samme sted hver gang! Figur 4.7 Matrix for validitet og konsistens

Konsistent (Reliability)

Validitet (Validity)

Page 19: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 16

Øverst til højre i figur 4.7 ses det endvidere, at det er muligt at opnå resultater som er meget konsistente, men som har lav validitet. Helt konkret vil vi derfor få det samme resultater hver gang, men det vi måler er ikke det rigtige. I forhold til valg af stikprøveudvælgelse er derfor meget vigtigt, at man som forsker gør sig nogle kritiske overvejelser om, hvor konsistente og valide de opnåede resultater er. Vælges en forkert metode til stikprøveudvælgelse er der stor risiko for, at man muligvis opnår konsistente resultater, men man måler noget helt andet end det forventes pga. at lav validitet.

5. Udarbejdelse af spørgeskema I opstartsfasen til udarbejdelsen af spørgeskemaet er det nødvendigt, at forskeren har klargjort, hvad man ønsker at undersøge. Herved er muligt at gøre sig nogle overvejelser om, hvordan man ønsker at spørge respondenten og hvorledes spørgeskemaet skal sættes på. Det kan i nogle tilfælde være en fordel at se på andre undersøgelsers spørgeskema til at få inspiration til opsætningen af spørgeskemaet. Når et spørgeskema udformes er det vigtigt først og fremmest at tænke på længden af spørgeskemaet. Afhængig af, hvilken metode der vælges til at indhente data (telefon, personligt interview eller spørgeskemaer), er det vigtigt at tilpasse sit spørgeskemas længde således, at det passer til den valgte metode. Er et spørgeskema for kort, kan det være, at der ikke er tilstrækkelig information til at kunne besvare eller belyse undersøgelsesområdet. Opstilles der et for langt spørgeskema kan det resultere i, at respondenten kører død under besvarelsen og dermed undlader at besvare resten af spørgeskemaet, hvilket resulterer i, at kun nogle af svarene bliver returneret til undersøgeren, eller i værste tilfælde, at ingen af svarene bliver returneret, hvis respondenten vælger ikke at indsende sin besvarelse. Ordvalget er også en meget vigtig, men ofte en undervurderet faktor. Generelt skal der anvendes simple ord, som på ingen måde kan misforstås eller have flere betydninger. Anvendes der ord, som kan have mere end én betydning, kan det resultere i, at respondenten forstår spørgsmålet anderledes end forskerens intention. Er spørgeskemaet fyldt med svære ord, kan det være demotiverende for respondenten at svare, da vedkommende kan føle sig uintelligent, hvis der gang på gang optræder ord som ligger udenfor respondentens ordforråd. Dette kan resultere i, at respondenten vælger, at undlade at besvare spørgsmålet eller svarer forkert på spørgsmålet, da han tror han besvarer noget helt andet, end hvad han/hun reelt gør. Når et spørgeskema udformes er der mange faktorer, der skal tages højde for. Det kan være en god idé at få andre personer til at læse og udfylde spørgeskemaet før det udsendes. Det skal helst være personer, som ikke har en lige så stor viden om det område, der skal undersøges. På denne måde testes der for, om spørgeskemaet kan forstås af andre personer, som f.eks. ikke har tilknytning til emneområdet eller har den samme forståelse af emnet, som undersøgeren selv.

Page 20: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 17

5.1 Overvejelser i forbindelse med opsætningen at spørgeskemaet Dette afsnit vil belyse nogle gode råd til, når der skal udvikles et spørgeskema. Nogle af punkterne siger mere eller mindre sig selv, hvor andre måske kan hjælpe undersøgeren med at udforme et bedre spørgeskema. Vigtigt er det dog altid, at skabe så præcise spørgsmål, som overhovedet muligt. Det er selvfølgeligt vigtigt at forstå, at ikke to undersøgelser er ens og at der derfor ikke er en vejledende løsning eller den perfekte fremgangsmåde, til at udforme et spørgeskema. Men nedenstående giver nogle gode råd til selve udformningen.

5.2.1 Svarrum Når der stilles spørgsmål i et spørgeskema er det vigtigt at forstå, hvilket svarrum man vil give respondenten. Der kan anvendes alt fra helt åbne til helt lukkede spørgsmål. De helt åbne spørgsmål giver respondenten lov til at svare præcis, som vedkommende vil, hvilket f.eks. kunne være tekst. Anvendes der mere lukkede spørgsmål, som f.eks. ”Hvilke af følgende læskedrikke har du prøvet?”, hvor svarrummet på forhånd er defineret, ved forskeren hvad der kan forventes af svar. Respondentens valgmuligheder kunne være følgende:

- Pepsi - Coca Cola - Fanta - Sprite - 7up

Dette er et typisk eksempel på et meget lukket spørgsmål, hvor alle udfaldene på forhånd er bestemt af undersøgeren. Det kan også være, at undersøgeren f.eks. vil tilføje muligheden ”andet”, hvor respondenterne kan skrive, hvilke andre læskedrikke de har prøvet. Svarrummet bestemmes i høj grad af undersøgelsesspørgsmålet og hvordan dataene ønskes analyseret.

5.2.2 Tidsrum Det er også vigtigt at definere, hvilket tidsrum man ønsker at undersøge. De fleste personer kan ikke huske længere end 2 uger tilbage (selvfølgeligt alt afhængig af detaljeringsgraden). Spørger man f.eks. respondenterne om hvad deres telefonregning var sidste år, vil man højst sandsynligt få et gæt og ikke et reelt og faktisk tal. Altså er det meget vigtigt at vurdere hvor langt tilbage i tiden man stiller spørgsmål.

5.2.3 Ledende spørgsmål Det er vigtigt at der ikke stilles ledende spørgsmål. Et typisk ledende spørgsmål kunne være ”synes du også at skatten burde blive sænket?” eller ”Ville du ikke også synes…”. Disse typer spørgsmål vil typisk lokke respondenten til, at svare i en given retning, hvilket ikke vil vise det troværdige resultat. Dette giver meget store fejl i stikprøven og kan føre til forkerte konklusioner

Page 21: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 18

5.2.4 Etiske spørgsmål Hvorvidt et spørgsmål er etisk spiller også en meget vigtig rolle, når der skal udformes et spørgeskema. Nogle spørgsmål kan det være svært, hvis ikke umuligt, at få respondenter til at besvare. Eksempler på dette kan være ”Har du nogensinde anvendt sort arbejde?” eller ”Har du nogensinde downloadet ulovligt musik på internettet?”. Andre spørgsmål, som det kan være svært at få folk til at svare på, er ”årlig indkomst” og ”hvem de stemte på ved sidste valg”. Respondenten kan føle frygt for, at de vil blive stillet til regnskab for deres valg, trods den anonymitet, som bliver lovet respondenten.

5.2.5 To spørgsmål – og kun én svarmulighed Der skal ikke anvendes dobbelt spørgsmål, som f.eks. ”Synes du at vi skulle stemme oftere end vi gør i dag og skulle det være muligt at stemme på flere lokaliteter end det er muligt i dag?”. Disse spørgsmål vil ofte forvirre respondenten og give dårligt data, hvilket kan blive et problem, når der skal analyseres og fortolkes.

5.2.6 Warming up - spørgsmål Det er vigtigt at få respondenten til, at føle sig motiveret og engageret. Dette kan bl.a. gøres ved, at starte med nogle nemme spørgsmål, f.eks. med ”Hvad er dit køn” eller ”Hvad er din alder?”, før der drages til mere specifikke og krævende spørgsmål. Denne type af spørgsmål skal respondenten ikke bruge meget tid til at tænke over, så det giver et godt ”glid” i spørgeskemaet.

5.2.7 ”Ved ikke” svar og svar på vegne af andre ”Ved Ikke”-svarmuligheden skal nøje overvejes, hvis denne skal inddrages. Ofte vil mange respondenter springe til den nemme vej og derfor svare ”ved ikke”. Dette kan medvirke, at man ikke vil få svar på alle spørgsmål fra alle personer. Samtidig kan det skabe forkerte svar eller gæt, hvis det er at denne svarmulighed udebliver, da respondenten tvinges til at give et svar på et spørgsmål, som de måske på ingen måde har mulighed for at svare på. Det er generelt uhensigtsmæssigt at spørge en respondent om, hvad de mener en anden person ville svare. Disse spørgsmål bør kun anvendes, såfremt det er umuligt, at komme i kontakt med personen selv. Et eksempel på et sådan spørgsmål kunne være ”Hvad tror du din samlever ville sige til….”. Disse kan give forkerte svar (med mindre man ønsker at undersøge, hvad en person mener deres samlever vil svare på et givent spørgsmål). Ligeledes er det en dum idé, at opstille hypotetiske spørgsmål, som f.eks. ”Hvad ville du gøre, hvis du var dronning/konge af Danmark”. Disse hypotetiske situationer er ofte svære for en person at svare troværdigt på, da situationen måske er absurd i forhold til respondentens egen tilværelse.

5.2.8 Irrelevante spørgsmål Hvis et spørgsmål anses som irrelevant kan det have en negativ betydning for respondentens besvarelse. Et eksempel på dette kunne være, hvis respondenten tidligere har angivet, at denne ikke

Page 22: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 19

ejer en bil, så er irrelevant senere at spørge respondenten om, hvilket bilmærke denne har. For at undgå irrelevante spørgsmål anvendes der ofte i et online spørgekema en funktion, der hedder branching. Ved at anvende branching søger man for, at det kun er respondenter, som f.eks. tidligere har svaret, at de ejer en bil, som derefter får spørgsmålet omkring, hvilket bilmærke deres bil er.

5.2.9 Anonymitet Før en undersøgelse startes, er det vigtigt at informere respondenten om vedkommendes vilkår for deltagelsen. Er respondenten anonym (hvilket er tilfældet i næsten alt kvantitativ analyse) skal dette klart fremstå af spørgeskemaet. Anonymiteten får i de fleste tilfælde folk til at svare mere korrekt og give oplysninger, som de i andre tilfælde ikke ville dele. Desuden skal undersøgelsens formål også fremstå klart for respondenten før den egentlige besvarelse af spørgeskemaet sker. En mere informeret respondent vil ofte lede til en mere motiveret respondent, hvilke vil frembringe mere troværdige og sande svar. Der findes generelt utallige gode råd til, hvordan et spørgeskema bør udformes. Det er en god idé, at sørge for at holde en dialog med en statistisk kyndig person under hele undersøgelsesforløbet, for at sikre den bedste data- og analysekvalitet.

5.2 Likert skala En af de mest anvendte metoder til at indsamle data er ved anvendelse af en Likert skala. Likert-skalaen er en skala til at måle styrken af holdninger til udsagn. Den anvendes ofte som svarmodel til spørgeskemaundersøgelser og meningsmålinger, da det derved er muligt at kvantificere holdninger og meninger. Skalaen er navngivet efter den amerikanske socialpsykolog Rensis Likert (1903-1981), der introducerede skalaen i en rapport, som han udgav i 1932. Når man besvarer et spørgsmål på Likert-skalaen, uddyber man graden af enighed i et givent udsagn eller en anden form for subjektiv eller objektiv vurdering af emnet. Som oftest anvendes en fem-points-skala. Endelig kan den også anvendes uden neutral, således at respondenterne tvinges til at tage stilling. Et eksempel på anvendelse af Likert skalaen ses i det følgende: Angiv hvor enig du er i følgende udtalelser, hvor 1 er helt uenig og 5 er helt enig Udtalelse Helt uenig Uenig Neutral Enig Helt enig Århus er en god studieby 1 2 3 4 5 Det er billigt at bo i Århus 1 2 3 4 5 Jeg ønsker kun at søge jobs i Århus 1 2 3 4 5

Page 23: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 20

Jeg spiser fastfood mindst 1 gang om ugen 1 2 3 4 5 Jeg kan identificere mig med sportsmærket Puma 1 2 3 4 5 Jeg kan identificere mig med sportsmærket Nike 1 2 3 4 5 Jeg kan identificere mig med sportsmærket Adidas 1 2 3 4 5 Som tidligere nævnt er den store fordel ved Likert skalaen, at det er muligt at afgøre graden af respondentens udsagn. Hvis respondenten kun havde svaret JA/NEJ eller ENIG/UENIG ville man ikke kunne afgøre om det var et ”stort nej” eller bare et nej. Dermed giver Likert skalaen væsentlig mere information end de simple nominale spørgsmål (Ja/Nej). Data som indsamles ved anvendelse af Likert skalaen er intervalskalereret. Som nævnt i afsnit 3.1 betyder det, at forskeren rent analysemæssigt har mange muligheder for analyse og for at tolke på den indsamlede data. Blandt flere analysemetoder er det f.eks. oplagt at undersøge om gennemsnittet for tre forskellige spørgsmål er ens eller signifikant for forskellige fra hinanden. For at teste dette kan en ANOVA test anvendes, hvorved det er muligt at konkludere om graden af den gennemsnitlig enighed er forskellig. Eksempelvis kunne forskeren ønske at undersøge, om der er forskel på, hvor enige respondenterne er i, at de identificerer sig med de respektive sportsmærker Puma, Nike og Adidas. Ved anvendelse af ANOVA testen sammenlignes de tre spørgsmåls gennemsnit, og det kan konkluderes om de er ens ellers signifikant forskellige. Hvis det konkluderes, at de er ens vil forskeren kunne konkludere, at respondenterne gennemsnitligt identificerer sig selv lige meget med de tre sportsmærker. Med andre ord er den gennemsnitlige brandvalue ens.

6. Dataindsamling Dataindsamlingen er et særdeles væsentligt punkt i hele analyseprocessen, da resultatet af analysen i højeste grad afhænger af de data der indsamles. Man kan have udarbejdet et perfekt spørgeskema, korrekt stikprøvestørrelse og en præcis stikprøveudvælgelse, men hvis dataindsamlingsprocessen ikke forløber fejlfrit, kan det resultere i, at konklusionen af den kvantitative analyse ikke er korrekt. Det er derfor meget væsentligt, at man som forsker er opmærksom på, hvilke typer af fejl der kan opstå i dataindsamlingsprocessen. Der skelnes mellem to overordnede fejltyper:

- Feltarbejder fejl (Fieldworker error) - Respondent fejl (Respondent error)

Page 24: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 21

Det kan virke som nogle noget abstrakte begreber, så den mest effektive måde at illustrere dette på ses af følgende figur. Figur 6.1 Oversigt over mulige dataindsamlings fejl

Som det ses at figuren er der mange mulige fejlkilder, hvilket betyder, at forskeren gennem hele dataindsamlingsprocessen skal have fokus på det undgå disse. Endvidere kan der være mange andre uforudsete fejlkilder, som ikke er nævnt i ovenstående figur.

6.1 Data indsamlingsmetoder Generelt kan man vælge at indhente data på mange forskellige måder. Der kan f.eks. udsendes spørgeskemaer vha. post eller e-mail, der kan via telefon ringes til respondenterne eller der kan foretages interviews (f.eks. i et supermarked). Der er fordele og ulemper ved hver metode. Den bedste metode afhænger i højeste grad af, hvad der ønskes undersøgt. I det følgende gennemgås en række af de mest anvende dataindsamlingsmetoder.

6.1.1 Telefon Forskeren kan via telefon kontakte den udvalgte respondent og stille denne en række spørgsmål. Ved denne metoder indtaster/nedskriver forskeren respondentens svar uden interviewet. Oftest har

Dataindsamlings FEJL

Respondent FEJL

Forsætlig FEJL Uforsætlig FEJL

Feltarbejder FEJL

Forsætlig FEJL Uforsætlig FEJL

Snyd Lede respondenten

Interviewers karakterstik Misforståelser Træthed

Løgn/svarer usandt Intet svar

Misforståelser Gæt Svigtende koncentration Forstyrrelser Træthed

Page 25: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 22

forskeren udarbejdet et spørgeskema, som anvendes under interviewet, således at alle respondenter stilles de samme spørgsmål i samme rækkefølge. Fordele:

- Nemt at finde numre på relevante respondenter. - Geografiske afstande er ikke en hindring - Personlig kontakt til respondenter – kan uddybe hvis de ikke forstår spørgsmål, og

derved undgå at respondenten bare gætter eller ikke svarer. - Interviewet kan oftest gennemføres meget hurtigt

Ulemper - Omkostninger til opkald. - Risikerer at mange ikke gider at svarer eller ikke har tid på det pågældende tidspunkt. - Risiko for at interviewer kommer til at vejlede/guide respondenten for meget.

6.1.2 Spørgeskema via post – selvudfyldning Respondenten kan opsætte et spørgeskema og i papirform sende det via posten. I Danmark er det i de fleste tilfælde let at fremskaffe en adresse på de udvalgte respondenter. Fordele:

- Personen kan udfylde spørgeskemaet, når vedkommende har tid. - Respondenter har længere tid til at tænke over spørgsmålene. - Det er billigt at udsende et spørgeskema via post. - Respondenten bliver ikke påvirket af intervieweren.

Ulemper

- Hvis respondenten misforstår et spørgsmål svarer denne måske ukorrekt. - Det er nemt for respondenten bare at smide spørgeskemaet i skraldespanden. - Tager lang tid at sende spørgeskemaet post – lang dataindsamlingsproces. - Ingen kontrol med udfyldningen af spørgeskemaet. - Alle svar skal indtastes ved senere analyse – meget tidskrævende

6.1.3 ”Supermarkedsmetoden” – assisteret udfyldelse Denne dataindsamlingsmetode refererer til fremgangsmåden, hvor intervieweren placerer sig i f.eks. et supermarked, shopping center, biograf eller på fisketorvet. Internvieweren tager altså ud og møder de relevante respondenter og stiller respondenterne en række spørgsmål. Intervieweren har opstillet et spørgeskema og gennemgår de samme spørgsmål med alle respondenter. Fordele:

- Personlig kontakt til respondenter – kan uddybe hvis de ikke forstår spørgsmål, og derved undgå at respondenten bare gætter eller ikke svarer forkert.

- Det er relativt hurtigt at gennemføre interview.

Page 26: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 23

- Lave omkostninger forbundet med dataindsamlingsprocessen. Ulemper:

- Respondenter kan blive forstyrret af omgivelserne. - Respondenten vil muligvis ikke svare på private spørgsmål i det offentlige rum. - Nogle supermarkeder tillader ikke, at man interviewer deres kunder. - Stikprøven er muligvis ikke repræsentativ, da det typisk er folk fra f.eks. samme

område, som handler samme sted.

6.1.4 Online spørgeskema Det er også muligt at indsamle sine data ved at udsende et elektronisk spørgeskema via e-mail. Det findes en række programmer, som kan anvendes til opsætning af elektroniske spørgeskemaer. På ASB anvendes der på nuværende tidspunkt programmerne Studsurvey, Inquisite og @venquest. Der er af IKT udarbejdet et notat, som beskriver forskellen på de tre softwareprogrammet. Et elektronisk spørgeskema fungerer på samme måde, som et ”gammeldags” papir spørgeskema, bortset fra at spørgeskemaet udsendes via e-mail og respondenten elektronisk indtaster sine svar. Fordele:

- Tidsmæssigt er det hurtigere at sende et spørgeskema via e-mail end post. - Respondenternes svar registreres elektronisk og kan overføres til analyseprogrammer. - Respondenten kan udfylde spørgeskemaet, når denne har tid. - Lave omkostninger forbundet med dataindsamling. - Mulighed for at integrerer billeder, video og musik i spørgeskema. - Nemt og billigt at udsende rykker til respondenter, som ikke besvarer. - Mulighed for at ”personificere” spørgeskema, så respondenterne får forskellige

spørgsmål afhængig af deres tidligere svar. Ulemper:

- Relativt tidskrævende at opsætte det elektroniske spørgeskema. - Nemt for respondenter ”bare” at slette en e-mail – altså afvise. - Ingen personlig kontakt til respondenterne.

6.2 Valg af dataindsamlingsmetode Der er flere faktorer der er afgørende for forskerens valg af dataindsamling metode. Som det ses af de foregående afsnit, så er der både fordele og ulemper ved alle dataindsamlingsmetoderne, og forskeren bør derfor opveje fordele med ulemper i valget af dataindsamlingsmetode. Dataindsamlingsprocessen kan, afhængig af den valgte metode, være særdeles omkostningsfuld. Forskeren bør derfor vurdere sit valg af dataindsamlingsmetode i forhold til de ressourcer, som er til rådighed. Desuden er det også afgørende hvor lang tid, der er afsat til at indsamle de nødvendige data. Nogle metoder er mere tidskrævende end andre, så forskeren må derfor vælge en metode, som stemmer overens med den tid, der er afsat til dataindsamling. Alt i alt er valget af metode særdeles afhængig af de rammer, som er opsat for den enkelte undersøgelse.

Page 27: Notat om metodiske overvejelser ved kvantitativ analyse · 2011-09-29 · IKT Analysegruppen, 2008 Side 1 Forord Dette notat henvender sig primært til sprog- og kommunikationsforskere

Metodiske overvejelser ved

kvantitative analyser IKT Analysegruppen, 2008

Side 24

7. Yderligere information og litteratursøgning Formålet med dette notat har været at give læseren en forståelse af hvilke overvejelser, der er essentielle i forbinde med anvendelse af kvantitative metoder. Det skal dog understreges, at dette ikke er en færdig manual, som kan anvendes step-by-step gennem undersøgelsesprocessen. Notatet skulle gerne give læseren en forståelse af hvilke hovedområder, der er væsentlige ved anvendelse af kvantitative metoder, og derved sætte forskeren i stand til mere præcist at kunne udvælge og indhente supplerende litteratur. I litteratursøgningsprocessen anbefales det, at der eventuelt tages kontakt til Handelshøjskolens interne forskermiljø. Afdelingen for Marketing og Statistik (MS) vil kunne oplyse og anbefale, hvilken litteratur, der kan være anvendelig. I selve undersøgelsesprocessen kan der opstå vanskelighed, som kræver ekstern assistance. Det er muligt at søge assistance i afdelingen for Marketing og Statistik, men det er dog væsentlig at pointere, at deres primære arbejdsopgaver ikke er at fungere som servicestation. Derfor kan det være fordelagtigt at kontakte IKTs Analysegruppe. Analysegruppen vil kunne assistere delvist eller gennem hele undersøgelsesprocessen. Analysegruppen kan kontaktes via [email protected]