G0N11C Statistiek & data-analyse Project tweede zittijd

Maat: px
Weergave met pagina beginnen:

Download "G0N11C Statistiek & data-analyse Project tweede zittijd"

Transcriptie

1 G0N11C Statistiek & data-analyse Project tweede zittijd Naam : Raimondi Michael Studierichting : Biologie Gebruik deze Word-template om een antwoord te geven op onderstaande onderzoeksvragen. Houd je aan de plaats die in dit document voorzien is, zodat je ordelijk getypt rapport maximaal uit 6 pagina s bestaat (dit voorblad en bijlagen niet inbegrepen). In je bespreking mag je geen R output toevoegen, maar je moet in je tekst uiteraard wel de relevante waarden uit de output vermelden en bespreken. Noodzakelijke figuren (zoals een kwantielplot voor het nagaan van normaliteit) moeten wel in het rapport staan. In bijlage voeg je dan de volledige R output, zonder figuren, alsook je script toe. Het volledige rapport, inclusief deze bijlage, mag daardoor uit meer dan 7 pagina's bestaan. Gebruik een lettergrootte van 11pt voor het rapport. Het rapport moet in 1 exemplaar afgegeven worden bij de aanvang van het examen. Zorg ervoor dat het rapport samengebonden is (met een nietje) en voorzien van je naam en studierichting. Je hoeft het niet te laten inbinden of in een kaftje te steken! Iedereen moet ook (ten laatste voor de aanvang van het examen) een elektronische versie van dit rapport (als PDF of Word-document) op Toledo uploaden. Wie het project niet of te laat indient, behaalt 0/3. Verwijderde observaties: Tijdperk Tijdperk Tijdperk Tijdperk Tijdperk

2 De onderzoeksvragen 1. Onderzoek aan de hand van een geschikte hypothesetest of er een verschil is tussen de breedte en de hoogte (achteraan gemeten) van de schedels van de mannelijke Egyptenaren. a. Formuleer een geschikte H 0 en H 1. Dit is gepaarde data want het gaat over verschillende variabelen, namelijk de hoogte en de breedte van de schedels van dezelfde groep mannelijke Egyptenaren. Omdat het gaat over gepaarde gegevens wordt er een toevalsvariabele ingevoerd. Waarbij V = X Y µ V = µ 1 µ 2 Zodat volgende hypotheses getest worden: H 0 : µ V = 0 De gemiddelde breedte is significant gelijk aan de gemiddelde hoogte (achteraan gemeten) van de schedels van de mannelijke Egyptenaren. H 1 : µ V 0 De gemiddelde breedte is significant verschillend van de gemiddelde hoogte (achteraan gemeten) van de schedels van de mannelijke Egyptenaren. b. Ga de nodige veronderstellingen na. Pas je gegevens en/of de hypothesetest aan indien nodig! Eerst wordt met behulp van een boxplot nagegaan of de gegevens van beide variabelen normaal verdeeld zijn. Zoals te zien op Figuur 1.1 is de normale verdeling zichtbaar op de boxplot van beide variabelen. De staarten zijn beide ongeveer even lang en de mediaan ligt ongeveer in het midden van de box. Bij de variabele BREEDTE zijn er wel 3 uitschieters zichtbaar (meting 4, 33 en 144), verdere grafische methodes zijn nodig om te beslissen als deze verwijderd moeten worden. Figuur 1. 1 Boxplot van de variabele 'HOOGTE1' links en een boxplot van de variabele 'BREEDTE' rechts. Er kan ook gekeken worden naar de histogrammen van beide variabelen. Als deze de Gaussische curve bij benadering volgen, zoals het geval is op Figuur 1.2 en Figuur 1.3, wordt het vermoeden sterker dat de gegevens normaal verdeeld zijn. De uitschieters van de variabele BREEDTE zijn hier niet op te merken. 2

3 Figuur 1.2 Histogram van de variabele HOOGTE1 Figuur 1.3 Histogram van de variabele 'BREEDTE' Grafisch kan een normale verdeling ook opgemerkt worden op een QQ-plot. Zoals te zien in Figuur 1.2 is er een duidelijke rechte doorheen de punten waarneembaar voor beide variabelen. Ook dit duidt op een normale verdeling. Op alle grafische methoden blijken de uitschieters geen invloed te hebben op de normale verdeling en deze worden dus niet verwijderd. Figuur 1. 2 QQ-plots van de variabelen 'HOOGTE1' links en 'BREEDTE' rechts. Er bestaat ook een formele test om de normaliteit van gegevens na te gaan, zo kan een Shapiro-Wilk test uitgevoerd worden. De uitvoer van een Shapiro-Wilk test geeft twee waarden. De w-waarde geeft aan als er een sterk lineair verband is tussen de waarden op de Q-Q-plot, als deze dicht bij 1 ligt, is er een sterk lineair verband. 3

4 Voor de variabele BREEDTE wordt volgende w-waarde bekomen: w = Dit betekent dat er een sterk lineair verband is tussen de waarden op de Q-Q-plot. De p-waarde geeft aan als de nulhypothese verworpen kan worden, dit is slechts als de p-waarde lager is dan het significantieniveau. De p-waarde die bekomen wordt voor de variabele BREEDTE is: p = Dit is hoger dan het significantieniveau α (0.05) en de normaliteit wordt aangenomen voor de breedte van de schedels van de mannelijke Egyptenaren op significantieniveau α. Voor de variabele HOOGTE1 wordt een w-waarde bekomen van: En een p-waarde van: w = p = Deze duiden respectievelijk op een lineair verband op de QQ-plot en op normaliteit op significantieniveau α. De normaliteit van de gegevens van de hoogte van de schedels van de mannelijke Egyptenaren wordt aangenomen op dit significantieniveau α. De tweede veronderstelling is dat de varianties constant zijn. Hierbij zijn de hypotheses: 2 2 H 0 : σ BREEDTE = σ HOOGTE1 De variantie van de breedte is gelijk aan de variantie van de hoogte (achteraan gemeten) van de schedels van de mannelijke Egyptenaren. 2 2 H 1 : σ BREEDTE σ HOOGTE1 De variantie van de breedte is niet gelijk aan de variantie van de hoogte (achteraan gemeten) van de schedels van de mannelijke Egyptenaren. Deze hypotheses worden getest met behulp van een F-test. De teststatistiek die hierbij hoort is: 2 2 F = S BREEDTE /S HOOGTE1 De testwaarde die bekomen wordt is: De P-waarde die bekomen wordt is: F = P = Deze P-waarde is groter dan het significantieniveau α, zodus kan de gelijkheid van varianties niet worden verworpen. Beide voorwaarden zijn nu voldaan om een gepaarde t-test uit te voeren. 4

5 c. Voer de hypothesetest uit en formuleer je besluit. Er wordt aangenomen dat de gegevens van beide variabelen normaal verdeeld en de varianties gelijk zijn. Dan kan de hypothese getest worden met behulp van volgende teststatistiek: Waarbij T = V, S V (n) S V 2 = 1 n 1 (V i V ) 2 De gepaarde t-test wordt uitgevoerd. De testwaarde die bekomen wordt is: Er wordt een p-waarde bekomen van: t = p = en dit is kleiner dan significantieniveau α (= 0.05). De nulhypothese wordt dus verworpen op significantieniveau α. Besluit: Er is een significant verschil tussen de breedte en de hoogte (achteraan gemeten) van de schedels van de mannelijke Egyptenaren op significantieniveau α. 2. Is er een verband tussen de breedte en de lengte van een schedel? Ga na met behulp van een hypothesetest. a. Formuleer een geschikte H 0 en H 1. H 0 : ρ = 0 Er is geen lineaire afhankelijkheid tussen de breedte en de lengte van de schedels van de mannelijke Egyptenaren. H 1 : ρ 0 Er is een mate van lineaire afhankelijkheid tussen de breedte en de lengte van de schedels van de mannelijke Egyptenaren. Met ρ de populatiecorrelatiecoëfficiënt die gedefinieerd is als: Cov(BREEDTE, LENGTE) ρ(breedte, LENGTE) = Var(BREEDTE)Var(LENGTE) en Cov(BREEDTE, LENGTE) = E ((BREEDTE E(BREEDTE))(LENGTE E(LENGTE))). b. Ga de nodige veronderstellingen na. Pas je gegevens en/of de hypothesetest aan indien nodig! Dit is gepaarde data want het gaat over verschillende variabelen, namelijk de lengte en de breedte van de schedels van dezelfde groep mannelijke Egyptenaren. 5

6 Een nodige strenge voorwaarde om deze hypothesetest te mogen uitvoeren, is dat de variabelen BREEDTE en LENGTE bivariaat verdeeld zijn. Hiervoor moet eerst nagegaan worden welke verdeling beide variabelen hebben. In de vorige vraag werd al geconcludeerd dat de variabele BREEDTE normaal verdeeld is op significantieniveau α. Om na te gaan als de variabele LENGTE normaal verdeeld is, wordt eerst gekeken naar de boxplot. Op Figuur 2.1 is er één uitschieter zichtbaar maar de boxplot lijkt normaal verdeeld. De Q-Q plot uit Figuur 2.2 geeft een lineair verband en doet het vermoeden van een normale verdeling stijgen. Figuur 2.1 QQ-plot van de variabele 'LENGTE'. Figuur 2.2 Boxplot van de variabele 'LENGTE'. Het histogram van de variabele LENGTE wordt weergegeven op Figuur 2.3. Ook hier is de normale verdeling zichtbaar doordat deze de Gaussische curve bij benadering volgt. Figuur 2.3 Histogram van de variabele 'LENGTE'. Nu kan er met een formele Shapiro-Wilk test aangetoond worden als de gegevens van de variabele LENGTE normaal verdeeld zijn. De w-waarde die bekomen wordt is: w = Deze ligt dicht bij 1 en duidt dus op een sterk lineair verband tussen de gegevens op de Q-Q plot. De p-waarde heeft een waarde van: p =

7 Deze p-waarde is duidelijk hoger dan het significantieniveau α(= 0.05). De normaliteit kan dus aangenomen worden op significantieniveau α. Beide variabelen zijn normaal verdeeld op significantieniveau α en een scatterplot kan helpen om te zien of de bivariate normaliteit plausibel lijkt. Op Figuur 2.4 zijn de gegevens geplot en lijken een elliptische puntenwolk te vormen. De bivariate normaliteit tussen de variabele LENGTE en BREEDTE kan dus aangenomen worden op significantieniveau α. Figuur 2.4 Scatterplot van de lengte ten opzichte van de breedte van de schedels van de mannelijke Egyptenaren c. Voer de hypothesetest uit en formuleer je besluit. Na de Pearson correlatietest uitgevoerd te hebben, is de testwaarde: De Pearson correlatiecoëfficiënt is: De p-waarde die bekomen wordt is: t = r n = p = En deze is hoger dan het significantieniveau α (0.05) waardoor de nulhypothese niet verworpen kan worden. Op significantieniveau α kan dus aangenomen worden dat er een lineair verband bestaat tussen de lengte en de breedte van de schedels van de mannelijke Egyptenaren. 3. We definiëren grote schedels als schedels waarvan de lengte groter of gelijk is aan 100. Kleine schedels hebben een lengte strikt kleiner dan 100. Ga nu met behulp van een hypothesetest na of een grote of kleine schedel kenmerkend is voor een bepaald tijdperk. Indien dit zo is, bespreek kort. a. Formuleer een geschikte H 0 en H 1. H 0 : µ lengte voor een bepaalde periode 100 De gemiddelde lengte van de schedels van een bepaalde periode van de mannelijke Egyptenaren is gemiddeld groter of gelijk aan 100. H 1 : µ lengte voor een bepaalde periode < 100 De gemiddelde lengte van de schedels van een bepaalde periode van de mannelijke Egyptenaren is gemiddeld kleiner dan

8 De teststatistiek voor deze linkseenzijdige test wordt dan: T = LENGTE µ 0 S n b. Ga de nodige veronderstellingen na. Pas je gegevens en/of de hypothesetest aan indien nodig! Eerst wordt de dataset verdeeld in de verschillende periodes. Daarna wordt voor elke periode de nodige veronderstellingen nagegaan en wordt de hypothesetest uitgevoerd. De voorwaarde die nodig is voor deze hypothesetesten is dat de gegevens normaal verdeeld zijn. Eerst wordt er gekeken naar de boxplot van elke tijdsperiode. In Figuur 3.1 worden 5 boxplots weergegeven. Deze vertonen telkens een normale verdeling. Er worden wel in Tijdsperk 2, 4 en 5 een uitschieter opgemerkt (respectievelijk meting 24, 1 en 26). Verdere grafische methoden zullen uitmaken als deze verwijderd moeten worden. Figuur 3.1 Boxplots van tijdperk 1 t.e.m. 5 van de lengte van de schedels van de mannelijke Egyptenaren. Om verdere zekerheid te krijgen van de normaliteit wordt gekeken naar de Q-Q-plots in Figuur 3.2. Deze geven voor elke tijdsperiode een stijgende rechte wat ook duidt op normaliteit. Wel is de uitschieter uit Tijdsperk 4 ook hier zichtbaar afwijkend van de rest van de gegevens. Figuur 3.2 QQ-plots van de variabele 'LENGTE' van Tijdsperk 1 (links) en Tijdsperk 2 (rechts) 8

9 Figuur 3.3 QQ-plots van de lengte van de schedels van de mannelijke Egyptenaren uit Tijdsperk 3 (linksboven), Tijdsperk 4 (rechtsboven) en Tijdperk 5 (onder). Om verdere bevestiging te krijgen over de normale verdeling kan er gekeken worden naar de histogrammen. Deze zijn te zien op Figuur 3.4 en versterken het vermoeden dat de gegevens normaal verdeeld zijn voor Tijdperk 1, 2, 3 en 5. Voor Tijdperk 4 is het nu duidelijk dat de uitschieter verwijderd moet worden. Figuur 3.4 Histogrammen van de lengte van de schedels van de mannelijke Egyptenaren uit verschillende tijdsperken. 9

10 Na het verwijderen van de uitschieter is de normale verdeling beter zichtbaar op de boxplot en het histogram (Figuur 3.5) en de Q-Q-plot (Figuur 3.6). Figuur 3.5 Boxplot (links) en histogram (rechts) van de variabele lengte voor Tijdsperk 4 zonder uitschieter. Figuur 3.6 Q-Q-plot van de variabele lengte voor Tijdsperk 4 Nu wordt formeel getest of de gegevens normaal verdeeld zijn met behulp van een Shapiro- Wilk test. De testwaardes en p-waardes worden weergegeven in Tabel 3.1. De p-waardes zijn steeds groter dan het significantieniveau α (= 0.05). Voor elke periode kan nu de normaliteit aangenomen worden op significantieniveau α. Tijdsperiode w-waarde p-waarde Tabel 3.1 w- en p-waarden van de Shapiro-Wilk tests van de variabele LENGTE uit 5 verschillende tijdsperioden. c. Voer de hypothesetest uit en formuleer je besluit. De gepaarde t-test kan nu uitgevoerd worden voor elke tijdsperiode. De testwaarden en p- waarden worden weergegeven in tabel 3.2. In tijdsperiode 1 en 2 zijn de p-waarden groter dan het significantieniveau α. In tijdsperiode 3, 4 en 5 zijn deze kleiner dan significantieniveau α. Dit betekent dat voor de eerste twee tijdsperiodes de schedels groter zijn dan 100, voor de 3 latere tijdsperiodes zijn deze kleiner dan 100. Tijdsperiode Testwaarde p-waarde e e e-08 Tabel 3.2 test- en p-waarden van de gepaarde t-tests voor de variabele LENGTE voor elke tijdsperiode. 10

11 In tijdsperiode 1 en 2 is een grote schedel kenmerkend voor de mannelijke Egyptenaren. De mannelijke Egyptenaren uit tijdsperiode 3, 4 en 5 worden gekenmerkt door een kleine schedel. Bijlagen R-script # dataset importeren met header # vervolgens 5 waardes verwijderen uit elke periode schedels = schedels[-c(15,45,75,105,135),] # Eerste onderzoeksvraag # variabelen definiëren hoogte1 = schedels$hoogte1 breedte = schedels$breedte # normaliteit nagaan voor beide variabelen boxplot(breedte) hist(breedte) qqnorm(breedte) shapiro.test(breedte) library(car) Boxplot(breedte) boxplot(hoogte1) hist(hoogte1) qqnorm(hoogte1) shapiro.test(hoogte1) # nagaan of varianties constant zijn. var.test(breedte, hoogte1) # gepaarde t-test uitvoeren # nieuwe variabele 'verschil' invoeren verschil = breedte - hoogte1 t.test(verschil) t.test(breedte, hoogte1, paired=true) # Tweede Onderzoeksvraag # variabele 'lengte' invoeren lengte = schedels$lengte # normaliteit nagaan voor de variabele 'lengte' qqnorm(lengte) boxplot(lengte) hist(lengte) qqnorm(lengte) shapiro.test(lengte) # scatterplot maken plot(lengte, breedte) # correlatietest uitvoeren cor.test(lengte, breedte, method="pearson") # Onderzoeksvraag 3 # de data van de lengte wordt verdeeld in verschillende tijdperken tp1 = schedels$lengte[1:29] tp2 = schedels$lengte[30:58] 11

12 tp3 = schedels$lengte[59:87] tp4 = schedels$lengte[88:116] tp5 = schedels$lengte[117:145] # normaliteit nagaan voor elke periode boxplot(tp1, tp2, tp3, tp4, tp5) hist(tp1, main = "Tijdperk 1", xlab = "Lengte") hist(tp2, main = "Tijdperk 2", xlab = "Lengte") hist(tp3, main = "Tijdperk 3", xlab = "Lengte") hist(tp4, main = "Tijdperk 4", xlab = "Lengte") hist(tp5, main = "Tijdperk 5", xlab = "Lengte") library(car) Boxplot(tp2) Boxplot(tp4) Boxplot(tp5) boxplot(tp4[-c(1)]) hist(tp4[-c(1)], breaks=3, main="tijdperk 4 zonder uitschieter", xlab = "Lengte in cm") qqnorm(tp1, main = "Tijdperk 1") qqnorm(tp2, main = "Tijdperk 2") qqnorm(tp3, main = "Tijdperk 3") qqnorm(tp4, main = "Tijdperk 4") qqnorm(tp5, main = "Tijdperk 5") qqnorm(tp4[-c(1)]) qqline(tp4[-c(1)]) shapiro.test(tp1) shapiro.test(tp2) shapiro.test(tp3) shapiro.test(tp4) shapiro.test(tp5) # gepaarde t-test uitvoeren voor elke periode t.test(tp1, mu=100, alternative="less") t.test(tp2, mu=100, alternative="less") t.test(tp3, mu=100, alternative="less") t.test(tp4, mu=100, alternative="less") t.test(tp5, mu=100, alternative="less") R-Output > schedels <- read.csv("c:/users/gebruiker/downloads/schedels.csv") > View(schedels) > # dataset importeren met heading > # vervolgens 5 waardes verwijderen uit elke periode > schedels = schedels[-c(15,45,75,105,135),] > # Eerste onderzoeksvraag > # variabelen definiëren > hoogte1 = schedels$hoogte1 > breedte = schedels$breedte > # normaliteit nagaan voor beide variabelen > boxplot(breedte) > hist(breedte) > qqnorm(breedte) > shapiro.test(breedte) data: breedte W = , p-value = > library(car) Warning message: package car was built under R version > Boxplot(breedte) [1] > boxplot(hoogte1) > qqnorm(hoogte1) > hist(hoogte1) 12

13 > shapiro.test(hoogte1) data: hoogte1 W = , p-value = > # nagaan of varianties constant zijn. > var.test(breedte, hoogte1) F test to compare two variances data: breedte and hoogte1 F = , num df = 144, denom df = 144, p-value = alternative hypothesis: true ratio of variances is not equal to ratio of variances > # gepaarde t-test uitvoeren > # nieuwe variabele 'verschil' invoeren > verschil = breedte - hoogte1 > t.test(verschil) One Sample t-test data: verschil t = , df = 144, p-value = alternative hypothesis: true mean is not equal to mean of x > t.test(breedte, hoogte1, paired=true) Paired t-test data: breedte and hoogte1 t = , df = 144, p-value = alternative hypothesis: true difference in means is not equal to mean of the differences > # Tweede Onderzoeksvraag > # variabele 'lengte' invoeren > lengte = schedels$lengte > # normaliteit nagaan voor de variabele 'lengte' > qqnorm(lengte) > boxplot(lengte) > hist(lengte) > shapiro.test(lengte) data: lengte W = , p-value = > # scatterplot maken > plot(lengte, breedte) > # correlatietest uitvoeren > cor.test(lengte, breedte, method="pearson") Pearson's product-moment correlation data: lengte and breedte t = , df = 143, p-value = alternative hypothesis: true correlation is not equal to

14 cor > # Onderzoeksvraag 3 > # de data van de lengte wordt verdeeld in verschillende tijdperken > tp1 = schedels$lengte[1:29] > tp2 = schedels$lengte[30:58] > tp3 = schedels$lengte[59:87] > tp4 = schedels$lengte[88:116] > tp5 = schedels$lengte[117:145] > # normaliteit nagaan voor elke periode > boxplot(tp1, tp2, tp3, tp4, tp5) > hist(tp1, main = "Tijdperk 1", xlab = "Lengte") > hist(tp2, main = "Tijdperk 2", xlab = "Lengte") > hist(tp3, main = "Tijdperk 3", xlab = "Lengte") > hist(tp4, main = "Tijdperk 4", xlab = "Lengte") > hist(tp5, main = "Tijdperk 5", xlab = "Lengte") > library(car) > Boxplot(tp2) [1] 25 > Boxplot(tp4) [1] 1 > Boxplot(tp5) [1] 26 > boxplot(tp4[-c(1)]) > hist(tp4[-c(1)], breaks=3, main="tijdperk 4 zonder uitschieter", xlab = "Lengte i n cm") > qqnorm(tp1, main = "Tijdperk 1") > qqnorm(tp2, main = "Tijdperk 2") > qqnorm(tp3, main = "Tijdperk 3") > qqnorm(tp4, main = "Tijdperk 4") > qqnorm(tp5, main = "Tijdperk 5") > qqnorm(tp4[-c(1)]) > qqline(tp4[-c(1)]) > shapiro.test(tp1) data: tp1 W = , p-value = > shapiro.test(tp2) data: tp2 W = , p-value = > shapiro.test(tp3) data: tp3 W = 0.981, p-value = > shapiro.test(tp4) data: tp4 W = , p-value = > shapiro.test(tp5) data: tp5 W = , p-value = > # gepaarde t-test uitvoeren voor elke periode > t.test(tp1, mu=100, alternative="less") One Sample t-test data: tp1 t = , df = 28, p-value = alternative hypothesis: true mean is less than

15 -Inf mean of x > t.test(tp2, mu=100, alternative="less") One Sample t-test data: tp2 t = , df = 28, p-value = alternative hypothesis: true mean is less than 100 -Inf mean of x > t.test(tp3, mu=100, alternative="less") One Sample t-test data: tp3 t = , df = 28, p-value = 7.523e-06 alternative hypothesis: true mean is less than 100 -Inf mean of x > t.test(tp4, mu=100, alternative="less") One Sample t-test data: tp4 t = , df = 28, p-value = 1.903e-07 alternative hypothesis: true mean is less than 100 -Inf mean of x > t.test(tp5, mu=100, alternative="less") One Sample t-test data: tp5 t = , df = 28, p-value = 7.952e-08 alternative hypothesis: true mean is less than 100 -Inf mean of x

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Statistiek in HBO scripties

Statistiek in HBO scripties Statistiek in HBO scripties Wim Krijnen Lector Analyse Technieken voor Praktijkonderzoek Lectoraat Transparante Zorgverlening Hanze University of Applied Sciences January 29, 2015 Wim Krijnen Lector Analyse

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4. VERGELIJKINGSTOETSEN A. Vergelijken van varianties Men beschouwt twee steekproeven uit normaal verdeelde populaties: X, X,, X n ~ N(µ, σ ) Y, Y,, Y n

Nadere informatie

gemiddelde politieke interesse van hoger opgeleide mensen)

gemiddelde politieke interesse van hoger opgeleide mensen) SPSS-oefening 2: Hypothesetoetsen Opgave Oefening 1 a) Het zijn onafhankelijke steekproeven. De scores voor politieke interesse zijn afkomstig van verschillende mensen aangezien elke persoon slechts in

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 7 juni 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Gebruik van Correlatiecoëfficiënt in onderzoek

Gebruik van Correlatiecoëfficiënt in onderzoek Gebruik van Correlatiecoëfficiënt in onderzoek Wim Krijnen Lector Analyse Technieken voor Praktijkonderzoek Lectoraat Healthy Ageing, Allied Health Care and Nursing Hanze University of Applied Sciences

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2 Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 10 Donderdag 20 Oktober 1 / 1 2 Statistiek Vandaag: Hypothese toetsen 2 / 1 3 / 1 Terzijde NU.nl 19 oktober 2011: Veel Facebookvrienden wijst op grotere hersenen. (http://www.nu.nl/wetenschap/2645008/veel-facebookvrienden-wijst-groterehersenen-.html)

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf. Opdracht 10a ------------ t-procedures voor gekoppelde paren t-procedures voor twee onafhankelijke steekproeven samengestelde t-procedures voor twee onafhankelijke steekproeven Twee groepen van 10 leraren

Nadere informatie

Statistiek II. Sessie 2. Verzamelde vragen en feedback Deel 2

Statistiek II. Sessie 2. Verzamelde vragen en feedback Deel 2 Statistiek II Sessie 2 Verzamelde vragen en feedback Deel 2 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 2 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat

Nadere informatie

Vergelijken van twee groepen (SPSS)

Vergelijken van twee groepen (SPSS) Vergelijken van twee groepen (SPSS) Vergelijking van gemiddeldes van onafhankelijke steekproeven met gelijke varianties (dataset newspapers) In een onderzoek geven studenten aan hoeveel keer per week ze

Nadere informatie

Testen omtrent µ (normale populatie): BI. Testen omtrent µ (normale populatie): fouten. Testen omtrent µ (normale populatie): P-waarde

Testen omtrent µ (normale populatie): BI. Testen omtrent µ (normale populatie): fouten. Testen omtrent µ (normale populatie): P-waarde Testen omtrent µ (normale populatie) Hoofdstuk VII: HYPOTHESETESTEN Voorbeeld : X: Mortaliteit N(µ, σ ) µ = 1000 of µ 1000? x = 940.35 X µ S/ n tn 1 als µ = 1000: Terminologie: X 1000 S/ 60 t59 P ( t 59,0.05

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

Statistiek II. Sessie 4. Feedback Deel 4

Statistiek II. Sessie 4. Feedback Deel 4 Statistiek II Sessie 4 Feedback Deel 4 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 4 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat het document met

Nadere informatie

Toetsen van Hypothesen. Het vaststellen van de hypothese

Toetsen van Hypothesen. Het vaststellen van de hypothese Toetsen van Hypothesen Wisnet-hbo update maart 2008 1. en Het vaststellen van de hypothese De nulhypothese en de Alternatieve hypothese. Het gaat in deze paragraaf puur alleen om de formulering. Er wordt

Nadere informatie

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van Extra Opgaven 1. Een persoon doet een HIV-test. Helaas is de uitslag positief. De test is echter niet perfect. De persoon vraagt zich af wat de kans is dat hij nu ook echt HIV heeft. Gegeven is: de kans

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

Examen Data Analyse II - Deel 2

Examen Data Analyse II - Deel 2 Examen Data Analyse II - Deel 2 Tweede Bachelor Biomedische Wetenschappen 10 januari 2011 Naam....................................... 1. De systolische bloeddruk (in mmhg) van 21 mannen is weergegeven

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

Hoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ?

Hoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ? Hoofdvraag Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ? Data visualisatie (Grafieken, dashboards); Kwantitatieve analyse (cijfers, statistiek); Software Inzichten

Nadere informatie

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Statistiek voor A.I. College 12. Dinsdag 23 Oktober Statistiek voor A.I. College 12 Dinsdag 23 Oktober 1 / 20 2 Deductieve statistiek Orthodoxe statistiek 2 / 20 3 / 20 Jullie - onderzoek Wivine Tijd waarop je opstaat (uu:mm wordt weergeven als uumm). Histogram

Nadere informatie

Les 2: Toetsen van één gemiddelde

Les 2: Toetsen van één gemiddelde Les 2: Toetsen van één gemiddelde Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie & Biotechnologie 22 oktober 2018 Het statistisch testen van één gemiddelde is een veel voorkomende toepassing

Nadere informatie

S0A17D: Examen Sociale Statistiek (deel 2)

S0A17D: Examen Sociale Statistiek (deel 2) S0A17D: Examen Sociale Statistiek (deel 2) 21 juni 2011 Naam : Jaar en studierichting : Lees volgende aanwijzingen eerst voor het examen te beginnen : Wie de vragen aanneemt en bekijkt, moet minstens 1

Nadere informatie

toetskeuze schema verschillen in gemiddelden

toetskeuze schema verschillen in gemiddelden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets week 5: het toetsen van

Nadere informatie

Antwoordvel Versie A

Antwoordvel Versie A Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015 EXAMEN : Basisbegrippen statistiek Examen 16 januari 2015 Oplossingen 1 Vraag 1 a) Leg in max. 3 lijnen uit wat een dichtheidsfunctie is en illustreer met 3 duidelijk verschillende voorbeelden. Een (kans)

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking Opdracht 9a ----------- t-procedures voor een enkelvoudige steekproef Voor de meting van de leesvaardigheid van kinderen wordt als toets de Degree of Reading Power (DRP) gebruikt. In een onderzoek onder

Nadere informatie

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607 1. Om na te gaan of de gemiddelde bijdrage dezelfde is voor ziekenkas A en voor ziekenkas B heeft men op een toevallige wijze 30 personen geselecteerd waarvan 15 aangesloten zijn bij ziekenkas A en 15

Nadere informatie

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen Cursus Statistiek 2 Fellowonderwijs Opleiding Intensive Care UMC St Radboud, Nijmegen Cursus Statistiek 2 Steekproefgrootte en power berekening Vergelijken van gemiddelden (T-testen) Niet-parametrische

Nadere informatie

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Statistiek voor A.I. College 10. Donderdag 18 Oktober Statistiek voor A.I. College 10 Donderdag 18 Oktober 1 / 28 Huffington Post poll verkiezingen VS - 12 Oktober 2012 2 / 28 Gallup poll verkiezingen VS - 15 Oktober 2012 3 / 28 Jullie - onderzoek Kimberly,

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4 en 2S39) op maandag 2--27, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen Biostatistiek voor BMT (2S390) op 17-11-2003 U mag alleen gebruik maken van een onbeschreven Statistisch Compendium (dikt. nr. 2218) en van een zakrekenmachine.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets Vandaag Onderzoeksmethoden: Statistiek 4 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap: Hypothese toetsen t-toets

Nadere informatie

Les 1: de normale distributie

Les 1: de normale distributie Les 1: de normale distributie Elke Debrie 1 Statistiek 2 e Bachelor in de Biomedische Wetenschappen 18 oktober 2018 1 Met dank aan Koen Van den Berge Indeling lessen Elke bullet point is een week. R en

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Fasen in het onderzoeksproces

Fasen in het onderzoeksproces Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1 Bestand opmaken Variabelen definiëren:

Nadere informatie

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen? Opdracht 15a ------------ Spearman rangcorrelatie coefficient (non-parametrische tegenhanger van de Pearson correlatie coefficient) Wilcoxon symmetrie-toets (non-parametrische tegenhanger van de t-procedure

Nadere informatie

Statistiek voor A.I. College 2. Donderdag 13 September 2012

Statistiek voor A.I. College 2. Donderdag 13 September 2012 Statistiek voor A.I. College 2 Donderdag 13 September 2012 1 / 42 1 Beschrijvende statistiek 2 / 42 Extrapolatie 3 / 42 Verkiezingen 2012 4 / 42 Verkiezingen 2012 5 / 42 1 Beschrijvende statistiek Vandaag:

Nadere informatie

Les 5: Analysis of variance

Les 5: Analysis of variance Les 5: Analysis of variance 2de bachelor in de chemie en biologie 14/11/2018 Jeroen Gilis Gebaseerd op slides Caroline De Tender Testen die we tot nu toe gezien hebben: Toetsen van één gemiddelde ten opzichte

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek II. Sessie 5. Feedback Deel 5 Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

Faculteit der Wiskunde en Informatica

Faculteit der Wiskunde en Informatica Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4), op woensdag 7 januari 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Cursus Statistiek Parametrische en non-parametrische testen. Fellowonderwijs Intensive Care UMC St Radboud

Cursus Statistiek Parametrische en non-parametrische testen. Fellowonderwijs Intensive Care UMC St Radboud Cursus Statistiek Parametrische en non-parametrische testen Fellowonderwijs Intensive Care UMC St Radboud Vergelijken gemiddelde met hypothetische waarde 13 24 19 18 11 22 10 17 14 31 21 18 22 12 18 11

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Eindtoets Toegepaste Biostatistiek

Eindtoets Toegepaste Biostatistiek Eindtoets Toegepaste Biostatistiek 2013-2014 29 januari 2014 Dit tentamen bestaat uit vier opgaven, onderverdeeld in 24 subvragen. Begin bij het maken van een nieuwe opgave steeds op een nieuw antwoordvel.

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 18 t-toetsen 2 / 18 Steekproefgemiddelde en -variantie van normale observaties Stelling. Laat X 1,..., X n o.o. zijn en N(µ, σ 2 )-verdeeld. Dan:

Nadere informatie

Niet-Parametrische Statistiek

Niet-Parametrische Statistiek 10-11. Niet-Parametrische Statistiek I. Theorie : A Algemeen schema : 1 Steekproef willekeurige verdeling Teken-Toets symmetrische verdeling Wilcoxon-Rank-Toets 2 Steekproeven gepaarde waarnemingen Wilcoxon-Rank-Toets

Nadere informatie

Niet-parametrische Statistiek

Niet-parametrische Statistiek Niet-parametrische Statistiek Lieven Clement 2 de bach. in de Biologie, Chemie, Biochemie en Biotechnologie en Biomedische Wetenschappen statomics, Ghent University lieven.clement@ugent.be 1/57 Inleiding

Nadere informatie

SOCIALE STATISTIEK (deel 2)

SOCIALE STATISTIEK (deel 2) SOCIALE STATISTIEK (deel 2) D. Vanpaemel KU Leuven D. Vanpaemel (KU Leuven) SOCIALE STATISTIEK (deel 2) 1 / 57 Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele D. Vanpaemel

Nadere informatie

Sheets K&S voor INF HC 10: Hoofdstuk 12

Sheets K&S voor INF HC 10: Hoofdstuk 12 Sheets K&S voor INF HC 1: Hoofdstuk 12 Statistiek Deel 1: Schatten (hfdst. 1) Deel 2: Betrouwbaarheidsintervallen (11) Deel 3: Toetsen van hypothesen (12) Betrouwbaarheidsintervallen (H11) en toetsen (H12)

Nadere informatie

Modelexamen Statistiek

Modelexamen Statistiek NUMMER :. NAAM STUDENT :.. Modelexamen Statistiek Een onderzoek bij 200 varkens leverde een pak informatie en gegevens op. Hierna zie je een voorbeeld van de eerste 20 varkens (dus dit moet je alleen als

Nadere informatie

Verdelingsvrije statistiek

Verdelingsvrije statistiek Verdelingsvrije statistiek Inleiding In hoofdstuk II-5 (deel ) worden een aantal verdelingsvrije toetsen (ook wel niet-parametrische toetsen) besproken, die gebruikt worden als de te onderzoeken variabele

Nadere informatie

15.1 Beslissen op grond van een steekproef [1]

15.1 Beslissen op grond van een steekproef [1] 15.1 Beslissen op grond van een steekproef [1] Voorbeeld 1: Een vulmachine vult flessen met een inhoud van X ml. X is normaal verdeeld met μ = 400 en σ = 4 Er wordt een steekproef genomen van 40 flessen.

Nadere informatie

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN Interim Toegepaste Biostatistiek deel december 2009 Versie A ANTWOORDEN C 2 B C A 5 C 6 B 7 B 8 B 9 D 0 D C 2 A B A 5 C Lever zowel het antwoordformulier als de interim toets in Versie A 2. Dit tentamen

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Oplossingen hoofdstuk 9

Oplossingen hoofdstuk 9 Oplossingen hoofdstuk 9 1. Bestaat er een verband tussen het geslacht en het voorkomen van dyslexie? Uit een aselecte steekproef van 200 leerlingen (waarvan 50% jongens en 50% meisjes) uit het basisonderwijs

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6 MATERIALEN BIJ STATISTIEK (1991) JANUARI 010 Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 1 Antwoorden uitgewerkte opgaven week 1 11 15 Power-point sheets hoorcollege (over paragraaf

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur Kansrekening en statistiek wi2105in deel 2 27 januari 2010, 14.00 16.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na

Nadere informatie

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen. Oplossingen hoofdstuk IX 1. Bestaat er een verband tussen het geslacht en het voorkomen van dyslexie? Uit een aselecte steekproef van 00 leerlingen (waarvan 50% jongens en 50% meisjes) uit het basisonderwijs

Nadere informatie

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen 8.1. Stel dat medisch onderzoek heeft uitgewezen dat als het gemiddelde nicotinegehalte van een sigaret 25 mg of meer bedraagt, de kans op longkanker

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 13 Dinsdag 26 Oktober 1 / 24 2 Statistiek Indeling: Hypothese toetsen Filosofie 2 / 24 Hypothese toetsen 3 / 24 Hypothese toetsen: toepassingen Vb. Een medicijn wordt

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018 Les 5: ANOVA Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie 28 november 2018 1 Gebaseerd op de slides van Koen Van den Berge Testen die we tot nu toe gezien hebben: Toetsen van

Nadere informatie

Grafieken Cirkeldiagram

Grafieken Cirkeldiagram Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Beknopte handleiding SPSS versie 18.0 1 van 28

Beknopte handleiding SPSS versie 18.0 1 van 28 Beknopte handleiding SPSS versie 18.0 1 van 28 Beknopte handleiding SPSS versie 18.0 2 van 28 Inhoudsopgave Inleiding...3 SPSS- tips...4 Kopiëren van datakenmerken...6 Van SPSS naar Excel...7 Opsturen

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Faculteit der Wiskunde en Informatica 2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Opgave 1: (5 x 6 = 30 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 1 noodzakelijk)

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter. STATISTIEK OPLOSSINGEN OEFENZITTINGEN 5 en 6 c D. Keppens 2004 5 1 (a) Zij µ de verwachtingswaarde van X. We moeten aantonen dat E[M i ] = µ voor i = 1, 2, 3 om te kunnen spreken van zuivere schatters.

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie