Top Banner
Akontabilita (testová) ve vzdělávací politice Katedra Veřejné a sociální politiky FSV UK 11. ledna 2012 David Greger [email protected]
43

David Greger [email protected]

Mar 15, 2016

Download

Documents

erich-rice

Akontabilita (testová) ve vzdělávací politice Katedra Veřejné a sociální politiky FSV UK 11. ledna 2012. David Greger [email protected]. Akontabilita – (z)odpovědnost?. „ The process of evaluating school performance on the basis of student performance measures “ (Figlio, Loeb 2011) - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: David Greger david.greger@pedf.cuni.cz

Akontabilita (testová) ve vzdělávací politice

Katedra Veřejné a sociální politiky FSV UK11. ledna 2012

David [email protected]

Page 2: David Greger david.greger@pedf.cuni.cz

Akontabilita – (z)odpovědnost? „The process of evaluating school

performance on the basis of student performance measures“ (Figlio, Loeb 2011)

testování a akontabilita společenská proměnuje/nila i školu a pohled na vzdělání/vzdělanost

opožděné zavádění testování v SR a ČR otevírá řadu otázek, skýtá možnost poučení ze zahraničních zkušeností

testování je považováno za samozřejmost, podporuje jej levice i pravice, konzervativci i liberálové

Page 3: David Greger david.greger@pedf.cuni.cz

Akontabilita – (z)odpovědnost? Akontabilita - motivace, pobídky (odměny

a tresty) na základě dosažených výsledků Na úrovni školy a učitelů Důraz na výsledky: systém pobídek či

trestů za pro školy (učitele) za výsledky žáků

hlavní problém zjistit „čistý“ efekt školy?očištěný od charakteristik žáků, jejich předchozích znalostí, i efektů učení mimo školu (např. private supplementary tutoring)

Page 4: David Greger david.greger@pedf.cuni.cz

Akontabilita – (z)odpovědnost? „Testová akontabilita“ – test based

accountability- Jiné možnosti : sledování procesů i výstupů

kvalitativně (např. inspekční systémy)- Vliv choice a voice, individuální a

kolektivní1) odkaz na práci Hirschman (1970) Exit, Voice, and Loyalty: Responses to Decline in Firms, Organizations, and States.2) Hirschman uvádí pro příklad školství, že nejlepší by bylo neumožnit exit, aby se mohl realizovat voice ve všech školách.

Page 5: David Greger david.greger@pedf.cuni.cz

??? Neoliberální, ekonomický, tlak na vykazování

výsledků? Testy se závažnými dopady pro žáka/učitele/školu??? High-stakes tests & test-based accountability, součást hnutí New Public Management (1980s)

Anglie, USA Give us a break!!! (Sharon Gewirtz)

Page 6: David Greger david.greger@pedf.cuni.cz

Tradičně decentralizovaný systém, bez národního kurikula a státních testů i dalších zásahů do vzdělávání. Her Majesty Inspectorate (HMI) měl málo inspektorů, kontrola inspekce jen v malém vzorku škol.

1969-1976 tzv. Black Papers, série esejů z pera konzervativců upozorňuje na zhoršování anglických žáků v základních gramotnostech a poprvé navrhuje státní testování ve věku 7, 11 a 14 let. Autor tohoto eseje z r. 1975, Rhodes Boysen, se později stal ministrem školství ve vládě Margaret Thatcher.

Anglie – testování a pobídky/tresty

Page 7: David Greger david.greger@pedf.cuni.cz

1975-1976 William Tyndale affair. Velmi netradiční primární škola Ve vnitřním Londýnu. Škola neměla sepsané kurikulum, byla proti soutěživosti dětí, děti mohli ve škole do všech místností, včetně učitelských atp. Velmi liberální pojetí rodiče vnímali jako NEpoŘÁDek a chtěli děti odhlásit ze školy. Nařízeno vyšetřování (7 měsíců) a soud následně konstatoval pochybení jak učitelů, tak především zřizovatele, který neměl stanoven standard vzdělání a metody, kterými se jich dosahuje. Mediální publicita, změna pohledu na roli rodičů a odpovědnost za vzdělání není jen na škole.

Anglie – pokračování

Page 8: David Greger david.greger@pedf.cuni.cz

80. léta 20. stol. Margaret Thatcherová premiérkou, rychlý postup směrem k akontabilitě. Školský zákon z roku 1980 – školy musely rodiče seznámit s výsledky školy v národních testech a seznámit je podrobně s kurikulem.

1988 Education Reform Act – národní kurikulum, Key Stage 1 (5-7y.), Key Stage 2 (7-11y.), Key Stage 3 (11-14y.) a Key Stage 4 (2 roky k GCSE). Na konci každého KS povinné testy. Také otevření volby školy (school-choice) pro rodiče.

1981 zveřejnění výsledků SIMS (starší TIMSS).

Anglie – pokračování

Page 9: David Greger david.greger@pedf.cuni.cz

1992 zřízení OFSTEDu (Office for Standards in Education), 1992 první žebříčky škol dle GCSE, 1996 žebříčky i v primární škole

1997 nástup Tony Blaira, přesto však pokračování v akontabilitě na základě testů, žebříčky dále zveřejňovány, argumentace pro zvýšení standardů vzdělávání, ještě větší nárůst, Blaiming and shaming of schools, Hyper-akontabilita.. Navýšení rozpočtu školství = nutnost kontroly, ale také podpora školám pro dosahování standardů.

Anglie – pokračování

Page 10: David Greger david.greger@pedf.cuni.cz
Page 11: David Greger david.greger@pedf.cuni.cz

1840 - Počátky testování na velkých vzorcích, od 2, pol. 19. stol. New York States Regents Examination program

Od 1926 SAT Reasoning Test (Scholastic Aptitude Test), 1956 ACT – American College Testing – oba pro středoškoláky, používány jako jedno z kritérií k přijetí na americké univerzity.

50. léta 20. stol – testy používány jako low-stake, diagnostická funkce – identifikace potíží žáků v učení, formativní hodnocení (hodnocení pro učení). Normativní testy (NRTs)Pouze SAT již high-stake test pro studenty – přijímání na VŠ

USA – testování a pobídky/tresty

Page 12: David Greger david.greger@pedf.cuni.cz

1965 Elementary and Secondary Education Act (Předchůdce NCLB), první zásah federální vlády do vzdělávání v jednotlivých státech (federální financování i legislativa)

- součástí ESEA i Title I program, cíl zlepšení výsledků sociokulturně znevýhodněných žáků.- 1974 Title I Evaluation and Reporting System (TIERS) – evaluace T1 programu

60. léta 20. stol. National Assessment of Educational Progress (NAEP)

USA – testování pokračování

Page 13: David Greger david.greger@pedf.cuni.cz

70. léta 20. stol. Minimum competency testing movement – již kriteriální testy (CRTs),rozšíření testování na většinu států, plošné testování. Změna logiky dosud testování diagnostická funkce, snaha zlepšit vyučování a učení poskytnutím zpětné vazby. Nyní nově zlepšení díky tomu, že žáci skládají účty (akontability). Z počátku high-stakes pouze pro studenty.

80. léta 20. století , nástup test-based accountability- 1983 A Nation at Risk:The Imperative For Educational Reform , Reaganova konzervativní administrativa zavádí větší důraz na testování

USA – testování pokračování

Page 14: David Greger david.greger@pedf.cuni.cz

- 1983 A Nation at Risk:The Imperative For Educational Reform , Reaganova konzervativní administrativa zavádí větší důraz na testování.

- pokles výsledků am. žáků v SATu v 60. a 70. letech , nutnost hledat řešení

- odklon od měření minimálního standardu k náročnějším testům

- Dopady nejen na žáky, nyní již i na školy (byť zatím experimentování v některých státech)

USA – testování pokračování

Page 15: David Greger david.greger@pedf.cuni.cz

- Experimentování s finančními odměnami „dobrým“ školám, výměna vedení či rušení špatných škol, apod. Praxe, která se šířila a posilovala v 90. letech a vedla až k NCLB;

USA – testování pokračování

Page 16: David Greger david.greger@pedf.cuni.cz
Page 17: David Greger david.greger@pedf.cuni.cz

Close the achievement gap withaccountability, flexibility, parental choices,and research-based reforms

PURPOSE

Page 18: David Greger david.greger@pedf.cuni.cz

NCLB (2001) NCLB si klade za cíl zvýšit standardy

(kvalitu) vzdělávání a odpovědnost škol za výsledky žáků (akontabilitu)Definovaní evaluačních standardůKaždoroční testování žáků ve 3. až

8. ročníku ve čtení, matematice (přírodních vědách)

Page 19: David Greger david.greger@pedf.cuni.cz

NCLB – indikátor zlepšování = AYP Adequate Yearly Progress (AYP)

Definice (míra) úspěšnosti programu Určité stanovené % žáků pro daný rok musí

dosáhnout úrovně „proficient“ Procento žáků, kteří dosáhli úrovně

„proficient“ se musí rok od roku zvyšovat Zlepšování až k dosažení úrovně

„proficient“ v celé populaci žáků (do roku 2014)

Vše platí i pro definované subpopulace (podvýběry)

Page 20: David Greger david.greger@pedf.cuni.cz

NCLB 2001 Subgroups

Whites Blacks Latinos Asian / Pacific Islander American Indian / Alaskan Native Students on free lunch English Language Learners Students with disabilities Must reach 100% proficiency by 2013-2014

Page 21: David Greger david.greger@pedf.cuni.cz

Adequate Yearly Progress - Example

20012002 2002

200320032004

20042005

20052006

20062007

20072008

20082009

20092010

20102011

20112012

20122013

20132014

100%95%90%85%80%75%70%65%60%55%50%45%40%

40%BaselineTarget

2001-2002

100%Target

2013-2014

ACCOUNTABILITY

Page 22: David Greger david.greger@pedf.cuni.cz

NCLB – pobídky a tresty Při nedosažení standardu (ročně od 29 –

35 % škol) 2 roky po sobě: sepsání plánu na zlepšení,

DVPP, možnost pro žáky změnit školu (dle vlastní volby)

3 roky po sobě: viz výše + žáci dostávají „vouchery“ na doučování u privátních poskytovatelů

4 roky po sobě: “Corrective action”

Page 23: David Greger david.greger@pedf.cuni.cz

Opatření k napravení „nevýkonných škol“

● NCLB možnosti pro „turnaround“ (corrective actions)– Výměna učitelského sboru a vedení

školy– Předání školy státu (pokud není

veřejná)– Smlouva s privátním poskytovatelem– Převedení na “charter school”– „jakékoliv další zásadní změna“

Page 24: David Greger david.greger@pedf.cuni.cz

A co výsledky???

Test-based accountability obecně a NCLB

Page 25: David Greger david.greger@pedf.cuni.cz

Rétorika zprávy byla „nadnesená“, pokles nebyl tak dramatický, za jaký byl prohlašován k obhájení reforem.

Pokles v SATu dosáhl 0,25 – 0,4 směr. odchylky (tj. středně velká změny), ve verbálním testu až 0,5

Ovšem nebral se v potaz compositional effect, tedy změna v charakteristikách testované populace (SAT byl dobrovolný pro přijetí na VŠ, ne plošný)

USA – A Nation at Risk

Page 26: David Greger david.greger@pedf.cuni.cz

V novinách se dočteme, že navzdory 20 letům změn a reforem v návaznosti na A Nation at Risk výsledky žáků se přinejmenším nezlepšily, pokud se dokonce nezhoršily.

Ironie – v reakci na problém se rozšířilo testování, je mnohem více dat… přesto díky posilování dopadů výsledků testů na žáky/učitele/školy je méně dat, kterým můžeme věřit. High-stakes testy motivují k hledání zkratek ke zlepšování.(inflace – inflatio –nafukování, nefouknuté testové skóry)

USA– Co se stalo od „A Nation at Risk“

Page 27: David Greger david.greger@pedf.cuni.cz

USA– Co se stalo od „A Nation at Risk“ Z dat, která nejsou ovlivněny inflací

testových skórů především NAEP. NAEP od 80. let, téměř žádné zlepšení,

naopak matematika velká zlepšení.- 9-letí od 1982 do 2007 zlepšení o 0,84 SD

(tj. stejně jako rozdíl v TIMSSu mezi USA a Japonskem, nebo rozdíl mezi whites&African Amnericans)

- 13-letí od 1974 do 2006 zlepšení o 0,5 SD.- 17-letí od 1976 do 2006 o 0,2 SD.

Page 28: David Greger david.greger@pedf.cuni.cz

Percent Proficient in Wisconsin: Grade 4 Reading

Sources: Wisconsin Department of Public Instruction; National Center for Education Statistics

Page 29: David Greger david.greger@pedf.cuni.cz

Percent Proficient in Wisconsin: Grade 4 Math

Sources: Wisconsin Department of Public Instruction; National Center for Education Statistics

Page 30: David Greger david.greger@pedf.cuni.cz

Contrasts of Percent Proficient or above on NAEP

and State Assessments (Grade 8 Mathematics)

NAEP(low-stake), výběrové

Missouri 21%Tennessee 26%

Státní (high-stake),plošnéMissouri 16%Tennessee 87%

Kentucky KIRIS NAEP

Raw Gain 23.7 4

Standardized gain 0.52 0.13

Page 31: David Greger david.greger@pedf.cuni.cz

Trendy ve výsledcích (matematika), Kentucky

Page 32: David Greger david.greger@pedf.cuni.cz

Iluze zlepšování – test score inflation Nafouknuté testové skóry (srovnej RIV

body v ČR) Strategie: jednání, která zvyšují výsledky

v testu, která však nesouvisí se zlepšováním výsledků učení

A) Ovlivnění toho, kdo se účastní testování- Vyloučení (ze školy, z testování, je-li to možné)- Změna zařazení studenta (např. specifické potřeby apod.)- Opakování ročníku

Page 33: David Greger david.greger@pedf.cuni.cz

Iluze zlepšování – test score inflationB) Ovlivnění výsledků žáků v testu:- Příprava na test (teaching to the test),

časová alokace hodin před testem, aj.- Inflace testového skórů – např,

podvádění, atp. (příklad Slovensko – monitor)

Page 34: David Greger david.greger@pedf.cuni.cz

Proč se zabývat inflací test.skórů?

Výzkum ukazuje na velký vliv těchto behaviorálních reakcí na validitu usuzování o testovém skóru a jeho vývoj: bias of .50-.75 SD

Velikost tohoto zkreslení je škola od školy jiná Nevíme jaké je rozdělení této chyby (bias)

Nemůžeme hodnotit celkové zlepšení výsledků žáků

Děti zaostávají i přes iluze markatního zlepšování Nemůžeme hodnotit relativní zlepšení

K identifikování škol hodných odměny či trestu

Page 35: David Greger david.greger@pedf.cuni.cz
Page 36: David Greger david.greger@pedf.cuni.cz
Page 37: David Greger david.greger@pedf.cuni.cz

Evaluace efektů NCLB?Grade 4 Math Achievement

Source: Dee and Jacob, 2009.

After NCLBBefore NCLB

Page 38: David Greger david.greger@pedf.cuni.cz

Studie National Research Council NRC, USA, květen 2011 „Incentives and

Test-Based Accountability in Education“ Evaluace NCLB a jeho předchůdcůOdhad efektu TBE na základě meta-analýze

je 0.08 SD!!!

Page 39: David Greger david.greger@pedf.cuni.cz

Studie National Research Council Conclusion 1: Test-based incentive

programs, as designed and implemented in the programs that have been carefully studied, have not increased student achievement enough to bring the United States close to the levels of the highest achieving countries. When evaluated using relevant low-stakes tests, which are less likely to be inflated by the incentives themselves, the overall effects on achievement tend to be small and are effectively zero for a number of programs.

Page 40: David Greger david.greger@pedf.cuni.cz

Studie National Research Council Conclusion 1 cont.: Even when evaluated

using the tests attached to the incentives, a number of programs show only small effects. Programs in foreign countries that show larger effects are not clearly applicable in the U.S. context. Schoollevel incentives like those of NCLB produce some of the larger estimates of achievement effects, with effect sizes around 0.08 standard deviations, but the measured effects to date tend to be concentrated in elementary grade mathematics and the effects are small compared to the improvements the nation hopes to achieve.

Page 41: David Greger david.greger@pedf.cuni.cz

Studie National Research CouncilConclusion 2: The evidence we have reviewed

suggests that high school exit exam programs, as currently implemented in the United States, decrease the rate of high school graduation without increasing chievement. The best available estimate suggests a decrease of 2 percentage points when averaged over the population. In contrast, several experiments with providing incentives for graduation in the form of rewards, while keeping graduation standards constant, suggest that such incentives might be used to increase high school completion.

Page 42: David Greger david.greger@pedf.cuni.cz

Závěry Testy ano, jako zpětná vazba, omezit

možnost jiného využití pro hodnocení škol/učitelů

Používání testů k odměňování či trestání škol NE! Dosavadní výzkum ukazuje, že pozitivní efekt je zanedbatelný, téměř roven nule. Přitom přináší řadu vedlejších efektů, které zhoršují učení, postoje učitelů aj.

Page 43: David Greger david.greger@pedf.cuni.cz

Vámza

pozornost!!!

Děkuji