Om Magnus Hultén

Magnus Hultén (f. 1970) är professor i naturvetenskapernas didaktik vid Institutionen för beteendevetenskap och lärande, Linköpings Universitet. Magnus bedriver forskning om betyg, bedömning, målstyrning, utbildningspolitik samt naturvetenskapliga och tekniska skolämnen i folkskola och grundskola, deras innehåll och förändring. Han disputerade 2008 på avhandlingen Naturens kanon: formering och förändring av innehållet i folkskolans och grundskolans naturvetenskap 1842–2007. Magnus är civilingenjör och skrev 1999 licavhandlingen The compression/absorption heat pump: modelling and comparisons. Han har jobbat som pedagogisk utvecklare på Chalmers och med lärarutbildning på Lärarhögskolan i Stockholm, Stockholms universitet och KTH. Han driver just nu det av Riksbankens jubileumsfond finansierade projektet "Skolans målstyrning 1919-2020: från progressivism till NPM/nyliberalism".

Granskning av Åsa Wikforss kapitel 5 ”Kunskapen och skolan. Den svenska skolans fall” i Alternativa fakta (2017) Pocketutgåva, utgiven 2019.

Granskningen är pågående, alla delar är ännu inte granskade. Mejla magnus.hulten@liu.se om du finner fel i nedanstående granskning eller om du vill påtala fel i Wikforss kapitel som inte noterats nedan.

Övergripande kommentarer

  1. Källor. Ett genomgående problem är att flera av Wikforss nationella källor, som alltså kan säga något om hur det ser ut i Sverige, ofta är hämtade från debattsidor, ledare eller intervjuer med forskare. I flera fall har hon (avsiktligt?) feltolkat referenserna, alternativt utelämnat annan relevant information/empiri som gör att hennes slutsatser vacklar. Texten hade också tjänat på fler aktuella referenser. Att hon också så konsekvent endast använder källor som stödjer hennes narrativ blir problematiskt, då det står i direkt motsats till det vetenskapliga arbetssättet som kräver att empiri, teorier och slutsatser prövas och utmanas. 
  2. Anekdotisk evidens. Många av hennes påståenden stöds på anekdotisk evidens, snarare än på forskning och utredningar. Med anekdotisk evidens avses dels diverse ledare, intervjuer och debattartiklar, dels hennes egna upplevelser som förälder och som lärarstudent. Om hennes syfte hade varit att göra en diskursanalys av debatt- och ledarsidor hade detta varit en sak, men nu använder hon anekdotisk evidens för att uttala sig om lärares och pedagogers kunskapssyn och dess konsekvenser för undervisningen i svenska klassrum och slutligen för elevers kunskapsutveckling mätt i ex PISA. 
  3. Sakfel. Upprepade gånger har hon fel i sak.
  4. Märkliga slutsatser. Ofta saknas en logisk – och empirisk – koppling till påståenden eller referenser till hennes slutsatser. Även om hon och hennes källor må dela samma uppfattning om ett tillstånd – låt säga förekomsten av eget arbete eller att resultatspridningen mellan hög- och lågpresterande elever ökat – är det inte säkert att de delar uppfattningen om tillståndens orsaker. I flera fall kidnappar därmed Wikforss referenserna så att läsaren förleds tro att de delar samma orsaksförklaring. 
  5. Otydligt syfte orsakat av hennes dubbla ansats. Samtidigt som hon påpekar hon att hon inte kan uttala sig om ”om i vilken utsträckning dessa idéer faktiskt praktiseras i svenska skolor”[1] är hela skolkapitlet uppbyggt på ett sådant sätt att det gör anspråk på att beskriva ett kausalt flöde där A (konstruktivismen) leder till B (faktafientlig undervisning) med effekten C (sämre kunskaper bland eleverna, framförallt de resurssvaga). 
  6. Sanningsbegreppet. Wikforss underkänner alla andra sätt att definiera sanning som inte strikt håller sig till korrespondensteorin. Detta är inte ett rimligt förhållningssätt att alla vetenskaper ska tvingas använda ett och samma sanningsbegrepp och att all kunskap som producerats utifrån andra (ibland inte helt konsekventa) sanningsbegrepp ska underkännas. Ett inlägg som ger en mer nyanserad bild i frågan är Thomas Kaiserfeld, professor i idé- och lärdomshistoria vid Lunds universitet, i ett inlägg i tidningen Curie: https://www.tidningencurie.se/kronikor/hur-vi-ser-pa-sanning-far-konsekvenser-for-tvarvetenskap/

Alla dessa saker sammanlagt gör att hon – vilket är det märkligaste av allt – gör exakt det hon med boken vill motverka: spridning av alternativa fakta. 

Läsanvisning

Text i kursiv stil är direkta citat från Wikforss bok. Citaten efterföljs av kommentarer. I princip samtliga källor fram till s. 191 har faktagranskats. 

s.168-169

Under en följd av år har vi fått läsa om sjunkande resultat i OECD:s PISA-undersökningar /…/ och i IEA:s TIMSS-underökningar /…/ Efter att i slutet av 1990-talet ha legat över OECD:s snitt i läsförståelse, matematik och naturvetenskap sjönk vi fram till 2014 då vi hamnade en bra bit under genomsnittet. 

Kommentar: Första PISA-undersökningen genomfördes år 2000. PISA mäter 15-åringars förmågor i läsförståelse, matematik och naturvetenskap. TIMSS genomfördes första gången 1995 och mäter 4:e klassares och 8:e klassares kunskaper i matematik och naturvetenskap. I PISA räknas ett OECD-genomsnitt ut. I de svenska TIMSS-rapporterna räknas ett EU/OECD-genomsnitt fram. I de internationella TIMSS-rapporterna finns bara ett internationellt genomsnitt. PISA genomfördes öht inte år 2014. Däremot presenterades huvudresultaten från PISA 2012 år 2013 och framåt med fördjupade analyser och resultat från provet i Digital problemlösning (2014). 

I 2016 års undersökningar syns en bättring inom läsförståelse där vi nu återigen ligger över genomsnittet, samt en liten bättring inom matematik, där vi nu ligger på genomsnittet (inom naturvetenskap föreligger inte någon statistiskt säkerställd bättring). 

Kommentar: PISA genomfördes inte 2016, däremot presenterades resultaten från PISA 2015 år 2016. Anledningen till att Sverige hamnade på OECD-genomsnittet i naturvetenskap är för att OECD-genomsnittet sänktes. 

Möjligen är detta ett resultat av de olika insatser som gjorts de senaste åren, bland annat det så kallade matematiklyftet /…/ Det återstår att se om förändringen är varaktig. FOTNOT 197: Man bör också notera att förbättringen är resultatet av att de bästa blivit bättre, inte av att de svagaste lyfts. 

Kommentar: Enligt PISA 2015 har såväl resultatförsämringen som resultatförbättringen i matematik (som vi utgår från att hon pratar om här) varit tämligen jämn mellan lågpresterande och högpresterande, både när man tittar på andel svenska elever på olika prestationsnivåer och utifrån percentilvärden.[2] Också TIMSS 2015 visar på en tämligen jämn förbättring för både låg- och högpresterande elever i matematik utifrån samma mått.[3]

s. 169 

År 2013 fick åtta historiker ut i Uppsala Nya Tidning med ett nödrop. Problemet är inte bara att studenterna inte längre har de förkunskaper i historieämnet som krävs, varnar man, problemet är att de inte har det redskap som är nödvändigt för att över huvud taget kunna ta till sig humanistisk vetenskap – språket /…/ Tyvärr passar dessa nödropväl in på mina egna erfarenheter (vår markering)

Kommentar: Är nödrop och egna erfarenheter inte det som brukar kallas anekdotisk evidens?

Wikforss skriver att det var åtta historiker. Men det är nio historiker som står som författare: Hanna Enefalk (som ju kom att bli gruppens språkrör), Lars M Andersson, Viktor Englund, August Aronsson, Györky Novaky (som då var studierektor på grundutbildningen i historia), Magnus Svensson, Fredrik Thisner, Henrik Ågren och Maria Ågren. Åtta av dem tillhörde Uppsala universitet och en (Henrik Ågren) Linköpings universitet. Tidningen heter Upsala Nya Tidning (dvs med ett p).

Angående nödropen. Vad vi kan finna, med stöd av forskare inom området, finns inget forskningsstöd för föreställningen. Det finns ganska lite forskning om skrivförmåga över tid.

Skrivforskaren Martin Malmström vid Lunds universitet skriver följande till oss: ”Jag har inte ägnat mig åt detta sedan 2018, men fram till dess fanns i alla fall inte forskningsstöd (och jag borde ha fått höra om det kommit någon stor studie sedan dess). Jag gjorde själv ett försök att säga någonting om det (se Malmström, ”Kan våra studenter svenska?” i Educare 2018). Det är en liten undersökning av lösningar av det nationella provets skrivdel. Det jag fann var att sistaårsgymnasister runt 2010 gjorde i genomsnitt ett mer fel per hundra ord än eleverna på sjuttiotalet. Däremot skrev elever under sjuttio- och åttiotalen mer nominalt medan senare tiders gymnasisters texter var mer verbala (talspråkliga). Det kan naturligtvis också bero på att språket blivit mer talspråkligt präglat sedan dess. Något tvåtusentalets elever lyckades förhållandevis bra med var att strukturera sina texter. Vad jag konstaterar i texten är svårigheten med att undersöka nationella/centrala prov över tid, eftersom de ändrats radikalt (och dessutom var det ett annat betygssystem och det var färre som läste studieförberedande linjer). Det finns en språkteknolog som heter Viggo Kann som gjort ett par kvantitativa undersökningar av sina förstaårsstudenters skrivande. I en av korpusarna finns 1300 uppsatser från 2010 till 2016 skrivna av civilingenjörsstudenter. I en annan korpus har han 300 uppsatser från 2002 till 2013 skrivna av kognitionsvetarstudenter. Han har undersökt fel i texterna och andelen svåra ord. Han ser ingen större förändring från tvåtusentalets inledning och framåt. Möjligen använder fler studenter svåra ord, vilket han tar till intäkt för att de faktiskt skriver bättre i dag (se artikel i Språktidningen 7, 2017).”

Malmström fortsätter: ”I min avhandling kunde jag också konstatera att det klagats på elevers och studenters skrivande åtminstone sedan sjuttiotalet (jag startar där). Men tidigare undersökningar (t.ex. Andersson, 1986) har visat att det funnits skrivkrisutbrott även tidigare under nittonhundratalet (t.ex. på 30- och 50-talet).”

s.170

En av skolans mest centrala mål är att fostra kreativa, kritiskt tänkande och problemlösande individerLänge har man intalat sig att den svenska skolan åtminstone lyckas väl i det avseendet / …/ Tyvärr finns det ingen evidens för att det är sant. Tvärtom visar PISA-undersökningen från 2014 att svenska elever är sämst i Norden när det gäller problemlösning. 

Kommentar: PISA genomfördes inte 2014. Däremot publicerades resultaten från provet i Digital problemlösning år 2014. Sverige och Danmark presterade på samma nivå och under OECD-genomsnittet, medan Finland och Norge var bättre än Sverige. [4] Detta hade varit lätt för Wikforss att kolla upp om hon hade läst OECDs och Skolverkets PISA-rapporter, vilka hon inte konsulterat en enda gång i boken (åtminstone inte om man utgår från referenslistan).  

s.171-172

Det avgörande är vad läraren gör. /…/ läraren är engagerad, aktiv och kunnig /…/ Eleverna behöver tydliga kunskapsmål, tydlig återkoppling, och höga förväntningar /…/ Det synliga lärandet, i Hatties bemärkelse, står i direkt motsats till den syn på lärande som dominerat den svenska skolan under de senaste decennierna, konstruktivismen /…/ Hattie vänder sig mot konstruktivismen som en teori om undervisning. 

Kommentar: Förutom att Hatties metastudie kritiserats för att dra för långtgående slutsatser, menar Hattie själv att många missuppfattat hans syn på konstruktivism. Det finns, medger han, en konstruktivistisk teori om lärande men inte om undervisning.[5] När det gäller effekter av olika påverkansfaktorer som Hattie lyfter fram så är ”tydlig undervisning”, ”återkoppling på prestationer” och ”förväntningar” exempel på sådana med goda effekter. Men det finns även andra faktorer såsom ”formativ bedömning”, ”mångsidiga insatser för elever i behov av särskilt stöd”, ”undervisning i problemlösning” och ”kommunikativ/ömsesidig undervisning” som har minst lika goda effekter eller bättre på elevers lärande. En av Hatties stora poänger är att en skicklig lärare har tillgång till flera olika undervisningsmetoder som hen kan anpassa efter eleverna och klassrumssituationen. Det här nämns överhuvudtaget inte av Wikforss. 

Se:[6]



Från Hatties bok Synligt lärande (2014 års utgåva), se nedan. Notera att ”Piagets program” har en av de högsta effektstorlekarna, dvs ett undervisningsprogram baserat på konstruktivismens fader Jean Piaget. Hur förklaras Wikforss att undervisning baserad på konstruktivism fungera så bra med tanke på hennes kritik mot konstruktivismen? Metoderna kunde se väldigt olika ut och exakt vilka filosofiska, pedagogiska och psykologiska utgångspunkter framgår inte. Många tillämpade undersökande arbetssätt och satte lärprocesser i fokus snarare än fakta. För mer om dessa program, se Sjøberg.

s.173-174

Wikforss citerar Skolverkets rapport ”Lusten att lära – med fokus på matematik” från 2003, som baseras på granskning utförd år 2001 – 2002. Som titeln anger syftade kvalitetsgranskningen till att undersöka hur elevers lust att lära väcks och hålls i liv i förskolor, skolor och vuxenutbildning i matematikämnet. Det är alltså ingen granskning av undervisningsmetoder eller kunskapssynen bland svenska lärare rent generellt. Förutom att hon på ett tämligen ohederligt sätt lyfter ut textstycken som passar hennes syften, samtidigt som hon utelämnar andra slutsatser från granskningen, som inte stödjer hennes påståenden, kan man ifrågasätta hur relevant det är att år 2017 dra slutsatser kring undervisningen i svenska klassrum baserat på en granskning som gjordes för över 15 år sedan och utifrån läroplaner som inte längre gäller. Att saker och ting kan ha förändrats under den perioden problematiserar hon inte alls. I vetenskaplig anda hade hon kunnat jämföra den bild som gavs 2001 -2002 med senare empiri. Möjligt är att hon hade fått samma bild, men då hade hon åtminstone på vetenskapliga grunder kunnat fastslå att så är fallet.  

Wikforss citerar: 

I samband med införandet av läroplanerna, Lpo94 och Lpf94, och betoningen på den
kunskapssyn som starkt lyfter fram den lärandes egen aktivitet för att nå kunskap, kom också
lärarens roll att diskuteras. En tolkning som utifrån detta synsätt gjordes från såväl statligt,
kommunalt som fackligt håll och som fått stor spridning innebär att kunskap inte går att
förmedla eller överföra från en individ till en annan, från den som undervisar till den som lär.
Lärande förutsätter stark egenaktivitet från den lärandes sida, medan den som undervisar kan
skapa förutsättningar för lärande. Därmed ansågs heller inte den form av undervisningspraktik som var rådande och som i dagligt tal går under begreppet ”förmedlingspedagogik” eller ”katederundervisning” som någon framkomlig väg för elevers lärande. Lärarens roll måste istället förändras, ansåg man, och i stället för att ”förmedla” kunskap skulle läraren ”handleda” eleven i dennes lärande. Lärarens undervisande roll tonades på så sätt ner till att stödja och handleda medan ansvaret för elevens kunskapsutveckling i betydligt större utsträckning lades på eleven själv.
[7]

Kommentar: Wikforss utelämnar dock det som skrivs längre ner på samma sida: ”Enligt de nationella målen skall skolan sträva efter att varje elev tar personligt ansvar för sina studier och sin utbildningsmiljö. Men problemet är att begreppen egentligen aldrig fick en tydlig, någorlunda gemensam tolkning på vare sig statlig eller kommunal nivå. De antog i mångt och mycket formen av luftig retorik /…/ I samtal med såväl elever som lärare och andra aktörer inom skolväsendet kan man följaktligen se att begreppen har tolkats och realiserats mycket olika inom skolor och bland lärare, från ett aktivt, lyhört och stimulerande lärarledarskap till en situation där läraren närmast dragit sig tillbaka och överlämnat eleven till sitt eget ’ansvar’. Det måste samtidigt betonas att en anpassning av både lärares och elevers agerande är uppenbart nödvändigt utifrån de krav och förväntningar som skapas av samhällsutvecklingen /…/ Den form av handledarroll som bl.a. många matematiklärare praktiserar, liksom förväntningar på elevernas eget ansvarstagande, lämnar därför efter granskningen en del obesvarade frågor /…/”[8]

Granskningen indikerar att många av de elever som tappat sin motivation och lust att lära matematik gjort det på grund av individualiseringen av matematikundervisningen i form av enskilt arbete som inte tagit tillräckligt mycket hänsyn till elevernas olika behov. Enligt granskningen har Lpo94, Lpf94 och Lfö98, som gällde 2001 – 2002, påverkats av olika teorier om lärande: socialkonstruktivistisk teori, metakognitiv teori där kognitiv teori ingår och symbolisk interaktionism.[9]

Granskningen konstaterar också att undervisningen på de granskade skolorna varierar både sett till lärmiljöer och kvalitet. En viktig slutsats i rapporten är att det inte med enkelhet går att ”ange vilka specifika lärmiljöer som skapar lust eller olust, och kategoriskt säga att t.ex. det som i dagligt tal brukar kallas ’individualisering’ är ’bra’ eller ’katederundervisning’ automatiskt är ’dåligt’ /…/ olika elever/elevgrupper liksom individer i olika åldrar har skilda behov och reagerar olika på likartade undervisningssituationer /…/ det finns knappast en modell som i sig garanterar hög kvalitet /…/ Utifrån denna granskning och de observationer som gjorts kan vi alltså inte entydigt slå fast att en speciell undervisningsmodell är den ’rätta’ ”[10]

När högstadielärare tillfrågas om motiven bakom tillämpningen av arbetssättet enskilt arbete i en form där eleverna sitter och räknar i matematikböckerna och läraren går runt och hjälper dem, anger de att den modellen ger eleverna möjlighet att arbeta utifrån sina förutsättningar och att det är ett sätt att hantera alltför stora grupper. Ingen, åtminstone inte som det rapporteras i granskningen, förklarar sina metoder med någon specifik kunskapssyn.[11]

Citatet i Wikforss bok är alltså korrekt, men ryckt ur sitt sammanhang och får därmed en annan innebörd och speglar inte kvalitetsgranskningens slutsatser. 

s.175

Efter att i början av 1980-talet ligga i toppen i PISA-undersökningar och ha en av världens mest likvärdiga skolor (tillsammans med Sverige), började Frankrikes resultat sjunka i början av 1990-talet. 

Kommentar: PISA genomfördes första gången år 2000. 

I början av sidan hänvisar hon till E. D. Hirsch, ”Why knowledge matters: rescuing our children from failed educational theories”. En typ av kontroversiella böcker som Wikforss lutar sig emot (Mer systematisk genomgång kommer). Bokens vetenskapliga värde har dock ifrågasatts. Pamela Bolotin Joseph skriver i Educational review: ”In conclusion, the strengths of this book include discussions of the limitations of skills-based curriculum and testing as well as critique of fragmented curriculum and endorsement of rich integrated content. Nonetheless, the author’s representations of educational theories, American educational history, and multicultural education seriously weaken this book as an informed con- tribution to conversations about curriculum and schooling.” (Pamela Bolotin Joseph (2017) Why knowledge matters: rescuing our children from failed educational theories, Educational Review, 69:4, 530-531, DOI: 10.1080/00131911.2017.1286818)

s.177

Kopplat till den konstruktivistiska pedagogiken är också tanken att ämneskunskaper är mindre viktiga för lärarna /…/ Flera forskare har lyft detta som en viktigt bidragande orsak till den svenska skolans fall. Hans Albin Larsson /…/ menar till exempel att en stor del av skulden ligger i nedvärderingen av lärarnas ämneskunskaper. 

Kommentar: Referensen till Hans Albin Larssons påstående är en ledare i Dagens Nyheter från 140402, som handlar om ett SNS-seminarium med rubriken ”Den svenska skolan – flumskola eller modern och framåtblickande?” I ledaren står mycket riktigt: 

”En av talarna på SNS-seminariet är den alltid underhållande och tänkvärde Hans Albin Larsson, professor på Högskolan för lärande och kommunikation i Jönköping. I hans ögon ligger en stor del av skulden för kunskapsraset i nedvärderingen av lärarnas ämneskunskaper.

Som exempel tar han upp hur ämnen som historia och matematik försvann, klumpades ihop med andra till SO och NO som i sin tur krympte i läroplanerna. Samtidigt som kraven på elevernas kunskaper minskade tvingades lärarna undervisa i ämnen som de inte behärskade, och ålades dessutom mer administration.

Lärarrollen förändrades, enligt Larsson, från någon som är expert på sitt ämne till en person som går runt och är lite allmänt vuxen i skolan medan han eller hon ”främjar olika typer av elevaktiviteter”. Den förskjutningen menar han är kopplad till 60- och 70-talens vänstervåg. Den som radikalt vill förändra samhället är förstås tvungen att radikalt förändra skolan.” [12]

Vid SNS-seminariet medverkar Ulf P Lundgren, Hans Albin Larsson och Ingrid Carlgren. Alla tre är mycket tydliga med att det har skett en förskjutning och förgrening av progressivismen (som hos Wikforss likställs med konstruktivism) så som den ursprungligen utformades och med hur den uppfattas idag, framförallt av dess kritiker. Flera gånger understryker Larsson att det som skett, vare sig det handlar om försämrade kunskapsresultat i PISA eller den förändrade lärarrollen, inte kan skyllas på progressivismen. Snarare kopplar Larsson samman den nya lärarrollen med såväl vänstervågen på 1970-talet som marknadiseringen av skolan under 1990-talet.[13]

De slutsatser Wikforss gör, dvs. att konstruktivismen lett till en förändrad lärarroll där ämneskunskaper har fått mindre betydelse, kan hon alltså inte stödja på Hans Albin Larsson, eftersom han helt enkelt inte drar någon sådan koppling, snarare tvärtom. Som Larsson poängterar ”det kan vi inte lasta progressivismen för, utan vi kan lasta det som har skett under påståenden och åberopande av progressivistiska grundvärden, men det är alltså något annat, det är viktigt att komma ihåg”. Hon skriver i och för sig att ”flera forskare” lyft fram konstruktivismen som boven i dramat, men hon har inga referenser till dessa. 

s.179-180

Med hänvisning till Jonas Linderoths bok ”Lärarens återkomst” (2016) och en presskonferens angående PISA-resultaten år 2014, skriver Wikforss att det är de resurssvaga eleverna som är de stora förlorarna på de arbetsformer som konstruktivismen förespråkar och att detta också var den slutsats som forskare gav uttryck för vid en presskonferens angående PISA-resultaten vid Göteborgs universitet 2014. Jan-Eric Gustafsson, professor i pedagogik, betonar att nedgången i PISA-resultaten är avsevärt mindre om man tar hänsyn till elevernas sociala bakgrund. 

Kommentar: Eftersom referens till denna påstådda presskonferens saknas har vi inte kunnat granska om Jan-Erik Gustafsson och de andra forskarna drar slutsatsen att konstruktivismen förstärkt skillnader i elevers kunskaper utifrån deras socioekonomiska status.[14] Däremot är förekomsten av eget arbete sedan länge både uppmärksammat och kritiserat av många utbildningsforskare och Skolverket. Dock utan att ange konstruktivismen som orsak, utan istället i kraven på att individualisera undervisningen.[15]  

Wikforss fortsätter att stödja sitt resonemang ytterligare på en intervju med Jan-Eric Gustafsson. I intervjun står att Gustafsson säger att Sverige ligger näst högst av OECD-länderna när det gäller andelen eget arbete.

Kommentar: I intervjun står att Gustafsson säger att undervisningen är mindre lärarledd och istället präglas av mycket eget arbete, vilket ökat elevernas ansvar för sitt eget lärande och att denna typ av individualisering haft en negativ effekt på elevers lärande, framförallt för elever från resurssvaga hem. Angående Gustavssons påstående att ”Sverige ligger näst högst bland OECD-länderna vad gäller just eget arbete”[16] utgår vi från att det avser PISA 2012, eftersom det är där ett OECD-genomsnitt räknas ut och att intervjun verkar vara gjord 2014. 

Vad säger då PISA 2012 om detta? 15-åringarna i PISA har fått ta ställning till olika påståenden om matematikundervisningen. Påståendena i sin tur bildar fyra olika index:[17]

  1. Kognitiva aktiviteter (Index of teachers’ use of cognitive-activation strategies)
  2. Formativ bedömning (Index of teachers’ use of formative assessments) 
  3. Elevorienterad undervisning (Index of teachers’ student orientation)
  4. Lärarorienterad undervisning (Index of teacher-directed instruction)

Vad PISA 2012 visar är att elevorienterad undervisning är betydligt vanligare i Sverige, formativ bedömning något vanligare i Sverige relativt OECD-genomsnittet och att lärarorienterad undervisning är nästan lika vanligt i Sverige som i OECD samt att kognitiva aktiviteter är ovanligare i Sverige.[18] I den svenska PISA 2012-rapporten står att bland ett urval av länder är elevorienterad undervisning vanligast i Ryssland och Sverige.[19]

Hur ser då elevsvaren ut på påståendena i indexet för Elevorienterad undervisning ut (andel elever som håller med om påståendena)? 

  • Läraren ger olika uppgifter till klasskamrater som har svårt att lära sig och/eller till dem som kan gå vidare snabbare (SWE: 62%, OECD: 30%)
  • Läraren delar ut projektuppgifter som tar minst en vecka att genomföra (SWE: 19%, OECD: 17%)
  • Läraren låter oss arbeta i smågrupper för att komma fram till gemensamma lösningar på problem eller uppgifter (SWE: 33%, OECD: 23%)
  • Läraren ber oss hjälpa till att planera klassrumsaktiviteter eller teman (SWE: 13%, OECD: 17%). 

Sammanfattningsvis kan alltså konstateras att det framförallt är inom två påståenden i kategorin Elevorienterad undervisning där svenska elever sticker ut; individuellt anpassade uppgifter till eleverna och arbeten i smågrupper. 

Om man utifrån PISA vill göra en seriös analys av matematikundervisningen för 15-åringar – som alltså inte kan generaliseras till all undervisning i alla årskurser – kan man förstås inte enbart fokusera på en typ av undervisningsmetoder. Eftersom lärarledd undervisning i Wikforss värld är den elevorienterade undervisningens diametrala motsats, borde hon vara intresserad av att undersöka förekomsten av båda dessa undervisningsmetoder. Om vi tittar på svarsmönstren för respektive påståenden ser de ut så här (andel elever som håller med om påståendena): 

  • Läraren ställer upp tydliga mål för vår inlärning (SWE: 67%, OECD: 69%)
  • Läraren ber mig eller mina klasskamrater att visa hur vi har tänkt eller resonerat (SWE: 71%, OECD: 56%)
  • Läraren ställer frågor för att kontrollera om vi har förstått det som undervisas (SWE: 68%, OECD 71%)
  • I början av lektionen gör läraren en kort sammanfattning av den förra lektionen (SWE: 34%, OECD: 41%)
  • Läraren berättar för oss vad vi måste lära oss (SWE: 77%, OECD: 80%). 

Och om man dessutom vill försöka koppla undervisningsmetoder till resultat kanske man ska ta fasta på att det endast är kognitiva aktiviteter som visar ett positivt samband med höga PISA-poäng i matematik, samt att en höjning av index med en enhet för alla undervisningskategorier utom kognitiva aktiviteter uppvisar sämre matematikresultat, och att elever som ofta får Elevorienterad undervisning presterar sämre på PISA-provet i nästan samtliga länder, inklusive Sverige.[20]

Sen kan man förstås diskutera tillförlitligheten i såväl enkätsvaren som korrelationerna mellan enkätsvar och PISA-resultat, men det är en annan diskussion. Problemet här är att Wikforss drar slutsatser om situationen i svenska klassrum utifrån en intervju med förvisso en av världens främsta utbildningsforskare, men utan att a) veta om Gustafsson verkligen har påstått detta, b) om han påstått det, finns det andra centrala fakta som i sammanhanget också behöver tas med för att sätta in dem i ett korrekt sammanhang och c) förhåller det sig verkligen så som Gustafsson säger? Det gör man enklast genom att kolla ursprungskällan.[21]

s.182-184

Jag är inte skolforskare och tänker inte försöka besvara frågan vad som ligger bakom den svenska skolans fall. 

Kommentar:  Som läsare blir det här påståendet väldigt motsägelsefullt, eftersom hela hennes resonemang fram till nu byggts upp kring narrativet om hur konstruktivismen som kunskapssyn och pedagogisk metod orsakat fallet i internationella kunskapsmätningar. 

Jag anser dock att man måste ta empirisk evidens på allvar och att den evidens Hattie sammanställt ger mycket starkt stöd för tesen att undervisningens innehåll varit en avgörande faktor /…/ 

Kommentar:  Att det som sker i klassrummet, dvs. vad läraren gör, hur relationen mellan elever och lärare ser ut, hur läraren undervisar och i vad, hur klassrumsklimatet ser ut etc. spelar självklart roll och det har väl knappast någon seriös pedagog/utbildningsforskare någonsin ifrågasatt. Problemet är att Wikforss misslyckas med att leda i bevis hur det ser ut i svenska klassrum, samt att hon läst Hattie slarvigt. 

Ser man till svensk pedagogisk forskning är den emellertid mycket liten del evidensbaserad. År 2011 gjorde Knut Sundell /…/ en kartläggning av 1 402 avhandlingar inom det samhällsvetenskapliga området (skrivna mellan 1997 och 2006). Ett av hans mål var att utreda hur stor andel av forskarna som arbetade med effektutvärderingar i kontrollerad form. Pedagogik hamnade i botten. Endast 6 % av avhandlingarna hade som syfte att granska effekterna av pedagogiska arbetssätt och av dem var det bara en tredjedel som var gjorda på ett sådant sätt att de kan uttala sig om effekter. Detta i ett ämne som är i grunden empiriskt. 

Kommentar: Här blir det ännu svårare att hänga med. På vilket sätt, menar Wikforss, är Sundells och Stenssons resultat en intäkt för förekomsten (såväl hög som låg) av en konstruktivistisk kunskapssyn bland pedagoger? Är det också relevant att år 2017 fastslå forskningsläget inom pedagogisk forskning baserat på en undersökning som avser åren 1997 – 2006 och som avgränsades till? Det är mycket möjligt att bilden är densamma nu som då, men det får vi aldrig veta. Dessutom är pedagogik ett bredare ämne än enbart avgränsat till skolan. En snabb översikt bland de granskade avhandlingarna visar att flera studerat andra empiriska områden än skolan. 

Kanske även mer allvarligt är att Wikforss har fel i sina slutsatser av Sundells och Stenssons studie. För det första ligger kriminologi i botten (noll procent).[22] För det andra avser den där tredjedelen andelen av de 31 procent av samtliga ämnens (181) avhandlingar som ansågs ha hög kvalitet. I figur 4, sid 20 visas hur stor andelen av samtliga effektutvärderingar som bedömts ha god kvalitet fördelar sig mellan de olika undersökta disciplinerna. Enligt utvärderingen höll totalt 31 % av alla effektutvärderingar hög kvalitet. 15 % av dessa kom från Omvårdnad, 7 % från Folkhälsovetenskap, 5 % från Psykologi, 2 % Pedagogik, 2 % Socialt arbete, <1 % Sociologi och 0 % Kriminologi.[23]Andelen effektutvärderingar med hög kvalitet inom respektive forskningsämne förefaller sig mao tämligen förväntad. Det hade varit mer kontroversiellt om andelen högkvalitativa effektutvärderingar av samtliga varit högre inom ex pedagogik än inom omvårdnad, eftersom andelen effektutvärderingar är högre inom omvårdnad. 

I en fotnot hänvisar hon också till Skolkommissionens delbetänkande, som konstaterar att effektstudier är ovanligt inom svensk skolforskning. Dock utelämnar hon Skolkommissionens bedömning att detta är en följd av den låga förekomsten av försöksverksamhet. [24] Metodologiska och forskningsetiska problematiseringar av effektstudier inom olika forskningsfält ignorerar hon helt, som att det är mer komplicerat med effektstudier inom vissa områden jämfört med andra. Om man jämför skola och vårdvetenskap är det svårare att isolera effekter i skolan till skillnad från en enskild behandling. Det kan vara en förklaring till den låga förekomsten av effektstudier inom pedagogik även i andra länder, enligt Sundell och Stensson.

Men det handlar inte bara om att svenska pedagoger anammat en problematisk, konstruktivistisk pedagogik. Det handlar också om den konstruktivistiska syn på kunskap man propagerat för och de slutsatser man dragit om pedagogiska arbetsformer. Linderoth trycker på att det inte finns någon nödvändig koppling mellan den konstruktivistiska synen på kunskap och den konstruktivistiska synen på pedagogiska arbetsformer. Om man accepterar tanken att kunskap är en konstruktion innebär det inte automatiskt att man accepterar att undervisning måste vara elevcentrerat undersökande och att aktiva lärare är något dåligt. Hattie gör samma poäng. Konstruktivismen, menar han, är inte en undervisningsteori utan en teori om kunnande som är viktig för att förstå betydelsen av att bygga upp förståelsemönster /…/ Detta är korrekt: Man kan hävda att kunskap är en konstruktion utan att för den skull gå med på testen att bästa sättet att få kunskap är att konstruera den själv. Bland svenska pedagoger görs dock en tämligen direkt koppling mellan den konstruktivistiska synen på kunskap och den konstruktivistiska pedagogiken, vilket Linderoth också betonar. 

Kommentar: Påstående 1: att svenska pedagoger anammat en problematisk, konstruktivistisk pedagogik. Vilka är dessa pedagoger? Avses forskande pedagoger eller praktiserande pedagoger? Eller både och? Tidigare har hon skrivit att hon inte kan uttala sig om svenska lärares kunskapssyn och undervisningsmetoder, samtidigt gör hon sådana antaganden hela tiden. Och vad består denna konstruktivistiska pedagogik i? Och hur definierar hon egentligen pedagoger? Inbegrips även didaktiker och ämnesdidaktiker? 

Påstående 2: den konstruktivistiska kunskapssynen som dessa pedagoger – vilka de nu är – propagerat för och de slutsatser de dragit om pedagogiska arbetsformer. Det finns alltså olika konstruktivistiska kunskapssyner av vilka några är bättre än andra, men de svenska pedagogerna har antagit den sämre? Hur skiljer sig den svenska från de andra konstruktivistiska kunskapssynerna? Och vilka slutsatser har dessa pedagoger dragit om vilka pedagogiska arbetsformer? Om det nu finns flera konstruktivistiska kunskapssyner, hur vet Wikforss när hon refererar till utländska forskare och utbildningsexperter att de pratar om den kunskapssyn och den pedagogik som dominerar i Sverige? Påstående 3: svenska pedagoger gör en tämligen direkt koppling mellan den konstruktivistiska synen på kunskap och den konstruktivistiska pedagogiken. I föregående påstående antyder Wikforss att det finns flera konstruktivistiska kunskapssyner, av vilka svenska pedagoger valt den sämsta. Här pratar hon om den konstruktivistiska synen på kunskap och den konstruktivistiska pedagogiken. Menar hon den dåliga konstruktivistiska kunskapssyn som just svenska pedagoger anammat och medföljande pedagogik? Eller pratar hon om en allena rådande konstruktivistisk kunskapssyn och pedagogik?  

s.184-185

Låt mig genast betona en sak. När jag talar om ”skolans” syn på kunskap avser jag inte att uttala mig om i vilken utsträckning dessa idéer faktiskt praktiseras i svenska skolor. Det skulle kräva empiriska undersökningar av ett slag som inte genomförts. Jag uttalar mig alltså inte om vad lärarna faktiskt gör utan syftar bara på den syn på kunskap som skolforskare och styrdokument ger uttryck för. Linderoth ger starka skäl att tro att konstruktivistiskt inspirerad pedagogik varit central på våra lärarhögskolor och faktiskt praktiserats i våra skolor, men det föreligger inga kvantitativa studier i frågan. 

Kommentar: Här blir det motsägelsefullt igen, eftersom hela texten gör anspråk på att förklara sakernas tillstånd i svenska klassrum. Dessutom har hon tidigare i texten generaliserat väldigt grovt med formuleringar som ”svenska pedagoger har anammat en problematisk, konstruktivistisk pedagogik”. Om nu inte detta är målet, varför öht hänvisa till resultat från ex PISA 2012 om hur undervisningen ser ut i svenska klassrum? Om Wikforss inte velat gå in på den frågan hade hon kunnat nöja sig med att enbart analysera styrdokument. Vidare hänvisar Wikforss till lärar- och rektorsenkätstudien TALIS 2013, där lärare tillfrågades om:

i vilken utsträckning de håller med om ett antal konstruktivistiska normer, till exempel att ”min roll som lärare är att underlätta elevernas eget sökande efter kunskap” och ”eleverna lär sig bäst genom att på egen hand hitta lösningar på problemen.” I genomsnitt håller 83-94% av lärare i dessa länder med om de konstruktivistiska normerna vilket visar på hur allmänt omfattad den konstruktivistiska synen på lärande är världen över. Svenska lärare hamnar något under genomsnittet. I en rapport efteråt beskriver Skolverket detta som överraskande och ställer sig frågan varför det är så. Deras hypotes är att det kan ha med frågornas formulering att göra eftersom de snarare fångar en individkonstruktivistisk syn än en socialkonstruktivistisk vilken är den framträdande svenska kunskapssynen. Jag tror det kan ligga något i detta. 

Kommentar: De påståenden som lärarna fått ta ställning till är (i parentes andel lärare som håller med om påståendet i Sverige och genomsnitt för alla länder, INT SNITT): 

  • Min roll som lärare är att underlätta elevernas eget sökande efter kunskap (SWE 83,3 %, INT SNITT 94,3%)
  • Eleverna lär sig bäst genom att på egen hand hitta lösningar på problemen (SWE 44,9%, INT SNITT 83,2%)
  • Eleverna måste få möjlighet att på egen hand komma fram till lösningar på problemen innan läraren visar hur de ska lösas (SWE 82,3%, INT SNITT 92,6%)
  • Tankeprocessen och resonerandet är viktigare än det specifika faktainnehållet enligt kursplanen (SWE 82,1%, INT SNITT 83,5%). 

Så ja, om man ska tro TALIS är det som Wikforss säger: konstruktivismen har brett ut sig världen över, dock i lägre utsträckning i Sverige. På andra påståendet, det om att eleverna lär sig bäst genom att på egen hand hitta lösningar på problem, ligger svenska lärare dessutom inte ”något” under det internationella genomsnittet. Lärare i OECD håller med om detta påstående i nästan dubbelt så stor utsträckning jämfört svenska lärare. Och om nu denna kunskapssyn är så förödande för elevers kunskapsbyggande borde den rimligen haft en negativ påverkan på exempelvis de sydkoreanska och singaporianska PISA-resultaten, eftersom lärarna där är mer konstruktivistiska än svenska lärare.[25]

I den svenska TALIS-rapporten som Skolverket står bakom, skriver man, som Wikforss säger, att en socialkonstruktivistisk syn – dvs. att elever konstruerar kunskap i interaktion med andra – är framträdande i Sverige. Till denna möjliga förklaring finns en not till en rapport under publicering. Rapporten var dock publicerad när Wikforss skrev sin bok. I den rapporten, som skrivits av Ylva Ståhle vid Stockholms Universitet, beskrivs TALIS-studiens ramverk: 

”I ramverket framhålls att lärare som har en konstruktivistisk grunduppfattning skapar mer kognitivt utmanande uppgifter och stödjer därmed elevers utveckling mot högre kognitiva kompetenser. I enkäten framträder främst ett individkonstruktivistiskt perspektiv (lärarenkät, fråga 32) och frågor i relation till vårt svenska mera sociokulturellt förankrade synsätt är inte lika tydligt framskrivna (lärarenkät, fråga 42b). En socialkonstruktivistisk kunskapssyn betyder att vi konstruerar vår verklighet, vår förståelse av den, i ett socialt sammanhang. Med hjälp av språket förmedlar vi och tydliggör vår förståelse både för oss själva och för andra. Vid tydliggörandet av vår förståelse för oss själva förutsätter det att vi både kan interagera och reflektera. Denna kunskapssyn framträder t.ex. i krav på kommunikation och samarbete. Utifrån ett socialkonstruktivistiskt perspektiv kan pluralistisk kunskapssyn tolkas i läroplanens övergripande beskrivningar om kunskap. Kunskap konstrueras socialt och för att vara meningsfull kan inte kunskap tas ut ur sitt sammanhang. Kunskap är ett redskap för att göra världen förståelig och den förmedlas med hjälp av språket i sociala sammanhang. Kunskapsuppdraget som det framstår i Lgr 11 handlar om att skapa miljöer för lärande där elever erbjuds förutsättningar att bli mer och mer förtrogna med olika ämnen.”[26]

Wikforss hade också kunnat läsa OECDs TALIS-rapport. Där står det att konstruktivistiska undervisningsmetoder utvecklar elevers förmågor att hantera komplexa situationer och utveckla ett mer självständigt och kontinuerligt lärande, samt utvecklar elevers motivation och prestation. OECD förespråkar dock en blandning och anpassning av undervisningsmetoder, men TALIS visar ett positivt samband mellan konstruktivistiska idéer och lärares självförtroende och arbetstillfredsställelse.[27] Självklart går det att ifrågasätta OECDs påståenden och det hade varit intressant om Wikforss hade gjort det. 

Man kan också diskutera hur relevant det är att fästa alltför stor vikt vid just dessa frågor, eftersom praktik nödvändigtvis inte konsekvent följer idéer. Om man vill veta något om hur lärare agerar i klassrummet finns det frågor om det. Lärarna har fått ta ställning till följande påståenden (i parentes andel lärare som svarat ”på alla eller nästan alla lektioner” eller ”ofta” i Sverige och genomsnitt för alla länder, INT SNITT): 

  • Jag sammanfattar innehållet i det jag nyligen undervisat (SWE 72 %, INT SNITT 74 %)
  • Eleverna arbetar i smågrupper för att komma fram till gemensamma lösningar på ett problem eller en uppgift (SWE 51 %, INT SNITT 72 %)
  • Jag ger olika uppgifter till dem som har svårt att lära sig och/eller till dem som lär sig snabbare (SWE 53 %, INT SNITT 44 %)
  • Jag hämtar uppgifter från vardagen eller arbetslivet för att visa hur nya kunskaper kan användas (SWE 49 %, INT SNITT 68 %)
  • Jag låter eleverna öva på liknande uppgifter tills jag vet att alla eleverna har förstått ämnet (SWE 55 %, INT SNITT 67 %)
  • Jag kontrollerar elevernas övningsböcker eller läxor (SWE 51 %, INTE SNITT 72 %)
  • Elever arbetar med projekt som minst kräver en veckas tid att slutföra (SWE 41 %, INT SNITT 28 %)
  • Elever använder IKT i projekt- eller i lektionsarbete (SWE 34 %, INT SNITT 38 %)

Sverige är tillsammans med Sydkorea och Island det land där lärarna i minst utsträckning använder exempel/problem från vardagslivet. Tillsammans med Norge och Danmark kollar svenska lärare elevernas övningsböcker eller läxor i minst utsträckning, vilket kan vara kopplat till att läxor är mindre förekommande i Sverige jämfört med många andra länder. Det behöver alltså inte handla om ”slapphet” från lärarnas sida i dessa länder. Längre projektbaserade arbeten är också vanligare i Sverige jämfört med det internationella genomsnittet.[28] I den internationella OECD-rapporten framgår också att arbete i smågrupper har ett signifikant positivt samband med konstruktivistiska idéer om undervisning hos lärarna.[29] Eftersom grupparbete som undervisningsmetod används mindre i Sverige skulle en möjlig tolkning kunna vara att det har ett samband med att andelen lärare som är bärare av dessa idéer också är lägre i Sverige. 

Utan att dra för stora växlar på lärarnas svar på tillämpade undervisningsmetoder i klassrummet, finns det i TALIS inte mycket stöd att hämta för att en konstruktivistisk kunskapssyn är mer dominant vare sig bland svenska lärare eller i svenska klassrum jämfört med andra länder. Om man ska leda i bevis att konstruktivismen kan förklara PISA-nedgången borde rimligen denna kunskapssyn och medföljande undervisningsmetoder vara mer synliga bland svenska lärare i TALIS. 

s.185

Wikforss avslutar avsnittet med ytterligare en slutsats baserad på anekdotisk evidens: 

Jag har ägnat mig en del åt att föreläsa för lärare i olika sammanhang och mitt intryck är också att de anser att konstruktivismen fungerar dålig som pedagogisk metod. Kanske det faktiskt pågår en förändring i de svenska lärarnas sätt att arbeta. 

Kommentar: På föregående sida hävdade Wikforss att hon inte kan uttala sig om hur konstruktivismens idéer praktiseras i svenska skolor. Är det inte just det hon gör ovan? Och om nu hennes egen evidens antyder att den förhäxande konstruktivistiska kunskapssynen och pedagogiken inte är så dominant i Sverige längre, faller inte då hela hennes resonemang? 

s. 186

När man läser vad ledande svenska skolforskare (sedan 1990-talet) skriver om kunskap framträder tre centrala teman: 

  • Man lyfter fram den praktiska kunskapen och intar en skeptisk attityd gentemot teoretisk kunskap.
  • Man försvarar den tämligen radikal syn på den teoretiska kunskapen som konstruerad och man kritiserar ”objektivistiska” teorier om kunskap.
  • Man kontrasterar faktakunskaper med förståelse och kritiskt tänkande. 

Kommentar: De ledande forskare vi antar hon avser är Ingrid Carlgren (möjligen kan hon även mena Svein Sjøberg och Roger Säljö och några av de som hon ägnar utrymme åt i resterande delen av kapitel 5). 

s.187

Wikforss ger exempel på vad vi antar är de ledande skolforskarnas stolligheter, genom Ingrid Carlgrens kapitel i ”Bildning och kunskap. Särtryck ur Läroplanskommitténs betänkande Skola för bildning (SOU 1992:94)”.[30]

Skepsisen gentemot teoretisk kunskap är mycket explicit i Bildning och kunskap, ett inflytelserikt betänkande skrivet av skolforskare inför 1994 års läroplan. I förordet sägs tydligt att den nya läroplanen bygger på den uppfattning om kunskap och lärande som beskrivs i betänkandet. 

Kommentar: På uppdrag av regeringen tog Skolverket fram bakgrunds- och motivtexter till de nya läroplanerna som gällde från 1994. Detta särtryck är från kapitel 1 – 3 i SOU 1992:94, Skola för bildning”. Texterna har, enligt förordet, genomgått viss redigering. Syftet med texterna är att utgöra en utgångspunkt för diskussion i skolan om kunskap och lärande, om bildning och skolans uppgifter. I förordet står ”De texter som här presenteras skall inte ses som färdiga svar. De utgör underlag för reflexion och diskussion. Att svara på frågan om vad som är viktig kunskap idag och i framtiden och hur skolans arbete skall utformas är en ständigt pågående process där alla som arbetar i skolan deltar.”[31]

Här är det också viktigt att nämna att Lpo94 och motsvarande för gymnasieskolan i första hand var ett svar på den nya politiska styrningen av skolan i och med kommunaliseringen och fria skolvalet. I både direktiv och i förarbeten poängterades dessutom kunskapsfrågans betydelse. Detta ledde till ökade krav på nationella styrdokument som angav målen med skolans arbete, medan själva arbetet att utforma undervisningen lades lokalt. Det i sin tur gör, menar författarna, att bildningsfrågan blir extra viktig. Därtill måste en läroplan ta hänsyn till övriga samhälleliga förändringar. 

Syftet med Carlgrens text, som tydligt formuleras på s.25, är att a) sammanfatta diskussionen om kunskap och lärande och b) föreslå en begreppsapparat som kan fungera som ett verktyg för diskussion och reflektion om kunskap och lärande i skolan. Vår tolkning skiljer sig från Wikforss. Vi tolkar texten utifrån dess syfte, inte att den har en skeptisk hållning mot teoretisk kunskap. På åtminstone två ställen står att kraven på teoretiska kunskaper ökar i samhället (s.30, 33), vilket vi inte tolkar som ett uttryck för skepsis, snarare tvärtom ett sätt att betona de teoretiska kunskapernas betydelse. 

s.188

Wikforss redogör för de fyra kunskapsformer som lanserades m Lpo94: fakta, förståelse, färdighet och förtrogenhet. Wikforss skriver:

Genom att skilja dessa kunskapsformer åt hoppas författarna förhindra ensidiga reduktioner av kunskapsfenomenet och visa på kunskapens mångfald. 

Kommentar: Detta verkar bygga på ett missförstånd från Wikforss. På sid 31 i Bildning och kunskap. Särtryck ur Läroplanskommitténs betänkande Skola för bildning (SOU 1992:94)” står: ”De olika formerna samspelar med varandra och utgör varandras förutsättningar. Dessa fyra former uttömmer naturligtvis inte kunskapens alla dimensioner. Syftet är att utvidga kunskapsbegreppet och att motverka en ensidig betoning av den ena eller andra kunskapsformen framföra andra. [32] Syftet med att skilja ut olika kunskapsformer är främst att visa på mångfalden när det gäller hur kunskaper kommer till uttryck /…/. Samtidigt finns det en fara i att skilja formerna från varandra – en fara som består i att de kan uppfattas som om de förekommer i ’ren’ form åtskilda i verkligheten.”[33]

Wikforss verkar alltså ha gjort just det som författarna varnat far: tolkat kunskapsformerna som åtskilda, vilket kan förklara övriga slutsatser hon drar. Wikforss håller dock med om att det finns olika typer av kunskap och att skolans uppdrag är att lära ut såväl praktisk som teoretisk kunskap. Hon finner dock det märkligt att lyfta fram den tysta kunskapen (förtrogenhet), eftersom den inte kan läras ut, utan är en erfarenhetskunskap som man tar till sig i det dagliga livet utanför skolan. Det som avses med förtrogenhet/tyst kunskap är en form av sinnliga upplevelser (ex kunskapen att kokhett vatten är varmt, hur en slät, sandpapprad och inoljad träbit känns, hur ett ostämt piano låter eller hur stark mat smakar).  

s.189-190

Det Wikforss vänder sig mest mot är hur teoretisk kunskap beskrivs i Bildning och kunskap. Särtryck ur Läroplanskommitténs betänkande Skola för bildning (SOU 1992:94). Hon vänder sig emot formuleringen ”Kunskapens former och vad som räknas som kunskap varierar mellan olika områden och över tid. Det som räknas som kunskap i dag är inte detsamma som vad som var kunskap igår eller som kommer att vara kunskap i framtiden – och det som är kunskap på ett ställe är inte självklart kunskap på andra ställen.”[34] Nedan fortsätter man med att beskriva att teoretiska kunskaper blivit alltmer nödvändigt för deltagande i samhället, gränserna mellan praktiska och intellektuella verksamheter håller på att lösas upp och kraven på skolans kunskapsuppgift skärps därmed. Det är med den utgångspunkten som fakta, förståelse, färdighet och förtrogenhet föreslås som fyra kunskapsformer i Lpo 94.[35]

På sid 189 har Wikforss ett citat från sid 43 i Bildning och kunskap. Särtryck ur Läroplanskommitténs betänkande Skola för bildning (SOU 1992:94) som ger henne lätt yrsel: 

Teoretisk kunskap är inte en ”avbildning” av världen utan en mänsklig konstruktion för att göra världen hanterbar och begriplig. Kunskap är på det viset inte sann eller osann, utan något som kan argumenteras för och prövas. Kunskap är diskuterbar. För att bidra till att skapa en sådan kunskapsuppfattning hos eleverna ange i läroplanen att ämnena skall ge en historisk dimension. Det betyder att kunskaperna inte endast skall läras ut som färdiga svar, fria från ett specifikt historiskt sammanhang, utan som svar som uppstått i speciella sammanhang under speciella omständigheter och på speciella sätt. 

Kommentar: Enligt Wikforss kan aldrig kunskap vara osann eller variera över tid och rum. Vad som varierar är våra övertygelser och våra teorier, inte kunskapen. Det falska och ogrundade ersätts efter hand med det sanna och välgrundade i takt med att mänsklig kunskap ackumuleras och utvecklas /…/ I en trivial bemärkelse är det givetvis korrekt att det som räknas som kunskap varierar över tid. 

Som vi tolkar den av Wikforss citerade texten, stämmer det rätt bra överens med det hon själv hävdar, men det uttrycks annorlunda. Om man skrivit (fet text våra ändringar) såhär kanske Wikforss inte behövt uppleva lätt yrsel: 

Våra teorier om (teoretisk) kunskap är inte en ”avbildning” av världen utan en mänsklig konstruktion för att göra världen hanterbar och begriplig. Vår övertygelse om vad som är kunskap är på det viset inte sann eller osann, utan något som kan argumenteras för och prövas. Kunskap är diskuterbar. För att bidra till att skapa en sådan kunskapsuppfattning hos eleverna ange i läroplanen att ämnena skall ge en historisk dimension. Det betyder att kunskaperna inte endast skall läras ut som färdiga svar, fria från ett specifikt historiskt sammanhang, utan som svar som uppstått i speciella sammanhang under speciella omständigheter och på speciella sätt. 

s.192-193

År 2011 fick vi en ny läroplan som på olika sätt tar avstånd från 1994 års läroplan, bland annat genom att man återinför kursplaner för alla ämnen i läroplanen och talar om kunskapskrav (i stället för kunskapsmål) för de olika ämnena. Den nya läroplanen initierades av den borgerliga regeringen och det var ett uttalat mål att återinföra en ”kunskapsskola”. Dessvärre är kunskapskraven mycket generellt formulerade. De kan inte beskrivas som annat än just flummiga. 

Kommentar: Även Lpo94 (och Lgr 80 också för den delen) genomfördes av en borgerlig regering.

Kursplaner fanns även till 1994 års läroplan, men de fanns i ett separat dokument som det inte verkar som Wikforss känner till att döma av det hon skriver. Med Lgr 11 kom de att återigen sammanföras med de allmänna delarna i ett dokument. 

När det gäller kunskapsmål så fanns inget sådant begrepp vad gäller 1994 års läroplan, däremot fanns betygskriterier. Det var dessa som med Lgr 11 ersattes med kunskapskrav. Skillnaden mellan ”betygskriterier” och ”kunskapskrav” har diskuterats i forskningen, vissa menar att de senare har fått en mer instrumentell karaktär, som kräver att lärare tolkar dem ordagrant, men dessa tendenser fanns redan i relation till betygskriterierna i Lpo 94, om än att syftet var att lokala kriterier skulle konkretiseras av lärarna.  

För att illustrera hur den konstruktivistiska synen på kunskap lever kvar ska jag göra några nedslag i texter hämtade från pedagoger som varit och är tongivande på våra lärarhögskolor. Jag säger inte därmed att alla svenska skolforskare skriver under på denna syn av kunskap, bara att flera av de som har inflytande gör det. 

Kommentar: De texter hon hänvisar till på sidorna 194-203 är från 2002 (Gustavsson), 2007 (Svein Sjöberg respektive en skrift från Lärarförbundet: I kunskapens namn), 1999 (von Wright), 2014 (Säljö, Kroksmark). 

Om Wikforss vill undersöka/analysera det aktuella läget kring kunskapssyn, hade det inte då varit bättre med senare litteratur som tillkommit efter Lgr11 och inte tvärtom? 

s.194

Sjøberg bok används flitigt i Sverige (detta är den tredje svenska upplagan) och det finns mycket i den som är klokt och bra, särskilt när det gäller den konkreta ämnesdidaktiken. Just därför är det Sjøberg säger om kunskapens konstruerade karaktär så problematiskt – det finns en risk att lärare tar till sig detta eftersom mycket annat han säger är klokt.

Kommentar: Sjøberg, professor emeritus vid Olso Universitet, har sålt flest exemplar av denna lärobok i Norge, 10000 enligt hans egen uppskattning (sedan första upplagan kom 1998). Den har även sålt i Sverige och i Danmark, men färre exemplar. Han är i Norge bland annat känd för att ha genomfört faktagranskningar av läroböcker och påpekat faktafel i dessa. Han blev när vi kontaktade honom för att kommentera framställningen av honom i boken chockad över att i boken framställas som relativist. I den bok av Sjøberg som Wikforss refererar till finns exempelvis stark kritik mot postmodernismen. Sjøberg argumenterar för att naturvetenskapen slår tillbaka mot postmodernismen. Bland annat skriver han på sidan 267 i den första norska upplagan detta (vi kommer ändra till senare upplaga så snart vi får tag på den):  

s.195

Vi ser aldrig världen som den ”egentligen” är, sammanfattar Sjøberg, utan bara genom våra begrepp och teorier: ”Även enkla ’fakta’ blir till fakta just för att vi bär med oss teori till situationen. Det är alltså ’teorin’ som bestämmer vad vi ska se, det är teorin som bestämmer vad som ska bli till fakta. Det är alltså inte enskilda fakta som är det primära och som leder oss till teori.” (s. 280)

Det är intressant att sätta ovanstående i sitt sammanhang i Sjøbergs bok. Vi har endast haft tillgång till den första norska upplagan (ska uppdateras till den upplaga Wikforss läst), men detta textparti verkar vara i det närmaste oförändrat. Vad skriver då Sjøberg längre ner på samma sida, jo (s. 221):

”De fleste er i dag enige om at teorier ikke uproblematiskt følger av sanseinntryckk og erfaringer, men at rekkefølgen like gjerne er den motsatte: Teorierna bestemmer hva som blir til fakta. Vi ser umiddelbart at dette får klare konsekvenser for læring: Erfaring er i seg selv ingen garanti for læring. Mennesker hade erfaring med å kaste stein og skyve rund på ting i årtusener før Newton. Likevel «oppdaget» de ikke hans enkle lovmessigheter. Og da er det vel noe drøjt å vente at hver enkelt grunddskoleelev skal gjenta Newtons tankebedrift på grunnlag av noen enkelt skoleforsøk, slik man nærmest forutsatte i en del av de store internasjonale naturfagprosjekterne fra 1960- og 70-tallet? Nej, det trengs input av teori och refleksjon. Det kommer vi tilbake til.” 

Dvs den slutsats Sjøberg drar av det resonemang som föregår ovanstående citat, och som Wikforss återger delar av, är att det kräver betoning av den teoretiska kunskapen i skolan. Dvs s att läraren ska lära ut teorier i sin undervisning. Sjøberg vänder sig alltså tydligt emot ett fritt lärarlöst undersökande. Att framställa Sjøberg som en som bidragit till att relativismen sprids, baserat på ett citat ryckt ur sitt sammanhang, är inte seriöst. Det är att misskreditera.  

s.200

I en fotnot hänvisar Wikforss till en ”detaljerad kritisk granskning av Säljös sociokulturella teori”, närmare bestämt ”Det sociokulturella perspektivet En kritisk granskning”, ett examensarbete skrivet av de dåvarande lärarstudenterna Joel André och Susanna Salmijärvi. Texten finns: (https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=2ahUKEwjri8fs_LzmAhV2wsQBHdlOAdQQFjAAegQIBBAC&url=https%3A%2F%2Fgupea.ub.gu.se%2Fbitstream%2F2077%2F21573%2F1%2Fgupea_2077_21573_1.pdf&usg=AOvVaw1USXvjbtp8rZtfPDGPoLD8).

Dom båda lärarstudenterna skrev senare ett inlägg i Pedagogiska Magasinet:

https://pedagogiskamagasinet.se/larandeteori-som-akademisk-fernissa/

Säljö har svarat:

https://pedagogiskamagasinet.se/det-ar-skillnad-pa-en-teori-och-ett-perspektiv/

Bland annat skriver han:

”Det avgörande problemet i Andrés och Salmijärvis läsning tycks vara att de förväntar sig att Lärande i praktiken skulle förespråka ett normativt perspektiv på hur undervisning ska gå till; de synes förvänta sig en handbok. Just detta var avsikten att boken inte skulle vara. […] Lärande i praktiken förespråkar således inte någon generell normativ modell för Undervisning. Den har i stället ett analytiskt kunskapsintresse; den är menad som en text om pedagogik, inte i pedagogik. På samma sätt som man som företagsekonom introduceras till organisations-teorier eller en psykologstuderande inledningsvis möter olika teorier om minne eller om terapier, är Lärande i praktiken en introduktion till en av de numera klassiska traditionerna för analys av lärande och utveckling.”

”Att man börjar sin bekantskap med teoretiska traditioner på detta sätt torde inte vara ovanligt i högre utbildning. Detta betyder inte heller att jag menar att de normativa konsekvenserna av ett sociokulturellt perspektiv för undervisning är oviktiga eller ointressanta. Tvärtom, att resa sådana frågor om hur man når undervisningsmål är angeläget. Men jag känner själv en viss motvilja mot att ta teoretiska perspektiv som enda grund för att påstå hur undervisning ska bedrivas. Hur man organiserar lärande och elevers engagemang är avhängigt av många faktorer som har att göra med innehåll, mål, tid till förfogande och andra förutsättningar.”

Kommentar: Wikforss lyfter fram ett examensarbete skrivet inom lärarutbildningen som exempel på en mer detaljerad filosofisk granskning än den hon själv gör. Uppsatsen är intressant och ett tecken på den frustration som lärarstudenter kan känna inför en i deras ögon ofta alltför teoretisk lärarutbildning, där man läser om perspektiv och teorier snarare än att man lär sig normativa modeller rörande undervisning. Det är problem som bör tas på allvar och ett dilemma som har diskuterats flitigt i relation till akademiseringen av lärarutbildningen.

s.201

Att Säljö själv hävdar att han inte är relativist hjälper inte (s. 234).

Säljö skriver på s. 234-235:

”Inte heller skall det ses som en relativistisk tes om att alla sätt att beskriva verkligheten är lika viktiga eller intressanta. Tvärtom. I ett sociokulturellt perspektiv är det uppenbart att människans tänkande utvecklats ur försök att behärska den naturliga och sociala omgivningen. Men våra kunskaper om världen finns inte i objekten eller händelserna i sig, utan i våra diskurser om dessa och i artefakterna. På samma sätt är våra diskurser – kunskapssystem – och artefakter inte godtyckliga eller utbytbara. De har utvecklats under lång tid och representerar de erfarenheter och insikter människor gjort. När vi använder såväl fysiska som intellektuella redskap finns ofta en lång utveckling närvarande. Det är just detta som gör lärande till en så central aktivitet i ett komplext samhälle.”

Kommentar: I relation till Wikforss påstående kan det vara viktigt att lyfta fram vad Säljös skriver om kunskapers stabilitet över tid. 

s.202

Wikforss citerar säljö:

I ett annat sammanhang argumenterar Säljö också mot katederundervisning och ”förmedning av vad man kallar ’faktakunskaper’” (s. 15) och förespråkar i stället en konstruktivistisk syn på lärande där projektorganiserad undervisning och problemorienterat lärande blir ett ideal (s. 17-18). 

Säljö beskriver i den av Wikforss citerade texten två positioner i debatten, progressivism och traditionalism. Det är progressivisterna som citeringen s.17-18 gäller: ”Detta är några av anledningarna till att exempelvis projektorganiserad undervisning och problembaserat lärande ofta blir ideal för progressivister.” Han skriver senare, på sidan 21: ”På motsvarande sätt kan man idag rikta kritik mot de sätt på vilka problembaserat och projektorganiserat arbete utövas i skolan.” Wikforss har alltså lyft påståendet om förespråkande av en viss typ av undervisning som Säljö menar ofta blivit ett ideal för många progressivister ur sitt sammanhang och tillskrivit det Säljö.

Ett faktafel: Wikforss skriver att Kroksmark är ”tongivande pedagog i Linköping”. Kroksmark (numera prof em) är verksam vid Högskolan för lärande och kommunikation i Jönköping och har tidigare varit verksam vid Umeå och Göteborgs universitet.

s.205

Wikforss för en diskussion om varför den teoretiska kunskapen värderas högre i samhället. Hon skriver: 

Man bör också minnas att det finns skäl till att teoretisk kunskap spelar en central roll i vårt samhälle. Den kunskap som rävs för att kunna delta i en demokrati är i stor utsträckning teoretisk. 

Kommentar: Var det inte just det som på flera ställen påpekades i Carlgrens text i ”Bildning och kunskap. Särtryck ur Läroplanskommitténs betänkande Skola för bildning (SOU 1992:94)” på s. 30 och 33 och att kraven på teoretisk kunskap dessutom ökar? 

s.209

Wikforss stödjer sig på en bok av Daisy Christodoulou, ”Seven myths about education”. Säkerligen en läsvärd bok, tydligt skriven i debattstil där olika positioner och teser hårdras. Det är dock ingen forskningsrapport, som stödjer sig på fakta om vad som skett i skolan. En mer systematisk genomgång av alla referenser kommer göras.

s.210

Att försöka googla lite uppgifter vid behov (vilket pedagoger ofta lyfter fram som en bra lösning) hjälper inte eftersom arbetsminnet belastas av detta. 

Kommentar: Med risk för att vi missat att Wikforss räknat upp flera referenser till pedagoger som lyfter fram googling som en bra undervisningsmetod, hade det varit snyggt med referenser i samband med detta påstående. Som det står skrivet nu finns det risk att man kan tolka hennes påstående som en strategi för att misskreditera ”motståndaren” (dvs pedagogerna) för att därigenom bättre få stöd för sina egna teorier och påståenden. 

s.211

Kristiskt tänkande är inte, som pedagoger ofta antagit, en ”generisk” eller allmän förmåga, något man kan bära med sig från ett ämne till en annan, utan det är helt beroende av goda ämneskunskaper […]. 

Kommentar: Det hade varit bra om Wikforss hade haft en grund för detta påstående baserat på de inflytelserika pedagoger som hon går igenom mer noggrant i kapitlet, Ingrid Carlgren, Svein Sjøberg och Roger Säljö. Ingen av dessa har oss veterligen antagit att kritiskt tänkande är en allmän förmåga. Wikforss för ovanstående resonemang i relation till en debattreplik som en lektor i pedagogik, Joakim Larsson, skrivit. Han skriver dock inte heller om att kritiskt tänkande skulle vara en allmän förmåga.[36]

s.216

Det sägs ibland att problemet med PISA-undersökningarna är att de endast fokuserar på skolans kunskapsuppdrag, inte dess demokratiuppdrag [fotnot 256]. Detta är en falsk motsättning.

Wikforss skriver i fotnot 256: ”Se till exempel Astrid Pettersson (professor i pedagogik).” Och hänvisar till en krönika av Pettersson. I krönikan reflekterar Pettersson över de närmare 20 år som PISA funnits. Pettersson har jobbat med PISA sedan starten 2000 fram till 2015. Pettersson skriver:

”Sedan kom nedgången och därmed också en enorm uppmärksamhet i media och i skolpolitiken. De sämre resultaten blev tydliga 2009, blev ytterligare sämre 2012 och 2015 är vi på 2009 års nivå igen. Kritiken mot PISA ökade och ökade. ”PISA mäter inte det som man lär sig i skolan, OECD styr för mycket, PISA kommer att styra undervisningen osv.” PISA ska emellertid ta reda på hur rustade 15-åringar är för att möta framtiden. Det är snarare fokus på läroplanens övergripande mål än enskilda kursplaners kunskapskrav som avses. När det gäller påverkan på undervisningen tycker jag mig se en mycket liten sådan inriktning. Det som däremot PISA tillsammans med andra internationella kunskapsmätningar gör är att endast fokusera skolans kunskapsuppdrag, inte dess demokratiuppdrag, vilket kanske kan få konsekvenser för verksamheten i den svenska skolan.” (https://www.mnd.su.se/om-oss/nyheter/perspektiv-på-närmare-20-år-med-pisa-1.324044 )

Pettersson, som verksam och drivande för PISA, är inte kritisk till PISA som sådan, men menar att PISA framför allt uttalar sig om skolans kunskapsuppdrag, inte dess demokratiuppdrag och att detta ”kanske kan få konsekvenser”. Vad hon menar här kan vi inte veta, men det verkar vara en rimlig distinktion att göra, att det är något annat att mäta kunskaper jämfört med att mäta demokratiska förmågor, även om det rimligen borde finnas överlapp. Det är alltså ingen motsättning som Pettersson talar om och som Wikforss tillskriver henne. Hur relationen ser ut kan man såklart fundera över, och i vilken grad demokratiska aspekter fångas av PISA. Det finns dock ingen korrelation mellan hur demokratiskt ett land är och hur högt i PISA landet hamnar. Dvs PISA kan vara indikator på något som är viktigt vad gäller demokratiuppdraget, men uppenbarligen inte allt. 


[1] Sid. 184 i Alternativa fakta

[2] Se sid 26-27 i https://www.skolverket.se/publikationer?id=3725

[3] Se sid 29-31 i https://www.skolverket.se/publikationer?id=3707

[4] Se sid 21 i https://www.skolverket.se/publikationer?id=3204

[5] Se https://danhaesler.com/2015/02/24/chatting-with-john-hattie-pt-2/

[6] Tabell 4 och tabell 6 kommer från s.29 och s.40 https://webbutik.skl.se/sv/artiklar/synligt-larande.html

[7] Skolverket (2003), s.27. https://www.mah.se/pages/45519/lustattlara.pdf

[8] Skolverket (2003), s.27. https://www.mah.se/pages/45519/lustattlara.pdf

[9] Skolverket (2003), s.28, 6,7. https://www.mah.se/pages/45519/lustattlara.pdf

[10] Skolverket (2003), s.10, 17. https://www.mah.se/pages/45519/lustattlara.pdf

[11] Skolverket (2003), s.17. https://www.mah.se/pages/45519/lustattlara.pdf

[12] https://www.dn.se/arkiv/ledare/dags-for-reformstopp/

[13] https://soundcloud.com/snsinfo/2014-04-01-den-svenska-skolan

[14] Att betydelsen av vad eleverna har med sig hemifrån har ökat har länge belysts i såväl PISA, statistik från betyg och nationella prov, samt från forskning. Dock är den förklaringsmodell som Wikforss levererar i sammanhanget ny, bortsett från i så fall Kornhall och Linderoth. Här kan tilläggas att varken OECD eller Skolkommissionen kom fram till en liknande slutsats.  

[15] Se ex. Vinterek (2006). Individualisering i ett skolsammanhang. Myndigheten för Skolutveckling, Skolverket (2009) Vad påverkar resultaten i svensk grundskolahttps://www.skolverket.se/publikationer?id=2260,  Giota (2013). Individualiserad undervisning i skolan – en forskningsöversikt, Vetenskapsrådet. https://www.vr.se/analys/rapporter/vara-rapporter/2013-02-01-individualiserad-undervisning-i-skolan—en-forskningsoversikt.html

[16] https://fof.se/tidning/2014/4/artikel/skolan-mater-inte-barnens-kunskaper

[17] Se s.79-81 i https://www.skolverket.se/publikationer?id=3126 och s.124-129 i https://www.oecd.org/pisa/keyfindings/pisa-2012-results-volume-III.pdf

[18] Se sid 80 i https://www.skolverket.se/publikationer?id=3126

[19] Se s.80 i https://www.skolverket.se/publikationer?id=3126

[20] https://www.skolverket.se/publikationer?id=3684

[21] I det här sammanhanget kan det också vara värt att nämna att de internationella studierna antyder att undervisningen i de undersökta ämnena gått mot mer lärarledd undervisning av den typ som Wikforss verkar förespråka, vilket skulle kunna tala för att omfattningen av eget arbete i den mening att eleverna lämnas att ensamma söka sin information kan ha minskat. Se ex. s. 39, 49, 57, 59, 89, OECD (2019) Measuring Innovation in Education 2019. https://www.oecd.org/publications/measuring-innovation-in-education-2019-9789264311671-en.htm

[22] Sundell & Stensson (2010) s. 17. Effektutvärderingar i doktorsavhandlingar. Socialstyrelsen.  

[23] Sundell & Stensson (2010) s. 20. Effektutvärderingar i doktorsavhandlingar. Socialstyrelsen.  

[24] SOU 2016:30 s. 132-133. Samling för skolan. Nationella målsättningar och utvecklingsområden för kunskap och likvärdighet. Delbetänkande av 2015 års skolkommission. https://www.regeringen.se/4a75aa/contentassets/70375d2792c94fc2a3e10d9124f5ece5/nationella-malsattningar-och-utvecklingsomraden-for-kunskap-och-likvardighet-sou-2016-38.pdf

[25] Se s.391 i https://read.oecd-ilibrary.org/education/talis-2013-results_9789264196261-en#page392

[26] Se s.55 i https://www.skolverket.se/publikationer?id=3294

[27] Se s.196-197 i https://read.oecd-ilibrary.org/education/talis-2013-results_9789264196261-en#page392

[28] Se s. 66-67 i https://www.skolverket.se/publikationer?id=3294 och s. 375 i https://read.oecd-ilibrary.org/education/talis-2013-results_9789264196261-en#page392

[29] Se s. 165 i https://read.oecd-ilibrary.org/education/talis-2013-results_9789264196261-en#page392

[30] https://www.skolverket.se/download/18.6bfaca41169863e6a652683/1553955597894/pdf135.pdf

[31] Se s.7 i https://www.skolverket.se/download/18.6bfaca41169863e6a652683/1553955597894/pdf135.pdf

[32] Se sid 31 i https://www.skolverket.se/download/18.6bfaca41169863e6a652683/1553955597894/pdf135.pdf

[33] Se sid 33 i https://www.skolverket.se/download/18.6bfaca41169863e6a652683/1553955597894/pdf135.pdf

[34] För citatet, se s 30 i https://www.skolverket.se/download/18.6bfaca41169863e6a652683/1553955597894/pdf135.pdf

[35] Sid 30-33 i https://www.skolverket.se/download/18.6bfaca41169863e6a652683/1553955597894/pdf135.pdf

[36] https://www.dn.se/debatt/repliker/malet-ar-inte-att-fostra-larandeautomater/

Varför är det så svårt att öka måluppfyllesen?

Med Lpo 94 fick grundskolan ett nytt betygssystem, de relativa betygen övergavs för målrelaterade. Till de målrelaterade betygen kopplades en gräns för godkända kunskaper. Den har sedan dess varit en central del i såväl styrning som ett mått på kvalitet/resultat (så kallad måluppfyllelse).

Förhoppningarna på mål- och resultatstyrningen var högt ställda när läroplanen, Lpo 94, och det nya betygssystemet började tillämpas 1994. Med tydliga krav på godkända kunskaper och ett tydligt ansvar knutet till detta skulle kunskapsnivån i svensk skola höjas väsentligt, det var många politiker övertygade om. Godkäntgränsen innebar dessutom ett löfte till barn och ungdomar:

Det är samhällets plikt att se till att alla elever får godtagbara grundkunskaper. Att ge ett underkänt betyg till en elev skulle därmed vara att straffa eleven för något som samhället egentligen försummat.
(protokoll 1991-12-19, Betygsberedningen, Riksarkivet)

I all sin enkelhet är löftet om att ge alla elever en gedigen grundutbildning och en kunskapsgaranti i form av godkända kunskaper genial. Men som vi vet har såväl skolresultat som måluppfyllelse varit sorgebarn. Vad beror det på? Är det marknadens fel eller finns det problem med att styra kvalitet via tydliga mål och kunskapskrav?

Eleverna förmodas inte längre tävla sinsemellan: de får i förväg detaljerad information om vad de skall kunna. Ett sådant nytt system ter sig som en mycket attraktiv reform – om det nu bara går att realisera i sinnevärlden!

(kommunalrådet Björn Björnberg, fp lib, varnar för orealistiska förhoppningar på vad beytgssystemet ska åstadkomma i Skolvärlden nr. 8, 16 april 1992)

Sverige är inte ensamt om att ha infört gränser för vad som ska räknas som en acceptabel/godkänd nivå på elevers kunskaper. Reformen No Child Left Behind (NCLB) i USA trädde i kraft 2001 och byggde på incitamentsstrukturer kopplade till just gränser för godkända elevresultat och får tjäna som jämförelse. Hur påverkas lärares arbete när gränser för godkända kunskaper förs in?

No Child Left Behind innebar i korthet ett tryck på skolor att öka måluppfyllelsen. En viktig del i reformen var ett individbaserat mått på godkänd prestation, en så kallad ”proficiency level”, som i detta sammanhang kan sägas motsvara den svenska gränsen för godkänt betyg (idag betyg E). Delstaterna fick själva bestämma var nivåerna skulle ligga, vilket innebar att de kom att skifta stort mellan olika delstater, från under en procent underkända till över 80 procent underkända elever.

Proficiency-nivåerna mättes genom standardiserade tester som utvecklats för detta ändamål, oftast av företag inom testindustrin. Det federala kravet uppifrån var dock detsamma: För skolor där elever inte nådde godkändnivån fanns krav på hur snabbt dessa måste utvecklas, dvs. hur snabbt andelen icke-godkända behövde minska varje år för att skolan inte skulle bli föremål för kännbara konsekvenser. Kravet på utvecklingen av skolors måluppfyllelse kallades ”Adequate Yearly Progress”, AYP. Målet med reformen var att alla barn som gick i skolan 2014 skulle nå de proficiency-nivåer som delstaterna hade satt upp. Även om reformkraven innebar ett tryck på enskilda individer genom proficiency-nivåerna så låg alltså själva accountability-trycket på skolnivå.

NCLB är i sammanhanget ett exempel på ett system som ska öka vad vi i Sverige kallar elevers måluppfyllelse. NCLB bygger på intressanta policyprinciper för skolutveckling som har bäring för svenska förhållanden: en gräns för godkänd prestation och ett ansvars-system som syftar till att sätta krav på skolor och lärare att öka måluppfyllelsen.

Brown och Clift (2010) tillhör de som studerat hur NCLB påverkat det amerikanska skolsystemet. De identifierade tre typer av skolor i relation till NCLB: skolor där alla elever klarade målen, skolor som låg precis runt gränsen att klara AYP, samt skolor som låg långt ifrån att klara takten på ökad måluppfyllelse i de av NCLB angivna ämnena.

För att förklara hur dessa tre typer av skolors påverkades av NCLB prövades en modell från fysiken som forskarna förankrar i ekonomiska och psykologiska incitamentsteorier, “Basin of attraction” (Brown & Clift, 2010, s. 776). Teorin säger att skolor som ligger nära det krav som NCLB satt upp i form av AYP ska vara de som påverkas mest av NCLB medan de som redan når kraven samt de som befinner sig långt ifrån kraven inte kommer att påverkas lika mycket.

Namnlös

Figur 3.1:”Basin of attraction”. Modell för incitamentstrukturer i accountability-systemet NCLB. Figur tagen från Brown och Clift (2010, s. 776).

Forskarna följde 20 skolor under tre år, 2004–2006. Totalt genomfördes cirka 350 intervjuer med rektorer, lärare och annan personal vid skolorna. Dessutom utfördes en mängd fokusgruppintervjuer med föräldrar (Brown & Clift, 2010).

För de skolor som modellen menade skulle påverkas mest av reformen, de som låg nära att klara AYP-kraven, fick Brown och Clift (2010) följande resultat: En del positiva signaler upptäcktes när det gäller hur verksamheten vid dessa skolor påverkades av NCLB. Bland de negativa effekterna fanns en tendens att i dessa skolor lägga stort fokus vid så kallade ”bubble-kids”, dvs. de elever som man snabbast och enklast ansåg kunde nå målen och som därmed lättast kunde bidra till att skolan nådde sitt AYP. Man fann även en tendens att mer tid i dessa skolor styrdes om till de ämnen som NCLB hade pekat ut (matematik och språk) samt att komplexiteten i undervisningen tycktes minska (mer ”teach-to-the-test”). En stor del av skolornas verksamhet riktades alltså mot elever strax under gränsen för godkänd prestation (jfr. Neal och Whitmore Schanzenbachs, 2010).

För skolor som inte berördes av lagen, dvs. där alla elever nådde godkänd fann Brown och Clift (2010) att lagen inte gav ytterligare incitament för dessa att förbättra sig, snarare fanns tendenser att dessa skolor slog sig till ro. Dessutom fanns tydliga tendenser att dessa skolor jobbade hårt för att inte få in elever med ”dåliga förutsättningar”. Men man fann även undantag, dvs. exempel där elever från ”dåliga” skolor släppts in och där dessa elever lyckades bra.

För skolor som låg långt ifrån målet att nå AYP tycktes lagen haft den effekten att skolledare, lärare, föräldrar och barn kom att känna än mer hopplöshet och stigmatisering. Allt eftersom åren gick innebar AYP-kravet att gränsen för andelen godkända som skolan måste prestera flyttades fram vilket innebar att skolan hamnade längre och längre från målet. Dessa skolor hamnade inte sällan i negativa spiraler med ständigt nya rektorer och visioner men där nya idéer aldrig fick tid att etablera sig förrän ledningen sparkades ut och ersattes av en ny. Föräldrar som förmådde gjorde allt för att förflytta sina barn från dessa skolor.

Resultaten av Brown och Clifts (2010) studie pekar på såväl önskade som oönskade effekter. Författarna drar slutsatsen att NCLB snarast hade en negativ effekt på de skolor den ytterst var avsedd för, nämligen skolor med låg andel elever som når målen (Brown & Clift, 2010).

Bland andra negativa effekter av NCLB märks en differentiering av lärarkompetens (duktiga lärare söker sig i högre grad till skolor med låg andel svaga elever) samt att en högre andel lärare lämnar yrket. Studier visar även att rektorskompetenser tenderar att differentieras liksom att undervisningstiden för de ämnen som inte är i fokus för kraven minskar. Dessa effekter är såklart extra problematiska när de drabbar de elever och skolor som har störst problem i utgångsläget. 2015 övergavs och ändrades NCLB. Så här skrev Vita huset om varför man tog detta beslut:

Although NCLB started a national conversation about student achievement, unintended consequences of NCLB have reinforced the wrong behaviors in attempting to strengthen public education. NCLB has created incentives for states to lower their standards; emphasized punishing failure over rewarding success; focused on absolute scores, rather than recognizing growth and progress; and prescribed a pass-fail, one-size-fits-all series of interventions for schools that miss their goals.[1]

NCLB verkar alltså trots goda intentioner ses som ett stort misslyckande, även från de ansvarigas sida.

NCLB ledde till att lärare kom att allokera sina resurser olika för olika elevgrupper. Framför allt då till elever nära gränsen för godkänd prestation medan incitamenten att hjälpa elever som redan låg över nivån eller som hade små chanser att lyckas nå nivån minskade som följd av införandet av systemet. Det finns därtill skäl att tro att alltför instrumentella system för målstyrning får negativa konsekvenser för viktiga aspekter av alla elevers allsidiga bildning (Levin, 2012. Se även Davidson et al. 2015).

Även om NCLB inte är direkt jämförbart med hur det svenska betygssystemet med dess E-gräns fungerar så finns det starka skäl att tro att den övergripande påverkan på olika typer av skolor (låg-, medel- och högpresterande) följer liknande mönster, dvs. att skarpa gränser missgynnar de skolor och de elever systemet i hög grad designats för att hjälpa. Studien av Brown och Clift (2010) ger en delförklaring och manar till eftertanke: kan det vara så att vi genom ett system med kunskapsgaranti fört in en typ av incitamentsstrukturer i skolan som motverkar intentionerna med systemet? Mycket tyder på det (Wahlström & Sundberg, 2017).

Referenser

Brown, A. B. & Clift, J. W. (2010). The unequal effect of adequate yearly progress: evidence from school visits. American Educational Research Journal, 47(4), 774–798.

Davidson, E., Reback, R., Rockoff, J. & Schwartz, H. L. (2015). Fifty ways to leave a child behind: idiosyncrasies and discrepancies in states’ implementation of NCLB. Educational Researcher, 44(6), 347–358.

Levin, H. M. (2012). More than Just Test Scores. Prospects: Quarterly Review of Comparative Education, 42(3), 269–284.

Neal, D. & WhitmoreSchantzebach, D. (2010). Left behind by design. Profciency counts and test-based accountability. Review of Economics and Statistics, 92(2), 263–283.

Wahlström, N. and Sundberg, D. (red.) (2017). Transnational curriculum standards and classroom practices: The new meaning of teaching. London: Routledge.

[1]“Reforming No Child Left Behind”, https://www.whitehouse.gov/issues/education/k-12/reforming-no-child-left-behind. Hämtat den 1 juni 2016.

Vad talar för och emot betyg?

Valet närmar sig och frågor om betyg och uppföljning av elevers kunskaper är som brukligt en viktig del av de skolpolitiska program som läggs fram. Ett antagande som ligger bakom betygens centrala roll är att de kan fungera som verktyg för att öka kvalitet och måluppfyllelse i ett skolsystem. Men vad vet vi egentligen om betygens effekter på undervisningen? På vilka grunder är det rimligt att anta att betyg förbättrar kvaliteten på arbetet i skolan och ökar chanserna att elever når målen? Vad säger forskningen?

Med anledning av att det utförts flera litteraturöversikter på området betyg och summativa bedömningar, varav ett par systematiska, så föll mitt val på att inte göra ytterligare en sådan översikt utan istället ta utgångspunkt i ett urval av dessa översikter i syfte att såväl fördjupa som problematisera de argument som framförs för och emot betyg (i avsnitt 2.1.1 behandlar jag studier som argumenterar för att betyg är bra, framför allt i relation till lärande och motivation). Jag har även undersökt betygens roll för tidig uppföljning och hur tydliga kunskapskrav fungerar i syfte att öka måluppfyllelse, men de kommer jag presentera vid senare tillfälle.

1    Urval av studier

I detta avsnitt listas samtliga studier som varit centrala i litteraturöversikten jämte argument för de urval som gjorts.

Den kanske mest omfattande och därtill mest systematiska litteraturöversikt som gjorts på området är gjord av Harlen och Deakin Crick (2002). Den är en självklar utgångspunkt, inte minst för att den även innehåller jämförelser med flera av de tidigare forskningsöversikterna på området.

  • Harlen, W., & Deakin Crick, R. (2002). A systematic review of the impact of summative assessment and tests on students´ motivation for learning. In: Research evidence in educational library. Issue 1. London: EPPI-Centre, Social Science Research Unit, Institute of Education.

Därtill har jag beaktat den senaste översikten som gjorts, vilket är:

  • Lundahl, C., Hultén, M., Klapp, A., & Mickwitz, L. (2015). Betygens geografi – forskning om betyg och summativa bedömningar i Sverige och internationellt. Vetenskapsrådet. Stockholm: Vetenskapsrådet. (se Betygens geografi)

Även den har använt sig av systematiska strategier, men inskränker sig enbart till forskning som publicerats 2002-2014, dvs. efter att Harlen och Deakin Crick (2002) publicerades och som därför inte täcks av den översikten. Tillsammans bildar dessa en heltäckande systematisk översikt över den forskning som gjorts inom engelskspråkig litteratur. Även i Lundahl et al. (2015) förs en jämförande diskussion med tidigare forskningsöversikter.

Så till en annan typ av studier som granskats i denna litteraturöversikt, de som tydligt argumenterar för att tidiga betyg är bra. För svensk del brukar det i betygsdebatten framför allt hänvisas till:

  • Sjögren, A. (2010). Graded children – evidence of longrun consequences of school grades from a nationwide reform. Working paper 2010:7. Uppsala: IFAU – Institutet för arbetsmarknads- och utbildningspolitisk utvärdering.

En mer djupgående analys av Sjögrens rapport ingår visserligen i Lundahl et al. (2015) studie, men Sjögrens rapport berättigar ytterligare beaktande då den kommit att väga tungt i den svenska betygsdebatten som argument för att tidiga betyg och för att högre krav är bra för annars missgynnade grupper i skolan. Inte minst spelar den en viktig roll för att understödja argumenten och förslagen i den promemoria som publicerades 2014 där tidiga betyg och tester föreslogs:

  • Promemoria 2014-08-20. U2014/4873/S En bättre skolstart för alla: bedömning och betyg för progression i lärandet. Utbildningsdepartementet.

När det gäller båda dessa rapporter har jag gjort en mer djupgående analys av den evidens och de argument som förs fram i dessa, bland annat genom att även gå tillbaka till de forskningsstudier som de båda rapporterna stödjer sina argument på.

För att kunna bidra till fördjupad diskussion kring betygens motiverande effekter har jag valt att komplettera med några nyare studier på området som inte täcks av forskningsöversikterna. Två av dessa studier är:

  • Brookhart, S. M. (2015). Graded Achievement, Tested Achievement, and Validity. Educational Assessment, 20(4), 268–296.
  • Grant, D., & Green, W. B. (2013). Grades as incentives. Empirical Economics, 44(3), 1563–1592.

Den förra är skriven av en av de ledande betygsforskarna internationellt sett och innehåller en kortare översikt av inriktningar inom betygsforskningen. Den senare ligger inom det tidsspann som täcktes av Lundahl et al. (2015), men ingick inte i deras urval då deras sökningar enbart använde sig av databaserna Libris, ERIC och ProQuest medan ovanstående nås via Business Source Premier och Google Scholar.

För att ytterligare belysa betygens effekter förs en teoretiskt förankrad diskussion kring detta. Några av de tidigare nämnda texterna inkluderar teoretiska resonemang (framför allt Grant & Green, 2013). Utöver dessa har jag valt att ta med följande två texter som sammanfattar mycket av de senaste insikterna på det teoretiska området:

  • Yeager, D. S., Henderson, M. D., Paunesku, D., Walton, G. M., D’Mello, S., Spitzer, B. J., & Duckworth, A. L. (2014). Boring But Important: A Self-transcendent Purpose for Learning Fosters Academic Self-regulation. Journal of Personality and Social Psychology, 107(4), 559-580.
  • Klapp, Alli (2015a). Bedömning, betyg och lärande. Lund: Studentlitteratur.

2    Betygens inverkan på motivation och lärande

När man ska belysa det vi i Sverige kallar betyg måste man fråga sig vilket mer generellt fenomen våra betyg är uttryck för (jfr “funktionell ekvivalent”, kapitel 1). Enligt Lundahl et al. (2015) kan betyg ses som en summativ bedömning:

Betyg […] en summering och sammanfattning av elevens lärande vid en viss tidpunkt. Ofta sker en summering i slutet av terminen eller i slutet av en kurs på gymnasiet. En summativ bedömning kan även innebära att kortare delmoment av en kurs summeras till exempel genom prov och att resultaten från ett antal prov senare ligger till grund för ett betyg. (s. 11)

Summativ bedömning är alltså det mer generella fenomenet till vilket betyg hör. Svenska betyg är därtill en summativ bedömning med så kallad ”high-stakes”, det vill säga de har stor betydelse för de elever som får betyg. Svenska betyg kan exempelvis avgöra om en elev kommer in på en gymnasie- eller högskoleutbildning eller ej. Inte alla summativa bedömningar är high-stakes, vilket är viktigt att beakta när man gör en forskningsöversikt på summativa bedömningar. Hur betydelsefulla betyg är i ett utbildningssystem har givetvis konsekvenser för hur elever påverkas av betyg.

Andra viktiga nyanser att beakta är att betyg ofta sätts på grundval av en mängd information som en lärare samlat in under en längre tid om en elevs prestationer inom det kunskapsområde som ska betygssättas. En elev kan ha dåliga dagar utan att det behöver påverka betyget nämnvärt. Detta till skillnad från exempelvis ett högskoleprov där en dålig dag för en elev kan ödelägga chanserna till bra resultat och därmed chanserna att komma in på den utbildning hen önskar. Det är rimligt att anta att ett prov som bara utgör ett av flera prov som en elev gör för att få ett betyg, påverkar eleven på ett annat sätt än ett prov där allt står på spel just med detta enda prov.

På samma sätt är det rimligt att anta att alla betyg en elev får under sin skolgång inte påverkar eleven på samma sätt. Att få betyg för första gången är troligtvis omgärdat av andra förväntningar och annan oro än att få betyg för femte gången, likaså är avgångsbetyget av en annan art än betyg som ges som avstämningar under en längre utbildning. Elevens eller studentens ålder påverkar rimligen också de effekter betyg har liksom andra kulturella och kontextuella faktorer.

De distinktioner som beskrivs ovan är viktiga att beakta när forskningsöversikter på summativa bedömningar tolkas i syfte att säga något om svenska förhållanden och svenska betyg. Det kan även finnas andra viktiga överväganden att göra för att rätt kunna uttolka hur svenska betyg kan påverka svenska elever. Mycket av den forskning som finns om bedömning bygger på betygssystem som är normrelaterade snarare än kriterierelaterade som i Sverige. Detta hindrar dock inte att en mängd viktiga slutsatser kan dras på grundval av den forskning som gjorts (se även Brookhart, 2015, s. 269).

2.1   Forskningsöversikter på området summativa bedömningars effekter på elevers motivation, lärande och prestation

Sedan millennieskiftet 2000 har, som tidigare nämnts, två större systematiska litteraturöversikter gjorts som berör frågan om betyg och summativa bedömningar: Harlen, Deakin och Crick (2002) och Lundahl et al. (2015). Den förra översikten innehåller utöver själva översikten en jämförelse med de resultat som erhålls med resultaten från åtta andra översikter inom området: McDonald (2001), Madaus och Clarke (2001), McNeil och Valenzuela (2000), Black och Wiliam (1998), Kellaghan, Madaus och Raczek (1996), Crooks (1988), Ames (1992) och Natriello (1987). Den senare översikten innehåller en jämförelse med fyra andra översikter: Harlen och Deakin Crick (2002), Black och Wiliam (1998), Crooks (1988), Kluger och DeNisi (1996). Som synes överlappar tre av de ovanstående vilket innebär att totalt elva forskningsöversikter beaktas direkt och indirekt via de båda översikter som valts ut. Sammantaget ger dessa elva översikter en entydig bild av betyg och summativa bedömningar: de har en huvudsakligen negativ inverkan på elevers lärande och motivation, i synnerhet svagpresterande elever och elever från minoritetsgrupper, dvs. betyg och summativa bedömningar bidrar till ökade klyftor i skolsystemet. Nedan går jag djupare in på resultaten från Harlen och Deakin Crick (2002) och Lundahl et al. (2015).

Huvudfrågeställningen för Harlen och Deakin Cricks översikt är: ”What is the evidence of the impact of summative assessment and testing on students’ motivation for learning?” (2002, s. 18). Översikten inriktas på studier av elever i åldrarna 4–18 år. Syftet med att undersöka just motivation för lärande (dvs. vilja att lära sig) och inte därtill inkludera effekt på kunskap var att författarna menade att det förra området inte var lika väl studerat som summativa bedömningars effekter på elevers kunskaper. Ett annat motiv var att motivation för lärande måste anses som en viktig aspekt av utbildning i åldrarna 4–18, bland annat för att det är i dessa åldrar som elevens vilja att fortsätta utbilda sig och grunden till livslångt lärande läggs och att motivation för lärande är en viktig komponent i detta. Harlen och Deakin Crick (2002, s. 1) skiljer mellan motivation i relation till lärandemål och motivation i relation till prestationsmål då det finns goda såväl empiriska som teoretiska skäl att anta att den senare typen av motivation innebär att fokus för eleven och undervisningen förskjuts mot andra aspekter än själva lärandet.

Förutom omfattande databassökningar gick författarna igenom ett drygt 50-tal tidskrifter manuellt, vidare nyttjade de sina breda kontaktnät inom området samt granskade referenslistor i för översikten intressanta studier, allt i syfte att finna relevanta studier för översikten.

Harlen och Deakin Crick (2002) fann 183 studier som baserat på titel och sammanfattning var relevanta för deras översikt. De hade inga begräsningar i när studierna skulle vara gjorda men fann att merparten av de relevanta studierna var publicerade efter 1990. Efter en analys av dessa studier kvarstod 19 som uppfyllde alla uppsatta kriterier för relevans och rigorositet. De fann i en djupgående analys av de 19 utvalda studierna att det fanns hög grad av evidens för att:

  • Nationella prov/liknande leder till att öka sambandet mellan låg självkänsla och prestation.
  • Nationella prov/liknande gör att lärare tenderar att i högre grad använda sig av en förmedlingspedagogik och starkt strukturerade aktiviteter, vilket gynnar den typ av elever som föredrar detta undervisningssätt men missgynnar och sänker självförtroendet för de grupper av elever som föredrar mer aktiva, varierande och öppna undervisningsformer.
  • Upprepade diagnotiska prov förstärker negativa effekter på självkänslan hos lågpresterande elever.
  • Tester (oavsett typ) bidrar till elevers uppfattning om vad bedömning är och kan bidra till att elever kan komma att uppfatta även formativ bedömning som rent summativt, oavsett lärarens intentioner.
  • Elever är medvetna om det prestationsfokus som uppstår i samband med nationella test, och att dessa bara ger en begränsad bild av vad de kan.
  • Elever som ogillar nationella prov, uppvisar höga stressnivåer (i synnerhet flickor) och föredrar andra typer av bedömningar.
  • Återkoppling på bedömningar är en viktig faktor i hur bedömningar påverkar framtida lärande för elever. Återkoppling som inriktar sig på individegenskaper snarare än att vara uppgiftsrelaterad tenderar att minska elevers fokus på lärandemålen.
  • Summativa bedömningar blir lätt ett mål i sig för det som görs i klassrummet och influerar bedömningsinteraktionen mellan lärare och elev.
  • Summativa bedömningar leder till att målen för lärandet i skolan i högre grad länkas till ansträngning och den egna förmågan (snarare än till att utveckla kunskaper).
  • Hur en test- och summativ bedömningskultur påverkar elever beror i hög grad på hur den implementeras av lärarna. Negativa effekter kan mildras i ett klimat som stödjer elevers känsla av att räcka till och prestera väl.
  • Skolsystem som har ett starkt fokus på utvärdering producerar studenter med stark yttre orientering mot betyg och social status (snarare än mot att utveckla kunskaper). (Harlen & Deakin Crick, 2002, s. 61-62).

Harlen och Deakin Crick gör en jämförelse av de resultat de fått med åtta andra litteraturöversikter inom detta område gjorda åren 1987-2001, vilka listades tidigare i detta avsnitt, och finner att deras slutsatser ligger i linje med dessa översikter (2002, s. 68-69). Ett av deras mest tydliga resultat är att summativa bedömningar differentierar och att det i synnerhet påverkar lågpresterande elever negativt. Även flickor påverkas negativt av en summativ bedömningskultur på grund av ökad stress. I relation till ålder och idén att vänja elever vid en testkultur, så menar Harlen och Deakin Crick att det mesta snarare pekar på risker med att tidigt introducera elever i en sådan kultur: ”Instead of motivation and test familiarity increasing with age, older students feel more resentment, anxiety, cynicism and mistrust of standardised achievement tests” (2002, s. 5). Att tidigt utsättas för high-stakes bedömningar leder alltså snarare till att man känner ökad oro och cynism.

Lundahl et al. (2015) använder databaserna ERIC, ProQuest och Libris tillsammans med en manuell genomgång av fyra tidskrifter på området. Genomgången täcker åren 2002-2014. Inga åldersbegräsningar användes, varför även studier på enbart universitetsstudenter inkluderades. Totalt uppfyllde 22 studier kvalitetskraven och valdes ut för fördjupad granskning. Lundahl et al. (2015, s. 30-32) fann att studierna som hade varit föremål för fördjupad granskning till stora delar var samstämmiga och att:

  • Summativa bedömningar har en generell differentierande effekt: betyg påverkar olika elevgrupper på olika sätt beroende på prestationsförmåga och kön. Lågpresterande elever och pojkar får en negativ utveckling i sitt lärande och sämre prestationer med summativa bedömningar jämfört med högpresterande elever och flickor.
  • Summativa bedömningar som betyg påverkar elevers prestationer negativt jämfört med formativ bedömning, över åldrar.
  • Negativ feedback påverkar elever negativt: feedback som är summativ och som visar på elevers bristande kunskaper och svaga resultat verkar inte hjälpa elever att ”skärpa sig” utan elever presterar sämre med negativ feedback och de presterar bättre om de får feedback med mycket och kontinuerlig ”positiv” information om hur de kan förbättra sitt arbete.
  • Ett fåtal studier undersöker betygens effekter på yngre elevers lärande och prestationer (före årskurs 6) och dessa visar att feedback som ger mycket information om hur eleverna kan förbättra sina prestationer är bättre för deras lärande och prestationer jämfört med summativa bedömningar.

Lundahl et al. (2015) menar även att ålder, erfarenheter av bedömning och om eleven är resurssvag/resursstark  tycks spela en stor roll för hur elevers lärande, motivation för lärande och prestationer påverkas av summativ bedömning. Som vi ser innehåller några av slutsatserna ett jämförande perspektiv mellan formativa och summativa bedömningar. Det finns också andra aspekter som lyfts för att förklara skillnader resultat mellan olika studiers. Exempelvis menar Lundahl et al. (2015) att det finns en skiljelinje mellan studier gjorda av å ena sidan psykologer och utbildningsforskare och å andra sidan ekonomer. Jag ska granska detta påstående senare, när jag mer ingående diskuterar skiljelinjer i betygsforskningen. Det finns skäl att nyansera detta påstående dels på basis av en re-analys av tidigare studier gjorda av ekonomer, dels i ljuset av en ny studie som genomförts av ett par ekonomer som inte hade beaktats av Lundahl et al. (2015).

Som framgått av denna sammanfattning av tidigare översikter så är evidensen stark för att betyg och summativa bedömningar huvudsakligen har en negativ inverkan på elevers motivation för lärande och för undervisningens inriktning, i synnerhet gäller detta i relation till lågpresterande elever. Flickor påverkas mer negativt i termer av ökad stress och oro av en test- och prestationskultur än pojkar. Betyg och summativa bedömningar differentierar, det är ett mycket tydligt resultat i forskningen.

När det gäller betyg specifikt så är evidensen inte lika utvecklad när det gäller hur dessa påverkar motivation för lärande, stress, prestations- och undervisningsfokus. Medel- och högpresterande elevers resultat verkar inte påverkas negativt av betyg. Huvudsakligen är det en fråga om i vilken grad betyg leder till ökat fokus på summativa bedömningspraktiker i skolan.

Trots att tidigare forskning uppvisar stor enighet och hög grad av evidens finns det ändå de som hävdar att betyg är ett viktigt verktyg i syfte att motivera elever till att anstränga sig hårdare och lyfta sina kunskapsresultat, i synnerhet i relation till lågpresterande elever. Det vill säga precis tvärt emot vad forskningen visar. Jag ska nu gå över till argument och studier som åberopas som grund för dylika argument för att se om det finns förbisedda aspekter som inte beaktats i de översikter som tidigare redovisats i detta avsnitt.

2.1.1    Belägg för att betyg kan vara bra

I detta avsnitt går jag djupare in på två rapporter som förts fram till stöd för tidiga betyg. Den första är promemorian En bättre skolstart för alla: bedömning och betyg för progression i lärandet(Promemoria 2014-08-20), vilket är den senaste statliga utredning som tar upp betygsfrågan. I den utarbetas förslag till att betyg ska införas i årskurs 4 samt att det ska införas ett flertal diagnostiska tester i år 1, som del av ett stärkt bedömningsstöd till skolor. Den andra är en studie av Sjögren (2010). Vilka belägg ges i dessa rapporter för betyg och summativa bedömningars effekter på lärande, motivation och prestation?

2.1.1.1   Promemorian En bättre skolstart för alla

För att börja med promemorian så hävdas det i den att det rent generellt finns få studier av betyg av tillräckligt hög kvalitet och att de som finns i hög grad saknar relevans för svenska förhållanden (Promemoria 2014-08-20, s. 83-84). Promemorian gör inte anspråk på att vara en forskningsöversikt, men likväl tas några studier upp i den som stöd för betyg och summativa bedömningars positiva effekter på elevers lärande.

När det gäller förslagen kring bedömningsstöd i årskurs 1 i svenska, svenska som andra språk och matematik så tas den så kallade proveffekten upp som stöd för dessa förslag, en effekt som sägs visa på vikten av prov för att etablera robusta långtidsminnen (Promemoria 2014-08-20, s. 39). I avsnittet om proveffekten åberopas en studie av McDaniel, Roediger och McDermott (2007). Det sägs vara en studie med direkt relevans för proveffekten i skolmiljö. Låt oss gå till den studien för att bättre förstå vad den ger evidens för. Artikeln presenterar en syntetiserande sammanställning av flera delprojekt där ett av dessa delprojekt handlar just om proveffekter i klassrumskontext, det är studien ”Testing the testing effect in the classroom” av McDaniel, Anderson, Derbish och Morrisette (2007). I artikeln redovisas resultaten av en studie på 35 medicinstudenters frivilliga deltagande i en kurs om ”Hjärna och beteende” som forskarna hade utformat i syfte att testa proveffekten. Kursen gavs under en period av sex veckor. Den typ av kunskap som fokuserades i studien var av faktakaraktär och utvärderades med hjälp av två delprov och ett slutprov, alla av arten flervalsfrågor (multiple choice). Upplägget på studien var så kallat 3*2, med tre olika typer av tester som studenterna utsattes för veckovis och två olika faktainnehåll som endera ingick i det som testades eller inte gjorde det.[1] Studenterna tilldelades slumpvis olika behandlingar/­exponeringar i det faktabaserade upplägget. Genom detta upplägg kunde man studera vilken av de tre behandlingarna: flervalstest, kortsvarstest eller lästester som gav bäst effekt på del- och slutprov (som alltså var av flervalstyp). Man kunde även avgöra hur studenterna presterade på det innehåll som tagits upp i testerna jämfört med sådant innehåll som inte tagits upp i testerna.

Resultaten visar att samtliga behandlingar ledde till bättre resultat på del- och slutprov för det innehåll som hade testats vid jämförelse med det som inte hade testats. Den behandling som gav minst effekt var den där studenterna fick lästester, det vill säga läste testerna med de färdiga svaren ifyllda men inte själva gjorde testen. Näst bäst effekt för lärande hade flervalstesterna och bäst effekt gav kortsvarsfrågorna. Detta var inte väntat menar forskarna då det förväntade var att flervalstesterna skulle ge högst effekt eftersom slutprovet var av flervalstyp. Att det inte blev så förklarar forskarna med att minnesforskningen visat att igenkänning (som flervalsuppgifter baseras på) är sämre för lärande av fakta jämfört med att plocka fram något ur minnet (”retrieval”), vilket kortsvarstesten krävde (kortsvarstesten innebar att studenten själv fyllde i den faktaterm som fattades i ett i övrigt givet faktapåstående).

I diskussionen problematiseras resultaten och författarna menar att en del av proveffekten kan ha att göra med den feedback som studenterna fick i samband med flervals- och korsvarstesterna. Direkt efter att de gjort dessa gavs automatisk feedback där de fick de rätta svaren samt fick se hur de själva svarat.

Promemorian En bättre skolstart för alla lyfter fram vikten av studier som kan säga något av relevans för skolan. Bland annat hävdas det att “[e]n del svenska debattörer använder internationella data förhållandevis liberalt, utan att överväga deras inferens i svenska förhållanden.” (Promemoria 2014-08-20, s. 80).

Vad säger studien av McDaniel et al. (2007) om vilken roll nationellt utformade bedömningsstöd och diagnostiska test kan spela i lågstadieelevers utveckling av grundläggande förmågor inom områdena läsning, skrivning och matematik? Ger studien av de 35 medicinstudenternas faktapluggande i en kurs om hjärnan evidens för att man ska jobba på ett visst sätt med tester i syfte att lära barn läsa, skriva och räkna? Det är inte helt uppenbart hur denna koppling ser ut. Vilken roll spelar inlärning av centrala fakta vid utvecklingen av förmågor som läsning, skrivning och räkning? Det får vi inte svar på. Det är därtill enbart tre behandlingar som testas: flervalstest, korsvarstest och färdigifyllda lästest. Det finns självfallet fler pedagogiska metoder för att utveckla förmågan att läsa, skriva och räkna. McDaniel et al. (2007) gör slutligen inte anspråk på att säga något om testandets effekter på studenternas motivation, eller om lärande av andra typer av kunskaper än fakta.

Studierna av McDaniel med kollegor var det forskningsstöd som fördes fram för att tidigt bedömningsstöd och diagnostiska test är bra. Den måste anses ha låg inferens avseende lågstadieelevers utveckling av grundläggande förmågor inom områdena läsning, skrivning och matematik. Detta betyder inte att det saknas studier inom dessa områden (se t.ex. Shepard et al., 1998).

Nu vänder jag mig till frågan om tidiga betyg, vilket forskningsstöd åberopas som stöd i promemorian för att detta är bra? Frågan behandlas i promemorians kapitel 7, mer specifikt kapitel 7.2 där argument för och emot betyg tas upp.  Promemorian hävdar att forskningen på området är ringa och kan säga lite om svenska förhållanden (Promemoria 2014-08-20, s. 83-84). När det gäller argument för tidiga betyg hänvisas framför allt till Sjögrens (2010) studie Graded children – evidence of long-run consequences of school grades from a nationwide reform. Dessutom hävdas att ”[v]issa experimentella data understödjer fynden att skriftliga omdömen påverkar studieresultaten positivt med förvånansvärt starka siffror”, och i samband med detta påstående refereras nedanstående två studier (Promemoria 2014-08-20, s. 82):

  • Azmat och Iriberri, 2009 (se 2010), ”The Importance of Relative Performance Feedback Information”.
  • Bandiera, Larcinese och Rasul, 2009, “Blissful Ignorance? Evidence from a Natural Experiment on the Effect of Individual Feedback on Performance”.

Den första studien undersöker hur vetskapen om hur du ligger till kunskapsmässigt jämfört med andra klasskamrater påverkar din prestation jämfört med om du inte vet detta utan bara vet ditt betyg. Det är alltså inte en studie om betyg är bra eller ej, utan en studie av olika typer av betygssystem (på gymnasienivå). I korthet kan sägas att studien visar att det verkar vara gynnsamt för gymnasieelevers prestationer att de utöver betyg även få veta sin position i relation till andra studenter jämfört med att enbart få veta sitt betyg.

Bandiera et al. (2009), den andra studien, hämtar sina data från ett ledande universitet i Storbritannien. Upplägget av undervisningen ser likartat ut vid de 20 samhällsvetenskapliga institutioner vid universitetet som ingår i studien: studenten läser och tenterar normalt drygt fyra kurser under ett akademiskt år och avslutar varje år med ett självständigt arbete motsvarande ungefär en fjärdedel av de poäng studenten ska ta under året. Institutionerna har olika praxis när det gäller rapportering av betyg på de kurser som föregår uppsatsen. Vid vissa institutioner får studenterna betyg på de kurser man tenterar under året innan uppsatsen påbörjas och vid andra först efter det att uppsatsen har lämnats in. Detta skapar två typer av bedömningskulturer, en där studenter får veta betyg på sina kurser innan de börjar skriva uppsatsen och en där de inte vet betygen.

Den slutsats som dras är att studenterna som får veta betygen på kurserna innan de påbörjar uppsatsskrivandet presterar bättre uppsatser än de som inte får veta betyg på kurserna. Även om resultatet är som starkast för de mest högpresterande studenterna så finner Bandiera et al. (2009) att ingen studentgrupp missgynnas av att få veta sina betyg.

Naturliga experiment av den typ Bandiera et al. (2009) studerat är intressanta men som alltid måste man granska omständigheterna. En omständighet är att det handlar om studenter vid ett av de ledande universiteten i Storbritannien. Enligt Bandiera et al. (2009, s. 14) så är det bara i snitt tre procent av studenterna som underkänns på kurser under ett normalår. Och granskar man effekterna av att få information om sitt betyg så kan man notera att det för studenter som ligger under 55 i betygssnitt (50 är gränsen för godkänd prestation) inte finns någon noterbar skillnad mellan de som fått veta sitt betyg och de som inte fått veta betyget (Bandiera et al. 2009, figur 4). Om studien tolkas i detta perspektiv så ligger den ungefär i linje med forskningen om summativ bedömning där positiva effekter i vissa fall kunnat iakttas för just högpresterande elever, och i detta fall är det ju onekligen ett toppurval av högpresterande som varit föremål för undersökningen. Samtidigt visar studien att det för många studenter inte har någon effekt alls, och då framför allt för de som presterar sämst.

Ovanstående resultat motsägs delvis av andra studier, publicerade efter promemorian. Grant och Green (2013) finner inte att information om testresultat ger ökade incitament för högskolestuderande. Deras studie utgår också från naturliga experiment men bygger på en mer rigorös design. Jag återkommer till den senare i detta kapitel. Slutligen, det är tveksamt vilken relevans studien av Bandiera et al. (2009) har i relation till gruppen lågpresterande elever i grundskolan, de som ligger under gränsen för godkänd prestation. Om något så indikerar den att inte ens högpresterande studenter kan förvänta sig positiva effekter av att få kännedom om sina betyg i de fall de tillhör den lägst presterande delen av ett högpresterande urval. Detta är intressant, det finns studier som visar att det verkar vara bättre för en högpresterande elev att befinna sig i en klass där övriga elever presterar sämre än att befinna sig i en klass där övriga presterar bättre (se t.ex. Elsner & Isphording, 2015 eller Murphy & Weinhardt, 2014).

Det finns ett underliggande argument i promemorian där argument för betyg som fristående instrument tonas ned till förmån för betygens roll i en bedömningskultur där formativ och summativ bedömning samspelar på ett konstruktivt sätt. Det finns all anledning att inte underblåsa formativ och summativ bedömning som motsattsförhållanden, de bör i stället ses som ömsesidigt beroende av varandra (Taras 2007). Likväl, forskning om bedömning pekar mot att nationella prov, diagnostiska test och andra nationellt föreskrivna summativa bedömningspraktiker tenderar att tränga bort formativa bedömningspraktiker i klassrummen (se t.ex. Harlen & Deakin Crick, 2002).

För att summera: Efter att ett antal studier som åberopas i promemorian En bättre skolstart för alla granskats faller det empiriska stödet för att tidiga betyg är bra tillbaka på endast en studie, den av Sjögren (2010). Låt oss därför vända oss till den och granska den såväl som de studier den i sin tur hänvisar till som stöd för dess resultat.

2.1.1.2   Sjögren: Graded children

I samband med att Sjögren (2010) diskuterar betygens effekter nämns följande fem studier: Becker och Rosen, 1992; Costrell, 1994; Betts, 1998; Betts och Grogger, 2003; Figlio och Lucas, 2004; Dee och Jacob, 2006. Vi kan läsa att dessa studier visar att:

A general finding in this literature is that tough grading or graduation standards can have beneficial effects on student performance, but that good students benefit more than poor students, who may even suffer. The proposed mechanism is that tough standards and requirements are motivating for those who believe that working harder will pay off in higher grades or a higher likelihood of graduation. Weaker students may instead give up if tougher standards push success out of reach. With a fine enough scale, most students can, however, be on a margin where effort can pay off (Sjögren, 2010, s. 5).

Dessa studier ger alltså ingen tydlig evidens för betygens positiva effekter och några av dem visar att betyg till och med kan ha negativa effekter, i synnerhet för lågpresterande elever. Förklaringen som anförs är att för höga krav kan leda till att elever ger upp. Sjögren menar dock att fler betygssteg kan råda bot på det (vilket är tveksamt, se OECD, 2012 och avsnitt 2.1.4). Men sammantaget verkar det alltså inte som de anförda studierna ger något stöd för de resultat som Sjögren själv kommer fram till, nämligen att betyg är bra framför allt för just lågpresterande elever.

Lite senare i rapporten hänvisas till två andra studier: Azmat och Iriberri (2009, se 2010) och Bandiera et al. (2009). Sjögren (2010) menar att dessa båda studier ligger mer i linje med hennes resultat:

My results are therefore more in line with the recent findings on short run outcomes from smaller scale natural experiments that find positive effects of grades (s. 39–40).

Dessa båda studier var också refererade i promemorian En bättre skolstart för alla, som granskades tidigare. Som vi konstaterade vid genomgången av dessa så belyste endast en av dem mer direkt frågan om betyg och summativa bedömningar, den som gjordes vid ett elituniversitet i Storbritannien. Det konstaterades att det var tveksamt om den kan säga något om vilken effekt betyg har på lågpresterande elevers prestationer. Snarare verkar ett tydligt resultat av den studien vara att de positiva effekterna avtog ju sämre betyg studenterna fick.

Låt oss istället vända oss till de fem först nämnda studierna i Sjögrens rapport, för att se vilken typ av stöd för betygs positiva/negativa effekter som ges i dem.

  • Becker and Rosen, 1992, ”The Learning Effect of Assessment and Evaluation in High School”.

Ovanstående studie jämför norm- och kriterierelaterade betygssystem. Det konstateras att den relativa informationen leder till ökad akademisk prestation jämfört med när man bara får veta sin absoluta nivå/kompetens. Detta är en rent teoretisk studie, baserad på matematiska modeller, dvs. den bygger inte på empirisk evidens. Den är huvudsakligen relevant som inlägg kring vilken typ av betygssystem som kan vara bäst men då den saknar empiriskt underlag är det svårt att se hur den kan vara ett inlägg i frågan om betyg är bra eller ej.

  • Costrell, 1994, “A Simple Model of Educational Standards”.

I denna studie presenteras en teoretisk modell för hur kunskapsstandarder påverkar studenters prestationer. I artikeln undersöks olika sätt att utforma kunskapsstandarder och författaren drar slutsatsen att högre krav är bra för lärandet. På samma sätt som för föregående studie så är detta ingen studie som gör anspråk på att empiriskt undersöka frågan om betyg är bra eller ej.

  • Betts, 1998, “The Impact of Educational Standards on the Level and Distribution of Earnings”.

I denna studie presenteras en teoretisk modell för hur nivån på kunskapsstandarder påverkar olika studentgruppers framtida lön. Inte heller i denna studie framförs empiriska belägg i frågan om betyg är bra eller ej.

De två nästföljande studierna är empiriska studier som belyser fenomenet höga standarder: Betts och Grogger (2003) samt Figlio och Lucas (2004). Dessa studier anförs av Sjögren (2010) som stöd för att höga krav är bra. Båda dessa studier säger sig finna belägg för att höga kunskapskrav är bra. Men vad menar författarna med “höga kunskapskrav”? Syftar det på nationella betygsnivåer eller något annat? Eftersom båda har snarlika upplägg och drar liknande slutsatser redogörs endast mer noggrant för den förra studien.

  • Betts och Grogger, 2003, ”The impact of grading standards on student achievement, educational attainment, and entry-level earnings”.

Betts och Grogger (2003) konstaterar att det trots en mängd teoretiska studier av effekterna av höga krav (”higher grading standards”) finns få empiriska studier av detta. De använder data från en studie av gymnasister och hur det gick för dem, data från ”the High School and Beyond survey”. Detta i syfte att undersöka bedömningskravens effekter på studenternas akademiska resultat, deras utbildningsnivå samt ingångslöner. Förutom medeleffekter studerades även hur effekterna är beroende av faktorer som elevens förmåga och etnicitet. De fann att höga bedömningskrav korrelerade med relativt sett högre resultat på standardiserade tester för alla grupper men att de hade bäst effekt för högpresterande elever och menar att detta kan indikera att höga bedömningskrav har en positiv inverkan på elevers prestationer. Däremot hade de högre bedömningskraven inte någon effekt på utbildningsnivå och de hade negativ effekt på afroamerikaners och spansktalandes chanser att ta ut en gymnasieexamen.

En fråga man måste ställa sig är hur måttet ”höga bedömningskrav” konstrueras i studien av Betts och Grogger (2003). Detta är viktigt att söka svar på om resultatet ska kunna översättas till svenska förhållanden. Så här skriver Betts och Grogger (2003):

Constructing grading standards requires two pieces of information: each student’s standing relative to all students nationwide, as measured through test scores, and each student’s standing relative to other students in his/her school, as measured through grades (s. 345).

Måttet “krav” är med andra ord uppbyggt av två delmått, dels vad eleven presterar relativt andra elever på nationella och standardiserade test, dels vad eleven presterar relativt andra elever på sin skola givet de betyg läraren sätter. Genom dessa båda mått kan man konstruera en tes om att det, givet att alla lärare sätter betyg på samma sätt, måste finnas en identisk korrelation mellan testresultat och betyg (kontrollerat för en rad variabler så som antalet kurser i ämnet som eleven tagit). Betts och Grogger (2003) finner att denna tes inte håller, vilket de menar visar att lärares bedömningsnivåer skiljer sig åt. De definierar höga bedömningskrav som att eleven, givet det betyg läraren satt, får högre testresultat än förväntat. De ger följande exempel:

To see this, consider the case of two schools. If a1 a2, then students in school 1 receive higher standardized test scores, on average, than students in school 2 who earn the same grades. For example, students with a B average at school 1 score higher than students with a B average at school 2. Thus, school 1 has higher grading standards (Betts & Grogger, 2003, s. 346).

Grant och Green (2013) kommenterar i sin studie ”Grades as incentives” denna typ av studier av “höga krav”. De refererar bland annat till både Betts och Grogger (2003) och Figlio och Lucas (2004). De menar att dessa studier bygger på problematiska antaganden om vad som utgör ”höga krav” och egentligen inte kan uttala sig om vad det är som orsakar vad:

Thus, most studies of grades’ incentive effects have been done by economists. Most relate cross-instructor variation in grading standards to study time or learning outcomes […] More difficult instructors do have better learning outcomes, but this might have more to do with teaching methods, which are not controlled for, than incentives (Grant & Green, 2013, s. 1566).

Grant och Green (2013) menar alltså att det är oklart på vilket sätt dessa studier uttalar sig om “höga krav” och de menar att det kan finnas skäl att anta att de olika betygssättningspraktikerna som identifierats indikerar olika pedagogiska praktiker snarare än att indikera olika kravnivåer. Det innebär att de effekter som mäts snarare är effekter av olika typer av pedagogiska praktiker där den för testresultaten mer gynnsamma pedagogiska praktiken korrelerar med lärare som sätter relativt sett lägre betyg (dvs. har “höga krav”). Det är därtill högst oklart på vilket sätt denna typ av krav säger något relevant om det svenska betygssystemet och dess gräns för godkänd prestation. Snarare än “höga krav” verkar dessa studier, som Grant och Green (2013) är inne på, handla om lärar- och undervisningsspecifika egenskaper som korrelerar med dessa lärares interna krav på sina elever och alltså inte har med externa krav att göra (notera därtill att lärarsatta betyg i USA inte är high-stakes).

Sjögren (2010) anför ytterligare en empirisk studie kring vikten av höga kunskapsstandarder:

  • Dee och Jacob, 2006, ”Do High School Exit Exams Influence Educational Attainment or Labor Market Performance?”

Denna studie undersöker höga kunskapsstandarder på ett annat sätt än de båda nyss nämnda. Den undersöker nämligen vad som inträffat som följd av att många gymnasieskolor i USA infört så kallade slutexamina (”exit exams”) under senare decennier. Det hela började på 1970-talet i kölvattnet av en debatt kring att värdet av en gymnasieexamen hade urholkats. För att höja kvaliteten på examinerade studenter föreslogs att man skulle införa slutexamina, vilket också gjordes i stor utsträckning i USA. De slutsatser som dras i studien är att man kan se en tydlig effekt att dessa examina differentierar, dvs. minskat likvärdigheten i skolsystemet. Resultaten är inte helt entydiga utan det fanns indikationer på att det för spansktalande kvinnor och svarta fanns en korrelation mellan införande av slutexamina och ökad grad av universitetsutbildning samt positiva effekter på jobbrelaterade utfallsvariabler, vilket tycks indikera att systemet lett till ökad grad av prestationsfokus för dessa grupper även om inte andra faktorer kan uteslutas. Sammanfattningsvis menar Dee och Jacob (2006) att det behövs mer forskning på effekterna av slutexamina för att tydligare kunna uttala sig om vad dessa till synes olika utfall av slutexamina beror på. Denna studie har låg relevans för betygens effekter i skolans tidiga år. Studien behandlar olika typer av examenssystem och deras effekter på framtida utbildnings- och jobbframgång.

Ingen av de studier som Sjögren anför ger alltså belägg för att tidiga betyg ska vara bra. Låt oss därför gå närmare in på Sjögrens egen studie.

Sjögren undersöker registerdata från de betygsreformer som genomfördes i Sverige under 1970-talet då betyg i årskurs 3 och 6 försvann gradvis ända till dess att dessa betyg helt avskaffades med Lgr 80, vilket skedde från läsåret 1982/83. Efter det gavs betyg endast från vårterminen i årskurs 8. Under perioden från 1969 fram till läsåret 1982/83 fick kommunerna avskaffa betyg om de ville, vilket kommunerna gjorde i olika takt. Detta har skapat ett naturligt experiment med möjlighet att jämföra kommuner som avskaffat betyg med de som inte gjort det. Sjögren studerar data från elevkullar födda mellan 1954 och 1974.

De utfallsvariabler Sjögren i första hand fokuserar på är antal år av utbildning (upp till och med gymnasienivå) samt framtida lön. Sjögren beaktar även två andra utfallsvariabler, sannolikheten att eleven tar en gymnasieexamen och sannolikheten att eleven studerar vidare på högskolan. Sjögren undersöker effekter utifrån faktorerna kön och föräldrars utbildningsnivå.

Sjögren finner bland annat en positiv korrelation mellan betyg och fullbordat gymnasium när det gäller flickor, dvs. betyg tycks leda till att flickor fullbordar skolan snabbare. Effekterna är inte stora, som mest motsvarande tre veckor i utbildningstid. För pojkar finner hon inga medeleffekter. När det gäller elever till lågutbildade föräldrar så minskar sannolikheten för dessa att ta gymnasie- eller högskoleexamen om de inte fått betyg. Betyg verkar med andra ord vara bra för elever till föräldrar med låg utbildningsnivå oavsett kön. För pojkar till högutbildade föräldrar finner Sjögren de största positiva effekterna av betygsfrihet, motsvarande upp till sju veckor i förkortad skolutbildning.

Den förklaring som Sjögren ger till sina resultat är att kvantitativ information i form av betyg är bra för barn till föräldrar med låg utbildningsnivå. Sjögren menar att dessa inte kan tillgodogöra sig mer kvalitativ information av den typ som fås på de kvartsamtal med läraren som ersatte betygen på låg- och mellanstadiet. Sjögren menar att den könseffekt hon noterat kan förklaras av att flickor i högre grad underskattar sin förmåga jämfört med pojkar och att betyget därför påverkar dem på ett annat sätt än pojkar.

Om vi jämför Sjögrens resultat med de elva forskningsöversikterna på området så kan vi notera att riktningen på de övergripande könsskillnaderna som Sjögren visar på ligger väl i linje med de som visats av övrig forskning. Men Sjögrens effekter ligger på en något högre nivå, då hon upptäcker en positiv effekt av betyg för flickor. Det ska i sammanhanget påpekas att Sjögrens effekt gäller mer långsiktiga effektmått än det normala. Normalt undersöks betyg och summativa effekters inverkan på motivation och lärande i mer närliggande mått än hur betyg på mellanstadiet påverkar utbildningslängd, utbildningsnivå, inkomst m.m.

När det gäller betygens effekter på lågpresterande elever tycks Sjögrens resultat i flera avseenden gå tvärs emot resultaten i de forskningsöversikter som behandlades tidigare i detta kapitel. Hur kan vi förstå detta? En förklaring till detta läggs fram i Klapp, Cliffordson och Gustafsson (2014) som undersökt samma reform som Sjögren, dock med tillgång till kompletterande information om elevers kognitiva förmågor och elevers bakgrund. Dessutom, medan Sjögren använder ett mått på elevers bakgrund baserat på föräldrarnas utbildningsnivå så använder Klapp et al. (2014) socioekonomisk bakgrund, baserat på en sammanvägning av föräldrars bakgrund, deras inkomst och yrken. De kompletterande data Klapp et al. haft tillgång till kommer från projektet “Utvärdering genom uppföljning” (UGU) som pågått sedan början av 1960-talet vid Göteborgs universitet i samarbete med Statistiska centralbyrån (SCB). I UGU-databasen finns anonymiserade uppgifter om riksrepresentativa stickprov av skolelever. Med hjälp av databasen kan man följa enskilda elever från årskurs 6 upp genom utbildningssystemet upp i vuxen ålder för ett urval årskullar födda från 1948. På så sätt har Klapp et al. (2014) kunnat koppla jämförbara elever som fått betyg med elever som inte fått betyg för ett urval kohorter under den aktuella period som även Sjögren studerade.

Klapp et al. (2014) konstaterar att Sjögren inte haft ett oberoende mått för lågpresterande elever och därför inte kan uttala sig om denna grupp. När Klapp et al. (2014) kontrollerar effekter avseende socioekonomisk bakgrund och kognitiv förmåga finner man i kontrast till Sjögren, men i linje med övrig forskning på betyg och summativa bedömningar, att betyg har en negativ effekt på lågpresterande. Man finner ingen effekt av betyg kopplad till socioekonomisk bakgrund, även det i kontrast till Sjögrens resultat.

En fråga som Klapp et al. (2014) ställer sig är om det kan vara så att kortsiktiga effekter som de själva studerar och långsiktiga som Sjögren studerar kan skilja sig åt. Denna tes avfärdar de eftersom de menar att samma mekanismer rimligen borde ligga bakom båda effekterna, dvs. om man finner kortsiktiga negativa kunskapseffekter av den typ Klapp et al. (2014) fann så borde detta även påverka långsiktiga effekter såsom utbildningslängd, utbildningsnivå och sannolikheten att ta ut en gymnasieexamen. Klapp et al. (2014) menar att saken måste utredas närmare innan man slutligt kan avgöra vad skillnaderna mellan de båda studierna beror på.

I en studie som genomförts efter Klapp et al. (2014) studie, har Klapp (2015b) undersökt mer långsiktiga effekter av samma reform. Förutom betyg i årskurs 7, 8 och 9 studeras även gymnasieexamen som utfallsmått. Klapp studerade endast en kohort elever, de födda 1967, och utgår precis som Klapp et al. (2014) från den databas som finns vid Göteborgs universitet. Totalt ingår 8558 elever i ett nationellt representativt urval i studien. Klapp konstaterar att ”graded low-ability students received lower subsequent grades through Grades 7–9 and had lower odds to finish upper secondary education, compared to ungraded low-ability students” samt att ” [t]he gender difference seems to increase over time: graded girls achieve higher grades throughout Grades 7–9 and had higher odds to finish upper secondary education, compared to ungraded girls and graded and ungraded boys” (Klapp, 2015b, s. 302). Dvs. resultat i linje med de som framkommit i forskningsöversikterna.

Vi finner alltså att det forskningsstöd som Sjögren åberopar huvudsakligen inte har relevans för frågan om tidiga betyg och att de studier som hade viss relevans ligger i linje med forskningen om betyg och summativa bedömningar. Vi finner även att Sjögrens studie tydligt motsäger vad som framkommit i forskningsöversikterna när det gäller betygens effekter på lågpresterande. En möjlig förklaring till detta är att Sjögren inte haft ett oberoende mått på elevers kognitiva förmågor varför det finns skäl att behandla just dessa resultat i Sjögrens studie med försiktighet.

2.1.2    Sammanfattande och utvecklande diskussion kring empiriska belägg av betygens effekter

Det kan vara av intresse att notera att idén om att betyg ska motivera elever till bättre prestationer inte har grund i betygens uppkomst och tidiga utveckling, utan att det verkar vara en idé som växer fram först under 1900-talet. Betygssystem har historiskt växt fram utifrån andra behov, som medel för certifiering och kvalitetssäkring. I studien ”Grades as incentives” hävdar Grant och Green (2013) att utvecklingen av nya betygssystem framför allt drivits av målet att betyg ska ge korrekt information om studenters kunskaper:

In summary, grading systems evolved with the educational system, partly in response to demands for better information about student performance, but were not explicitly designed to motivate students (s. 1565).

De menar vidare att detta i synnerhet gäller för de numera vitt spridda A–F-baserade betygsskalorna, uppbyggda kring kriteriebaserade och kvalitativt skilda betygssteg. Dessa växer fram mot slutet av 1800-talet som ett led i en modernisering och effektivisering av utbildningsinstitutionerna och för att råda bot på vad man ansåg vara godtycklig betygsättning bland lärare. Ett exempel på detta är när man vid Harvard under 1880-talet övergick från procent-betyg till en A–E-skala med motiveringen att studenterna genom denna typ av betyg i lägre grad skulle motiveras att tävla med varandra. Man hävdade även att de nya betygen skulle få studenterna mer fokuserade på genuint kunskapssökande. I en årsrapport från Harvard 1885 kan man läsa följande:

The Faculty last year did away with the minute percentage system of marking, and substituted a classification of the students in each course of study in five groups, the lowest of which includes those who have failed in the course. It is hoped that this grouping system will afford sufficient criteria for the judicious award of scholarships, honorable mention, and the grade of the Bachelor’s degree, while it diminishes the competition for marks and the importance attached by students to College rank in comparison with the remoter objects of faithful work. (Grant & Green, 2013, s. 1565)

A–E/F skalan och andra kriteriebaserade betygsskalor är också de som allmänt rekommenderas av betygsexperter, bland annat för att de leder till mindre prestationskonkurrens, mer korrekt värdering av kunskap samt större fokus på lärande och kunskap jämfört med relativa och mer gradrika system (OECD, 2012). Vi återkommer till detta. Här är dock en fördjupad diskussion kring betygens motiverande effekt på sin plats; den nyss nämnda studien av Grant och Green (2013).

Grant och Green (2013) har studerat vilka incitament som A–F skalan ger studenter. De finner att inte ens där information om betyg potentiellt har som störst motiverande effekt, dvs. för de studenter som ligger precis under gränsen för godkänd prestation, har diagnostisk information om betyg någon motiverande effekt. Låt oss närmare se till hur studien är upplagd.

Grant och Green (2013) använde tio års data från fyra olika kurser inom ekonomiområdet som getts av fem universitetslärare vid två universitet i USA. Varje lärare hade minst 650 studenter sammanlagt. En mängd data om dessa studenters prestationer samlades in, inklusive information om dessa studenters prestationer under kursernas gång: resultat på hemuppgifter, mittexamina (två till fyra stycken) samt slutexamina. Samtliga examinationer var av typen flervalsfrågor (multiple choice), men några kortsvarsfrågor kunde ingå. Samtliga lärare använde en kriteriebaserade A–F-skalan kopplad till en standardskala, vilket är den vanliga uttolkningen av kriteriebaserade betyg i USA. I denna går gränserna för A gick vid 90%, för B vid 80%, för C vid 70%, för D vid 60% och där resultat under 60% gav F, dvs underkänt betyg. För att inte få bias i studien från studenter som låg långt under att klara godkänt betyg valde forskarna att dra gränsen för inkluderade studenter vid 50% (baserat på vad de presterat inför slutexaminationen). Följande slutsats dras:

Though the threshold grade incentives studied here are economically meaningful, they do not inspire the students in our data to strategically raise their exam scores when their grades are most likely to benefit, even when it means the difference between passing and failing (Grant & Green, 2013, s. 1582).

Forskarna finner alltså ingen motiverande effekt av att studenter gavs information om betyg, inte ens för de studenter som har som mest att vinna på det, de som låg på gränsen till att klara sig. Jag återkommer till mer teoretiskt förankrade förklaringar av detta i nästa avsnitt.

2.1.3    Teoretiskt förankrade argument kring betygens effekter på elevers lärande och motivation

Trots att betygens roll för motivation och lärande visat sig huvudsakligen negativ i de senaste decenniernas forskning, och därtill tydligt negativ för lågpresterande, så fortsätter betyg att föras fram som viktiga för just elevers motivation och lärande. Hur kommer detta sig? En förklaring som lagts fram är att ekonomi- och psykologiforskning, de områden som dominerat betygsforskningen, dominerats av skinnerianska teorier och att dessa teorier ofta okritiskt applicerats även inom utbildningsområdet utan empiriskt stöd (Yeager et al., 2014; Grant & Green, 2013). Grant och Green (2013) menar därtill att betyg rimmar väl med allmänna föreställningar om hur incitament fungerar vilket gör att många kan ha svårt att acceptera resultat som pekar på andra effekter. En tredje förklaring är att forskningen kring incitament inte tydligt skiljt mellan proceduriell och heuristisk kunskap (t.ex. repetition vs problemlösning). Över huvud taget har forskningen kring elevers motivation för lärande utvecklats mot en ökad teoretisk medvetenhet det senaste decenniet.

Vad senare års forskning visat är att den typ av extern belöning som betyg hör till (hit hör även incitament som pengar) kan ha en viss effekt på proceduriella kunskaper men inte på heuristiska dito:

The general finding is that they improve performance in “algorithmic,” or repetitious, tasks but are less effective or even counterproductive at “heuristic” tasks that require creativity, concentration, or intuition. (Grant & Green, 2013, s. 5; jfr Yeager et al., 2014).

Liknande resultat har visats i andra studier kring hur incitament påverkar  elevers prestationer. Gneezy, Meier och Rey-Biel (2011) diskuterar de resultat som framkommit i forskning kring incitament och behandlar bland annat en studie av Fryer (2011), som utfört randomiserade försök vid grundskolor i USA under två läsår 2007-2009. Fryer (2011) undersökte hur pengar mest effektivt kunde fungera som incitament till ökade resultat. Variabler som undersöktes var av mer direkt art såsom närvaro eller att en elev läser en bok, men även mer indirekta såsom betyg. Totalt 6,3 miljoner dollar distribuerades till 38 000 elever vid 261 skolor. Ett resultat var att incitament som riktar sig till mer indirekta utfall såsom betyg hade lägre effekt än de som riktade sig till mer direkta utfall såsom närvaro, gott uppförande, att bära uniform osv. Gneezy et al. (2011, s. 197) menar att en förklaring till detta kan vara att elever, “even if they are motivated by rewards, may not know how to turn their efforts into success”. Detta kan jämföras med den starka betoningen på bedömning för lärande inom pedagogisk forskning (Hattie & Timperley, 2007). Även om en elev vill ha högre betyg och är motiverad av de extra pengar hon eller han kan få som resultat av detta ger pengarna i sig inte eleven de verktyg som den skulle behövt för att förbättra sin prestation relativt de komplexa lärandemål betyg ska vara uttryck för (Yeager et al., 2014; jfr Harkin et al., 2016).

Även om yttre incitament som pengar kan ha betydelse för enklare förmågor så finns det flera skäl att fundera över om den vägen är den rätta, inte minst då det kan bli ganska dyrt. En forskargrupp som fördjupat sig i motivation relativt repetitiva och “tråkiga” skoluppgifter är Yeager et al. (2014). De menar att skolarbete aldrig fullt ut och hela tiden kan vara roligt utan att de flesta undersökningar pekar mot att fler och fler elever upplever skolarbete som just tråkigt och hellre prioriterar annat. En viktig fråga är därför vad som kan förklara att elever ägnar sig åt tråkiga skolmoment. Yeager et al. (2014) har under senare tid även intresserat sig för hur laboratorieförsök som syftar till att öka elevers motivation för studier kan skalas upp och implementeras i skolan.

Elevers uthållighet i studier av till synes enformiga och tråkiga skoluppgifter har visat sig mycket central för att förstå varför elever lyckas i sina studier. Yeager et al. (2014) testade tre olika typer av motiv till studier: transcenderande (omvärldsorienterade) motiv, självcentrerande inre motiv och självcentrerade yttre motiv. Den första typen av motiv handlade om studier som ett sätt att bidra till en bättre värld medan de senare handlade om studier för att man var intresserad av området ifråga (inre) eller att man ville studera för att få ett bättre jobb eller högre lön (yttre) (Yeager et al., 2014, s. 562). De kunde i sina försök visa att det enda som hade signifikant effekt på elevers förmåga att ta sig an tråkiga skoluppgifter var transcenderande motiv, medan elever som uppvisade den andra typen av motiv inte skilde sig signifikant från kontrollgrupperna. Yeager et al. (2014, s. 575) poängterar i diskussionen att dessa resultat gäller träning av enklare förmågor och därför kan anses ha störst effekt på lågpresterande elever. Hur mer altruistiska motiv till studier och hårt arbete i skolan påverkar toppresterares resultat är en fråga för framtida forskning.  Sammantaget visar denna typ av forskning på tidigare förbisedda aspekter av pedagogiskt verksamhet och vad som får elever motiverade till hårt arbete. Det pekar inte mot betyg som en lösning av de utmaningar som finns med elever som inte når målen utan det handlar snarare om att arbeta med eleverna så att de utvecklar genuina motiv för sina studier.

Conservation of Resources Stress Theory (COR-teorin) är en teori som utvecklats och prövats i betygssammanhang (Klapp, 2015a, s. 50). Det är en motivations- och stressteori som utvecklats inom forskningsområdena medicin, psykologi och sociologi men som tillämpats även inom utbildningsområdet. Teorin avser att förklara hur människor utifrån olika förutsättningar reagerar på och hanterar stressfyllda situationer såsom prestationssituationer i skolan. COR-teorin utgår från att eleven vid en given tidpunkt har en viss tillgång till resurser i relation till ett visst skolämne. Det kan handla om attityd till ämnet, uppfattning av den egna kompetensen, självkänsla och förmåga att reglera sina egna känslor. Framtida händelser eleven upplever i skolämnet kan både hota eller skapa nya resurser för eleven. En utgångspunkt i teorin är att en negativ påverkan (såsom att misslyckas på ett prov) har proportionellt större inverkan på resurserna än en positiv påverkan (såsom att lyckas på ett prov). Det krävs därför mindre påverkan för att rasera resurser än det krävs för att bygga upp dem (Klapp, 2015a, s. 50-51). COR-teorin förklarar det som empiriskt visats i studier av betyg och summativa bedömningars effekter på elevers motivation för lärande, nämligen att svagpresterande elever samt elever som överskattar sin förmåga i skolarbete (vilket pojkar tenderar att göra) förlorar mycket på negativ feedback i form av betyg och summativa bedömningar medan högpresterande elever samt flickor inte påverkas i samma utsträckning. COR-teorin förklarar också varför starka positiva effekter inte noteras i relation till betyg och summativa bedömningar.

COR-teorin samt distinktioner kring proceduriella kontra heuristiska kunskaper tillsammans med nya motivationsteorier har det senaste decenniet gett nya insikter inom området betyg och summativa bedömningar som problematiserat och vederlagt teorier som tidigare dominerat området. Betyg och summativa bedömningar har och kommer fortsatt ha en viktig funktion att fylla i utbildning i syfte att generera resultat om elevers kunskapsnivåer, både som information men också för att hålla lärare, elever och skolor ansvariga för dessa resultat. I relation till motivation för lärande, självkänsla och andra viktiga egenskaper för elever så handlar det alltså framför allt om att utforma resultatsystem vars negativa effekter på dessa egenskaper minimeras.

2.1.4    Antal steg i betygsskalan

Det kan i sammanhanget vara intressant att nämna en undersökning av betygssättning i olika länder som gjordes som del av PISA 2009 och omfattar 21 länder (OECD, 2012). Den enkät som specifikt behandlade betyg distribuerades endast i 17 av dessa länder.[2]  En aspekt av ett betygssystem som OECD särskilt tryckte på är vikten av att betyg ska ge ett korrekt och likvärdigt mått på elevers kunskaper. Kriteriebaserade system med ett fåtal kvalitativt skilda godkända betygssteg som beskriver prestationsgrader såsom godkänd, väl godkänt, utmärkt och så vidare visar sig klart bättre jämfört med relativa och gradrika skalor. OECD (2012) menar därtill att den senare typen av skalor uppmuntrar till skadligt tävlande vilket i sin tur leder till fel fokus i verksamheten, det vill säga till att elevers fokus förskjuts från det väsentliga lärandet till andra mer strategiska överväganden. De menar att kvalitativa skalsteg skapar bättre överensstämmelse mellan betyg och prestation jämfört med mer kontinuerliga betygsskalor. När det gäller de senare skalorna finns en tendens att olika lärare lägger in olika betydelse i de olika skalstegen, något som tycks kunna hanteras bättre med de kvalitativt preciserade skalorna.

3    Avslutande ord

Betyg, tidig uppföljning av elevers kunskaper, tydliga kriterier för elevers kunskaper och ansvarssystem kopplade till detta ligger fortsatt högt upp på många partiers skolpolitiska agenda i syfte att åstadkomma en bättre skola. Men är det den bästa vägen att gå för svensk skola?

Det som förvånade mig i genomgången av forskningen var hur svagt stödet för betyg var. Av de fåtal studier som lyfter fram positiva effekter var huvuddelen baserade på rent teoretiska antaganden om betygens effekter, det vill säga utan grund i hur betyg faktiskt påverkar elevers kunskaper och motivation. Detta att jämföra med de otal forskningsöversikter som visar på ytterst problematiska effekter av betyg och summativa bedömningar på elevers lärande och motivation.

I skollagen står det att skolan ska vila på vetenskaplig grund. Vad menas med det i ljuset av all den forskning som finns på nationellt utformat ansvarssystem med gränser för godkända prestationer? Varför framhärdar politiker att systemet misslyckats för att kraven varit för låga och att det därför krävs mer av samma medicin som redan prövats i drygt två decennier: det krävs tidigare betyg och uppföljning, tydligare ansvar, tydligare kunskapskrav osv. Är det inte dags att inse att förlorarna i detta system varit de systemet i dess begynnelse var tänkt att hjälpa: lågpresterande elever (under godkändgränsen)? Det är dags att vi på allvar börja tala om det svaga stöd som finns för betyg och dylika uppföljningssystem, och de negativa effekter som otaliga översikter lyft fram. Vetenskaplig grund kallas det. Det behöver inte betyda att vi överger vare sig betyg, krav eller ansvarsutkrävande, de kan ha ett syfte att spela i skolan (exempelvis betyg som information till föräldrar, eller som grund för urval), men vi kan inte låtsas som att de har effekter på skolans kvalitet som de att döma av all tillgänglig forskning med största sannolikhet inte har.

(Ovanstående text är ett utdrag ur en längre underlagsrapport jag tog fram för något år sedan och som aldrig publicerats. I rapporten belystes även systemaspekter av betyg och betygens roll för tidig uppföljning. Dessa texter har jag besparat läsaren, men sammanfattningen gällande betygens roll för uppföljning lyder:

Sammanfattningsvis kan man se att det inte finns några enkla kopplingar mellan kunskapskrav, betyg och särskilt stöd. Det finns i denna genomgång av forskning på svenska förhållanden inga indikationer på att betyg skulle utgöra en central komponent i ett välfungerande stödsystem.

Även om inte relationen mellan särskilt stöd, måluppfyllelse och tidiga betyg finns tydligt belyst i forskningen så är den bild som framträder av en stödjande skolmiljö för barn relativt tydlig; betyg är ett för trubbigt och oprecist instrument för att kunna bidra till att styra kvalitet på och omfattning av en så komplex åtgärd som särskilt stöd till barn.)

Referenser

Ames C. (1992). Classrooms: goals, structures and student motivation. Journal of Educational Psychology, 84(3), 261–271.

Azmat, G. & Iriberri, N. (2010). The importance of relative performance feedback information: evidence from a natural experiment using high school students. Journal of Public Economics, 94(7–8), 435–452.

Bandiera, O., Larcinese, V. & Rasul, I. (2009). Blissful ignorance? Evidence from a natural experiment on the effect of individual feedback on performance. Working paper.

Becker, W. & Rosen, S. (1992). The learning effect of assessment and evaluation in high school. Economics of Education Review, 11(2), 107–118.

Betts, J. R. (1998). The impact of educational standards on the level and distribution of earnings. American Economic Review, 88(1), 266–275.

Betts J. R. & Grogger, J. T. (2003). The imapct of grading standards on student achievement, educational attainment, and entry-level earnings. Economics of Education Review, 22(4), 343–352.

Black, P. & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7–74.

Brookhart, S. M. (2015). Graded achievement, tested achievement, and validity. Educational Assessment, 20(4), 268–296.

Costrell, R. M. (1994). A simple model of educational standards. American Economic Review, 84(4), 956–971.

Crooks, T. (1988). The impact of classroom evaluation practices on students. Review of Educational Research 58(4), 438–481.

Dee, T., & Jacob, B. (2006). Do high school exit exams influence educational attainment or labor market performance?NBER Working Paper No W12199.

Elsner, B. & Isphording, I. E. (2015). A big fish in a small pond: ability rank and human capital investment. IZA Discussion Papers 9121, Institute for the Study of Labor (IZA).

Figlio, D. & Lucas, M. E. (2004). Do high grading standards affect student performance. Journal of Public Economics, 88(9–10), 1815–1834.

Fryer, R. (2011). Financial incentives and student achievement: evidence from randomized trials.The Quarterly Journal of Economics,126(4), 1755–1798.

Gneezy, U., Meier, S. & Rey-Biel, P. (2011). When and why incentives (don’t) work to modify behavior. The Journal of Economic Perspectives, 25(4), 191–209.

Grant, D.  & Green, W. B. (2013). Grades as incentives. Empirical Economics,44(3), 1563–1592.

Harkin, B., Webb, T. L., Chang, B. P. I., Prestwich, A., Conner, M., Kellar, I., Benn, Y. & Sheeran, P. (2016). Does Monitoring Goal Progress Promote Goal Attainment? A Meta-Analysis of the Experimental Evidence. Psychological Bulletin, 142(2), 198–229.

Harlen, W. & Deakin Crick, R. (2002). A systematic review of the impact of summative assessment and tests on students´ motivation for learning (EPPI-Centre Review, version 1.1). Research evidence in educational library. London: EPPI-Centre, Social Science Research Unit, Institute of Education.

Hattie, J. & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.

Kellaghan, T., Madaus, G. & Raczek, A. (1996). The use of external examinations to improve student motivation. Washington DC, US: AERA.

Klapp, A. (2015a). Bedömning, betyg och lärande. Lund: Studentlitteratur.

Klapp, A. (2015b). Does grading affect educational attainment? A longitudinal study. Assessment in Education: Principles, Policy and Practice, 22(3), 302–323.

Klapp, A., Cliffordson, C. & Gustafsson, J-E. (2014). The effect of being graded on later achievement: evidence from 13-year olds in Swedish compulsory school. Eductional Psychology: An international Journal of Experimental Educational Psychology.

Kluger, A. N. & DeNisi, A. (1996). The effects of feedback interventions on performance: A historical review, a meta-analysis, and a preliminary feedback intervention theory. Psychological Bulletin, 119(2), 254–284.

Lundahl, C., Hultén, M., Klapp, A. & Mickwitz, L. (2015). Betygens geografi: forskning om betyg och summativa bedömningar i Sverige och internationellt.Stockholm: Vetenskapsrådet.

Madaus G. F. & Clarke, M. (2001). The adverse impact of high stakes testing on minority students: evidence from 100 years of test data. I G. Orfield & M. L. Kornhaber (red.).Raising standards or raising barriers? Inequality and high stakes testing in public education. New York: The Century Foundation.

McDaniel, M. A., Anderson, J. L., Derbish, M. H. & Morrisette, N. (2007). Testing the testing effect in the classroom. European Journal of Cognitive Psychology, 19(4-5), 494–513.

McDaniel, M. A., Roediger, H. L. & McDermott, K. B. (2007). Generalizing test-enhanced learning from the laboratory to the classroom. Psychonomic Bulletin & Review, 14(2), 200−206.

McDonald, A. (2001). The prevalence and effects of test anxiety in school children. Educational Psychology 21(1), 89–101.

McNeil L. & Valenzuela, A. (2000). The harmful impact of the TAAS system of testing in Texas: beneath the accountability rhetoric. Houston, Texas, US: Rice University.

Murphy, R. & Weinhardt, F. (2014). Top of the Class: the Importance of Ordinal Rank. CESifo Working Paper Series No. 4815.

Natriello, G. (1987). The impact of evaluation processes on students. Educational Psychologist 22(2), 155–175.

OECD (2012). Grade expectations: how marks and education policies shape students’ ambitions. Paris: Organisation for Economic Co-operation and Development (OECD).

Promemoria 2014-08-20. U2014/4873/S En bättre skolstart för alla: bedömning och betyg för progression i lärandet. Utbildningsdepartementet.

Shepard, L., Kagan, S. L. & Wurtz, E. (red.) (1998). Principles and recommendations for early childhood assessments. Washington, DC: National Education Goals Panel.

Sjögren, A. (2010). Graded children – evidence of longrun consequences of school grades from a nationwide reform. Working paper 2010:7. Uppsala: IFAU – Institutet för arbetsmarknad och utbildningspolitisk utvärdering.

Taras, M. (2007). Assessment for learning: understanding theory to improve practice. Journal of Further and Higher Education, 31(4), 363–371.

Yeager, D. S., Henderson, M. D., Paunesku, D., Walton, G. M., D’Mello, S., Spitzer, B. J. & Duckworth, A. L. (2014). Boring but important: a self-transcendent purpose for learning fosters academic self-regulation. Journal of Personality and Social Psychology, 107(4), 559–580.

[1]De tester som användes var: flervalstest, kortsvarstest samt läsuppgift, vi kan kalla den senare ”lästest” då den innebar studenterna med denna behandling fick i uppgift att läsa igenom tester med de rätta svar färdigifyllda

[2]Rapporten bygger på en enkät som distribuerades till 21 av de deltagande länderna i PISA 2009. 14 OECD länder: Australien, Österrike, Belgien, Ungern, Island, Irland, Italien, Korea, Mexiko, Nya Zeeland, Polen, Portugal, Slovakien och Slovenien och sju partner länder/ekonomier: Kroatien, Hong-Kong, Lettland, Macao, Serbien, Singapore, Trinidad och Tobago. Australien, Hong-Kong, Korea och Slovenien distribuerade inte delenkäten gällande betyg och ingår inte i den delen av analysen i rapporten.

Skolverket och den stora konspirationen

De senaste veckorna har sett en intensiv skoldebatt med högt och hårt tonläge. Det märks att valet närmar sig. Bland annat har debattörer försökt förklara varför Björklund misslyckades med sin ambition att skapa en tydlig läroplan under sin regeringstid. Den teori som lanserats menar att det var ”mäktiga tjänstemän” som förde in en konspiratorisk pedagogik i läroplanen som gick på tvärs med Björklunds intentioner.  Hur kunde han och departementet missa detta frågar sig vän av ordning? I synnerhet som forskningen visat att just Björklunds departement är det som jobbat närmast Skolverket, och som i högre grad än tidigare departement kontrollerat och styrt så att Skolverket följt departementets linje (se Magnusson 2018).

Jag har en annan teori. Skolverket är en myndighet. Myndigheter censurerar och friserar, i synnerhet när det gäller kritik mot rådande system och reformer. Det ligger så att säga i sakens natur. Dels att det alltid finns stark kritik, dels att det gäller för myndigheten att inte släppa lös kritiken – det vore ju att skjuta den egna legitimiteten i sank.

Jag vet flera kollegor som blivit censurerade av Skolverket. Vi tillhör alla vad som med en slarvig beteckning kan kallas ”pedagogiskt etablissemang”. Vi har bidragit till att skriva rapporter som varit för obekväma (för systemkritiska) och som aldrig publicerats och så vidare. Jag har själv blivit censurerad av Skolverket tre gånger. Den första gången skrev jag om med Ingrid Carlgren på DN-debatt 2004 under titeln ”Skolverket sprider myter”. Senaste gången var en rapport där ett kapitel jag skrivit som riktade kritik mot nuvarande styrsystem ströks.

Den andra gången jag blev bortfriserad var nedanstående intervju med mig gjord i november 2010. Den låg ute på Skolverkets hemsida några timmar, men togs sedan bort. Flera av frågorna i intervjun gällde den då nyligen genomförda läroplansreformen, Lgr 11. Som läsaren ser framför jag synpunkter som – så här i efterhand – jag förstår att Skolverket valde att ta bort från sin hemsida. Varför på sin egen hemsida lägga ut kritiska synpunkter mot en nyligen genomförd reform?

Jag blir illa berörd av tonläget i skoldebatten. I Sverige idag är det ett ”pedagogiskt etablissemang” som anses ligga bakom allt som är fel med skolan genom en ideologidriven konspiration – vi anses ha tentakler in på självaste Skolverket! Tidningar tar tacksamt emot och publicerar. Inläggen eggar. Etablissemanget! Ner med etablissemanget! Det spelar ingen roll att ”vi” var bland de första kritikerna av Lgr 11 och dess otydlighet.

 

Intervju med Magnus Hultén, 9 november 2010.

I:                    Intervjuare

MH:               Magnus Hultén

===

I: Finns det någon aspekt av de pågående skolreformerna som är extra intressant för dig med tanke på den forskning du bedrivit kring utformningen av naturvetenskaplig utbildning?

MH: Det som jag tycker mig se, det är att den trend som är inslagen sen tidigare fortsätter. Det vill säga, det undersökande arbetssättet förstärks, alltså betoningen av det. Att man ska skolas i att göra systematiska undersökningar och så vidare, samt att kritiskt granska fakta från tidningar, naturvetenskapligt relaterade samhällsfrågor, att det också förstärks. Det vill säga kärnkunskaper i biologi, fysik, kemi, begreppsförståelse, teoriförståelse och så vidare, det kanske får en ytterligare försvagad ställning. Men det är min tolkning.

I: Brukar det vara stora skillnader mellan intentionen bakom till exempel en kursplan och hur den tolkas?

MH: Man kan se det på två sätt, först att det finns intentioner och att det inte alltid blir som det var tänkt. Men jag tänker att man också kan se det så här, att de som skapar kursplaner och läroplaner bara har vaga idéer om vad de vill. De har idéer och vilja och visioner, men exakt hur det ska se ut, det har de ingen aning om. Så det skapas dokument som med nödvändighet är ganska öppna och ofullständiga och som lämnar utrymme för att realiseras på många olika sätt. Och det är inte givet vad som kommer att betonas. Här spelar samtida strömningar väldigt stor roll. När 1980 års läroplan infördes så började ju miljöfrågorna komma starkt. Men det var först i slutet av 80-talet som man verkligen fick de där begreppen för att tala om miljön, alltså ”hållbar utveckling”, ”biologisk mångfald” och så vidare. Så det dröjde ett decennium innan begreppen för att hantera miljöfrågorna kom på plats.

I: Vad baseras sådana här reformer egentligen på?

MH: Det kan se olika ut i olika läroplansreformer. Den reform vi ser just nu är att betrakta som en revisionsreform lik den som var 1969 som sköttes inom Skolöverstyrelsens organisation. Det har alltså inte varit frågan om en ny läroplan och nya idéer så jättemycket, utan det är mer frågan om någon sorts revidering av målreformen 1994, en nödvändig revidering av några av de problem som man upplevt att reformen 1994 hade. Likvärdighet verkar ha varit den ledande riktlinjen, att skapa enklare dokument för ökad likvärdighet. Men några visioner för ämnena konkret tycker jag inte man kan se denna gång.

Men man kan ju gå tillbaks till andra reformer och se att det har funnits starka idéer även kopplade till hur ämnena ska framställas. En av mina favoritreformer är den 1918, den nya undervisningsplanen som man brukar lyfta fram som en milstolpe i folkskolans historia genom att den fick en mer medborgarbildande inriktning. Man hade redan i början av 1900-talet haft en del olika idéer kring samverkan mellan naturkunnigheten [som ämnet kallades då] och geografiämnet. I stället för att fokusera naturens objekt som man hade gjort i slutet av 1800-talet, alltså hundar, fiskar, fåglar och blommor, så skulle man nu fokusera landskap och sjöar och natursystem, för att det var mer pedagogiskt. De ansågs forma sig till en naturlig helhet hos barnet. Det var alltså en tydlig pedagogisk idé som låg bakom mycket av reformarbetet för naturämnet vid den reformen. Men något sådant har jag inte sett denna gång. Det behöver ju inte finnas varje gång, utan ibland är det rent teknokratiska eller byråkratiska reformer.

I: Finns det planer för om och i så fall hur den pågående reformen ska utvärderas?

MH: Det är en bra fråga, jag har inte sett något sådant, men jag hoppas att det görs utvärdering och uppföljning. För jag tror att det är ett ganska digert arbete man har lagt ner. Annars tror jag arbetet är lite ogjort. En stor fråga rör ju den nya strukturen. För det första har de nya kursplanerna mål. Dessa är formulerade på samma sätt som strävansmålen i de förra kursplanerna, där det handlar om vilka mer övergripande förmågor som ska utvecklas i ämnet. Sen finns det ett centralt innehåll, och kunskapskrav. Och de här tre hänger ju ihop, så är det ju tänkt, men frågan är hur det kommer att användas av lärare. Och i slutändan är det ju de lokala dokumenten som blir styrande och frågan är hur dessa skapas. Kommer dessa att bygga helt och enbart på kunskapskraven? Hur kommer det centrala innehållet användas? Vilken roll kommer målen att spela, och, kanske ännu mer intressant hur kommer de tre olika delarna att kombineras, dvs vilket centralt innehåll paras ihop med vilka mål och vilka kunskapskrav när det skrivs planeringar? Jag märker när jag ger de nya kursplanerna till lärare i lärarutbildningen att man kan para ihop det lite hur som helst. Och det kanske är bra om det fungerar så, men jag tror att det finns många oklarheter kring hur de här nya styrdokumenten kommer att fungera. Och det måste följas upp tror jag om det ska vara någon vits med det här.

Om man går tillbaks i historien till min favoritreform, grundskolereformen 1962, så hade man hållit på i tio år och utvärderat undervisningsformer. Det var hundratusentals elever i slutet som var utsatta för olika experiment, där man testade undervisningsmetoder och innehåll. Även om slutsatserna av försöken ingalunda var entydiga så körde man igång grundskolan. Men man insåg att det här var en så stor reform att man behövde en kontinuerlig uppföljning, så man skapade olika metoder för det. Man skapade särskilda utvecklingsblock, alltså kommuner som var speciellt fokuserade på att ligga i framkanten på olika sätt. Sen fanns det särskilda pedagogiska arbetsgrupper som var knutna till Skolverket och vars uppgift var att plocka upp information från fältet hela tiden och på så sätt återkoppla och föra vidare den informationen till Skolöverstyrelsen. Efter fyra år av kontinuerlig uppföljning av grundskolereformen så tog man så i början av år 1966 beslut att revidera grundskolans första läroplan, en revidering som ledde till 1969 års läroplan. Det tycker jag är föredömligt på det sättet. Men det fanns ju oändligt mycket pengar i Sverige på den tiden så det var helt annat än idag. Det får man väl ha i åtanke.

I: Kan du säga något om vad du tror att de viktigaste konkreta konsekvenserna av den nuvarande reformen kommer att bli för hur lärare undervisar inom de naturvetenskapliga ämnena, och hur elevernas lärande utvärderas?

MH: Det har ju talats så mycket om ämneskunnande, att vi ska höja elevernas kunskaper i naturvetenskap. Men när jag tittar på den här reformen så undrar jag lite vad man menar med det. Sett till de kunskapskrav som Skolverket föreslagit så verkar ungefär en tredjedel vara av den typ som man normalt förknippar med ämneskunskap, det vill säga att förstå evolution, förstå kemiska förlopp och så vidare medan en tredjedel är mer granskande, human/samhällsvetenskapliga aspekter av naturvetenskaplig kunskap. Om man tänker sig en blivande lärare med en rent naturvetenskapliga skolning, har ju denne inte riktigt utbildats för att hantera den senare typen av frågor. Ytterligare en tredjedel av kunskapskraven rör det undersökande arbetssättet och också här kan man ställa sig frågande till hur de ska hanteras. Det är klart att en som doktorerat inom naturvetenskap har vissa inblickar i vad ett naturvetenskapligt arbetssätt är, men det är ju inte så att elever i grundskolan ska jobba som man gör på universitetet. Där har man ju mycket dyra instrument och så vidare. Naturvetenskapen ser ju ut på ett helt annat sätt ute i skolorna. Där blir det någon form av individualiserad undersökande verksamhet, som följer andra premisser än den naturvetenskapliga forskningen. För det undersökande arbetssättet har man ofta hämtat inspiration från vetenskapsteori, vetenskapsfilosofi och vetenskapssociologi. Det är säkert positivt för framtiden att elever lär sig det här och får någon form av kompetens. Men jag undrar, var det verkligen det man ville ha? Som jag tänker mig hela den här debatten och upprinnelsen till Björklunds skolpolitik, och till den här reformen och förändringarna som görs i skolan, så är det ökat fokus på kunskap, mer ”the hard core”, kunskap om vad kraft är, att de ska kunna vissa kemiska förlopp, att man ska kunna evolutionsteori och så vidare, när man går ut grundskolan. Jag tror allmänhet och politiker tänker sig naturvetenskapliga kunskaper som detta. Men när jag ser på reformen och så som texterna är skrivna i kursplanen, så tycker jag att denna typ av kunskaper får mindre utrymme än tidigare, det är andra kunskaper som bedöms viktigare. Det lägger jag ingen värdering i för egen del, jag bara tycker att det är lite intressant.

Det är ju en sak att initiera en sådan reform som denna, och vilka motiv som finns bakom. Varje läroplansreform innebär att gränserna för ämnet dras om, att vissa innehåll minskar på bekostnad av något annat. Den grupp som sitter och skriver kursplanerna har stora möjligheter att forma ämnet lite som de känner för, och kanske även till delar på tvärs med vad de som initierade reformen tänkt sig. Här finns ju alla möjligheter, för så detaljstyrt kan inte instruktionerna till kursplaneförfattarna vara, då blir det tal om ministerstyre.

===

Vems fel är det?

Jag vet inte hur många gånger jag bråkade med mina systrar om vems fel det var i vår ungdom. Kanske hör denna typ av bråk även vuxenlivet till. Vems fel var det? Vem var den ytterst ansvarige? Vem ska hängas ut? Vem bör göra avbön?

DN-debatt den 25 augusti skriver Jonas Linderoth, spelforskare och professor i pedagogik vid Göteborgs universitet och aktuell med boken Lärarens återkomst: från förvirring till upprättelse (Natur & Kultur), att det är dags för oss pedagoger att göra just avbön. Han tänker föregå som gott exempel, detta genom att säga förlåt för de idéer han själv gav uttryck för i sitt tidiga yrkesliv som forskare (vilket jag gissar kan vara sent 90-tal). De idéer han gav uttryck för då understödde enligt Linderoth den typ av pedagogik som ligger bakom svenska elevers sjunkande kunskapsresultat så som det mäts bland annat i PISA-undersökningarna.

Om jag förstår Linderoths argument i artikeln rätt ser det ut som följer: Pedagogikforskare började argumentera för behovet av en annan typ av pedagogik i skolan, en där läraren inte längre skulle föreläsa för barnen utan barnen själva skulle få upptäcka och undersöka och på så sätt, och med hjälp av läraren, nå kunskap. Denna typ av lärarroll, menar Linderoth, fick fäste i och med 1994 års läroplan, Lpo 94. Och eftersom lärare följde Lpo 94 så blev detta också implementerat i skolan, vilket lett till sjunkande elevresultat under 2000-talet. Låt oss borra lite i den här argumentationskedjan.

Först måste man komma ihåg att det i och med 1994 års läroplan infördes en ny typ av styrning av skolans verksamhet, en så kallad mål- och resultatstyrning. De politiska direktiven till Läroplanskommittén var tydliga med att läroplanen därför inte skulle få föreskriva någon särskild sorts arbetssätt utan att läraren själv skulle välja det arbetssätt hen ansåg bäst bidrog till att målen nåddes. Denna princip påtalas även av Läroplanskommittén i deras slutförslag. Linderoth måste alltså mena att när riktlinjer för arbetssätt saknades i läroplanen så vände sig alltså lärare till någon form av pedagogisk elit för vägledning. Han verkar mena att även om inte denna nya lärarroll påtalades direkt i läroplanen så skedde det indirekt. Linderoth anger som det starkaste tecknet på detta förekomsten av ord som “upptäcka” och “undersöka” i 1994 års läroplan. Men han har måste ha letat väldigt noggrant, för de förekommer endast ett fåtal gånger, i Läroplanskommitténs betänkande i alla fall (länk till betänkandet). För naturvetenskapliga ämnens del kan man läsa om följande målområde för årskurs 1-5 i ämnet naturlära:

Undersöka och upptäcka

Eleven skall ges rika möjligheter till både egna experiment och till iakttagelser av omvärlden. Elevernas eget frågande och diskuterande uppmuntras konsekvent. En träning av ett naturvetenskapligt arbetssätt påbörjas.

Ja, man kan hitta några ytterligare passager där ord och påståenden som uppmuntrar till elevaktivitet snarare än till föreläsande lärare förekommer, såsom att det i undervisningen i naturvetenskapliga ämnen i årskurs 6-9 ges utrymme “till fri undersökning med möjligheter till egna upptäckter. Elevernas egna frågor och diskussioner uppmuntras konsekvent.” Dessa citat återfinns under rubriken “Det naturvetenskapliga sättet att tänka och experimentera”. Eleverna ska enligt kursplaneförslaget utföra egna systematiska experiment, använda kvalitativa modeller för att förklara och förutsäga experiment, studera enskilda variablers betydelser vid experimentell verksamhet osv. Det kanske låter som rena flummet för Linderoth men jag tycker det påminner mig om det vi försökte uppnå på Chalmers där jag jobbade med undervisning av civilingenjörer åren 1996-1999.

Hursomhelst, vill man söka bland lömska ord i läroplaner och kursplaner kan man dock finna gott om dem i historien. Begrepp som signalerar progressiva idéer, dvs att eleven själv ska ta ansvar för sitt lärande och inte enbart lära sig rabbla fakta utan även utveckla förmågor såsom förmågan att genomföra naturvetenskapliga undersökningar. Denna typ av uttryck står att finna i anvisningar till exempelvis 1962 års läroplan, som dessutom var mkt tydligare i att det var just anvisningar om hur undervisningen skulle bedrivas. I naturvetenskapliga ämnen skulle undervisningen ge “överraskande effekter och resultat”, “motivera” mm. Det låter ju lite vagt i mina öron, det håller jag med om.

Men ja, enstaka ord i all ära, men det som verkligen gällde i 1994 års läroplan var betygskriterierna. Det är i sammanhanget viktigt att påminna sig om dessa, för de var de starkast styrande för läraren och dennas undervisning. Det nya betygssystemet skulle göra att alla elever nådde ett godkänt kunskapsresultat. Låt oss därför se vilka grunder dessa krav gav i relation till lärarens arbetssätt. Så här såg betygskriterierna för godkänd ut i fysik (nionde året) i förslaget till kursplan (SOU 1993:2), för att ge exempel från ett ämne som mäts av PISA:

Eleven skall:

Vara förtrogen med den experimentella metoden

Kunna skilja mellan oaccelererad och accelererad rörelse och mellan tyngd och tröghet

Veta att värme kan överföras på olika sätt och uppfattas som en oordnad rörelse hos materiens beståndsdelar

Veta att ljud kan uppfattas som en mekanisk svängningsrörelse och känna till hur man definierar och mäter ljudstyrka

Ha kunskap om elektriska laddningar och elektriska fält

Veta vad som menas med en elektrisk krets och känna till begreppen ström, motstånd och spänning samt elektrisk energi och effekt

Veta att ljuset utbreder sig linjärt, kan reflekteras och brytas och att det kan uppfattas som en elektromagnetisk vågrörelse

Ha kännedom om några olika slags energiformer och känna till att energin vid dessa omvandlingar alltid bevaras

Känna till de tekniskt viktigaste energiomvandlingarna och därmed förenade miljö- och säkerhetsproblem

Ha översiktlig kunskap om den moderna fysiken och dess tillämpningar

Ha kunskap om universums uppbyggnad

Känna till något om hur den fysikaliska kunskapen utvecklats

Jag vet inte vad ni som läser ovanstående säger, men för mig signalerar det inte på något tydligt sätt att undervisningen ska vara kunskapslös och ske med läraren som någon form av passiv handledare. Nåja.

Det kan i sammanhanget vara intressant att söka rötterna till den nya typen av lärarroll som Linderoth nämner, för den var ingalunda en produkt av 1990-talet. Linderoth nämner ett par namn, men de är från närtid. För att ta de naturvetenskapliga ämnena som jag själv är mest bekant med, och för svensk del, så utvecklades de progressiva idéerna kring sekelskiftet 1900 vid läroverken. Så här uttryckte en fysiklärare vid Nya elementarskolan i Stockholm sina erfarenheter av det nya arbetssättet:

Det har varit en glädje att se, med hvilken ifver och förtjusning lärljungarna utan undantag ägnat sig åt sina laborationsöfningar. Tillsägelsen “Nu måste Ni sluta för denna gång” kom oftast som en ovälkommen öfverraskning, och likväl hade “Börja” knappt hunnit utsägas, förrän alla voro i nästan feberaktig verksamhet. Läxboken och den myckna minnesläsningen ha säkerligen i dessa öfningar fått en nästan farlig konkurrent, men skolan en kraftig hjälpare i de ungas forstran. Det ligger ju för manlig ungdom i denna ålder något motbjudande i att blott vara eftersägare. Hur öfverensstämmer det däremot icke med det vaknade själfständighetssinnet att själv få iakttaga, på egen hand undersöka och vinna resultat. (Gustaf Hellsten i ett citat från 1906/07)

Vill man kritisera de som låg bakom utvecklandet av undervisningsidéer som krävde att läraren frångick sin roll som den som skulle tala om hur det låg till med naturlagarna och elevens roll som passivt mottagande av dessa fakta ska vi för svensk del och i relation till naturvetenskapliga ämnen nog framhålla lärare vid läroverken i det tidiga 1900-talssverige som de stora bovarna. Enligt dessa skulle eleven själv och genom experiment “upptäcka” hur det förhöll sig i naturen.

Men vi har lite andra saker att reda ut i Linderoth argumentation. Vilka stod exempelvis bakom förslaget till ny läroplan, det som kom att bli Lpo 94? Linderoth vänder sig till pedagogerna i Läroplanskommittén, de som tog fram förslaget till ny läroplan. Det var bland annat Ulf P. Lundgren, ordförande i kommittén och vid den tiden generaldirektör för Skolverket (den förste för detta då nyinrättade verk) och Ingrid Carlgren, medlem av gruppens sekretariat, vid den tiden docent i pedagogik vid Uppsala universitet.

Det är rätt att dessa och en hel del andra pedagoger ingick i Läroplanskommittén, men Linderoth får inte glömma att gruppens sammansättning var lite större än så, förutom en politisk styrgrupp så finner vi även Tor Ragnar Gerholm, professor emeritus inom avdelningen för kärnfysik vid Stockholms universitet, som medlem i Läroplanskommittén. Gerholm hade en central roll i skrivandet av kursplanerna för de naturvetenskapliga ämnena.

Att Gerholm skulle bidra till att skriva kursplanerna för de naturvetenskapliga ämnena var dock inte del av ursprungstanken. Gerholm kom in först en bit in i kommitténs arbete, tillsatt av den Borgerliga regeringen som tog över stafettpinnen 1991. Ansvariga för kursplanerna inom de naturvetenskapliga ämnena hade i början av kommitténs arbete varit en grupp från Linderoths eget universitet, Göteborgs universitet. Gruppen bestod av lärare och naturvetare som forskarutbildat sig inom det pedagogiska området och leddes av Björn Andersson, vid tiden Sveriges första professor i ämnesdidaktik, alltså en grupp pedagogiska forskare om man så vill.

Men nu var det inte deras förslag som återfanns i förslaget till kursplan utan ett utarbetat av Tor Ragnar Gerholm. Göteborgsgruppens förslag förkastades på målsnöret varpå gruppen tog avstånd från Gerholms och kommitténs förslag. Alltså, om vi ska hålla oss till naturvetenskapliga ämnen måste man kanske snarare säga att det var fysikernas fel att vi fick de kursplaner vi fick. Till skaran av de som bör göra avbön bör alltså läggas naturvetare och ingenjörer i stort, nu när vi ändå håller på att dra alla inom en gruppering över en och samma kam.

Men ja, det är lite mer komplicerat än så. Det fanns pedagoger i Läroplanskommittén och det fanns pedagoger knutna till den parlamentariska Betygsberedningen. Större motsättningar än dem mellan pedagogerna i Betygsberedningen och de i Läroplanskommittén får man leta efter. Den som likt jag anser att Betygsberedningens förslag hade störst påverkan på skolans faktiska utformning kan därför skylla på de unga och nytänkande lärare och pedagoger som politikerna i Betygsberedningen knöt till sig. Lutar man likt Linderoth åt att Läroplanskommitténs förslag var det styrande för hur det blev kan man istället skylla på de vid den tider mer etablerade pedagogerna som återfanns där. Summa sumarum: vill man kasta skit över pedagoger är man så att säga helgarderad, de fanns på båda sidor. Och där har pedagogerna funnits i alla tider, skulle jag vilja säga. Kampen mellan progressiva och konservativa pedagoger är närmast evig och en del av skolans större samhälleliga förankring och dynamik.

Men ansvarsfrågan har fler ben, ett av dem jag inte berört än är politikerna. Läroplanskommittén och Betygsberedningen var båda politiskt tillsatta, med direktiv från först en socialdemokratisk och sedan en borgerlig regering. Fyra regeringar kom och gick under reformperioden. Och vad mer: Den nya typ av styrning av offentlig verksamhet som låg till grund för politikernas direktiv hade utarbetats av statsvetare och ekonomer i utredningar som Långtidsutredningen 1990 och Maktutredningen 1989. Till skaran av ansvariga bör alltså läggas statsvetare och ekonomer samt politiker: chefsarkitekterna bakom den nya offentliga förvaltningen. Det enda parti som inte stödde betygsberedningens förslag var Ny Demokrati, så väljare som röstade på dem behöver kanske inte göra avbön.

Men vi är inte klara med skuldfrågan ännu. För vem är det som egentligen la grunden till att den nya typen av offentlig verksamhet kunde genomföras? Vem såg till att Skolöverstyrelsen, bromskloss i skolförändring och övergång till målstyrning, lades ned och ett mer politiskt följsamt Skolverket inrättades? För att detta skulle ske krävdes att skolan i dess dåvarande form hade blivit föremål för starkt missnöje, det vill säga att förtroendet för den skola som fanns innan 1990-talets reformer var, mer eller mindre, kört i botten.

Ja, mediedebatten vittnar om att många elever var trötta på skolan så som den såg ut innan 1990-talets reformer. Många lärare likaså. Kändisar från Lasse Åberg till Jokkmokks Jokke uttalade sig i pressen kritiskt till den dåvarande skolan. Jag tycker att vi till skaran av de som ska göra avbön även bör lägga dåtidens elever, lärare och kändisar. Utan en stark och brett förankrad misstro mot skolan hade inga reformer varit möjliga. 

Det kan i sammanhanget sägas att denna skrapa kritik mot grundskolan grundlades redan i dess tidiga skede. Grundskolan infördes under efterkrigstiden och var mer eller mindre fullt genomförd först runt 1970. Vare sig vänster eller höger gillade denna nya skola, den så kallade grundskolan. TV-serien “Lära för livet” från 1977 av Carin Mannheimer är ett exempel på hur kontroversiell grundskolan var redan från start. Serien fick stort genomslag, 3,5 miljoner tittare per avsnitt. Den visar hur ideologiskt laddad grundskolan var (länk till serien på Youtube).

Jag skulle vilja påstå att hela grundskolan som idé, en gemensam skola för alla, är svår för ett heterogent samhälle att hantera. Kanske för svår. Spänningar uppstår. Vi människor verkar trivas bäst med våra egna. Det ser vi inte minst idag när andra samlande samhällsprojekt skakar, såsom EU. Om 1990-talets skolreformer var något, så var de ett steg tillbaka från en “socialdemokratisk” skola för alla. Upplevelsen som många hade var att skolan likriktade och inte gav individen möjlighet att utvecklas på sitt sätt.  I slutet av 1980-talet fanns inte längre stöd för den sammanhållna skolan, valfriheten var ordet på allas läppar och den mål- och resultatstyrda skolan, med skolval, skolpeng och friskolor skulle minska på spänningarna. Det var Ingvar Carlsson, Bengt Göransson och Göran Persson som drog upp de första viktiga riktlinjerna för den nya skolan (se t.ex. proposition 1988/89:4 och 1990/91:18).

Det har gjorts mycket bra och mycket skit för skolan, den saken är säker. Exakt vems fel det är och varför är en intressant fråga. Jag försöker reda i det själv för tillfället i arbetet med en bok om 1990-talets reformer. Som jag ser det blev 1994 års läroplan, Lpo 94, en delvis tandlös produkt. Läroplanskommittén trodde sig med “strävansmål” funnit ett sätt att moderera den starka styrningen som det nya betygssystemet kunde ge (och den individuella och inte alltid lika intellektuellt utmanade undervisning som infördes av lärarna för att möta betygskraven, framför allt arbetet med att få elever att nå gränsen för godkänt betyg), men ack så fel de fick. De var naiva, liksom de flesta andra. Men ansvariga för skolans förfall? Ja, lika mycket som alla vi som på något sätt stod bakom dessa reformer, endera som elever och på något sätt kritiska till skolan under 1980-talet, som lärare trötta på relativa betyg eller som föräldrar eller som röstande på partierna som med stor enighet skrev direktiv till och genomdrev 1990-talets reformer, det vill säga Moderaterna, Folkpartiet, Vänsterpartiet, Miljöpartiet och Socialdemokraterna.

Ja, jag slutar här. 1990-talets reformer är mycket intressanta att rota i. Arbete med att bearbeta det som hände då, varför och vilka effekter de fick kommer fortgå i flera decennier framöver.

Betyg som räddning: perspektiv från andra sidan Atlanten

För svensk del har betyg länge och av många setts som ett “otyg”. I synnerhet betyg till elever i grundskolans tidiga år. Jag har själv argumenterat för att undvika tidiga betyg, framför allt mot bakgrund av att betyg missgynnar de redan missgynnade. Vid mitt senaste besök i USA blev det dock tydligt att jag missat en viktig aspekt av betyg: betyg som ett ljus i testtunneln.

Jag har framför allt fokuserat på likheter mellan betygs- och testkritik, mot att reducera barn och skolans resultat till siffror och mot att få barn att dömas ut redan innan dom fått en ärlig chans i livet. Men saker och ting är sällan goda eller onda i sin egen rätt, utan allt är beroende användning och sammanhang: Betyg kan faktiskt framstå som en räddare i nöden.

Vid årets stora amerikanska pedagogkonferens AERA hölls en session på temat 100 år av betygsforskning: 100 years of grading research: Meaning and value in the most common educational measure. Seminariet anordnades av några av världens främsta betygsforskare: Susan Brookhart, Thomas Guskey, Alex Bowers, James McMillan, Megan Welsh, Jeffrey och Lisa Smith. Resultatet ska publiceras i en av AERAs topprankade tidskriften inom utbildningsområdet.

Det första som ska sägas är att det ingalunda var en homogen skara forskare som presenterade, även om de enas av sitt intresse för betyg. Det andra att betygsforskning sträcker sig längre tillbaka i tiden än 100 år. Avgränsningen gjordes för att anknyta till AERAs hundraårsfirande.

Anledningen till att USA tidigt övergav betyg till förmån för test var att forskare dömde ut betyg som ett opålitlidgt mått, som ett ”hodgepodge”, ett hopkok. Eller som Swineford uttryckte det 1947: det är uppenbart att betyg är ett tillförlitligt mått på något, vi vet bara inte vad.

IMG_2851

Bild från Bowers föredrag. What is it that grades asses? ”In any event, the data [in this study] clearly show that marks assigned by teachers in this school are reliable measures of something but there is apparently a lack of agreement on just what that something should be. – Swineford (1947)

Brookhart gav i sin presentation exempel på forskning som pekade på otillförlitligheten i betyg redan från 1888 (se bild nedan). Troligtvis finns det ännu tidigare exempel på forskning på otillförlitlighet i lärarsatta betyg. I början av 1900-talet börjar forskare att försöka föreslå vägar framåt och det är då de första förslagen på standardbaserad/kriteriebaserad betygssättning kommer. 

IMG_2846

Edge worth (1888): Three sources of error in grades: chance; personal differences among graders; taking examinee answers as representative of proficiency (generalizing to domain)

IMG_2847

Sources of variation in grades: Criteria; Scale; Task; Students’ work quality; Teacher error. Brookhart listar här tidiga studier som påpekat brister i lärares betygssättning.

IMG_2850

Conclusion: Variability can be greatly reduced: clear criteria; agreement on the weights of each criterion; criteria about learning, not following directions.

Ovan, bilder från Brookharts presentation. Sist hennes slutsatser om vägen framåt mot att stärka betygens tillförlitlighet: tydligare kriterier, ökat samsyn kring viktning av olika kriterier samt att undvika att bedöma annat än sådant som har med lärande att göra. 

Den väg som Brookhart pekar ut för att öka tillförlitlighet och likvärdighet i betyg drar mot mer standardbaserade principer för betygssättning. Det finns dock uppenbara risker i att gå denna väg, i att gå mot att allt mer spela på testernas bedömningsdomän där det är (hyfsat) tydligt vad som bedöms och hur.  Betyg kommer alltid bli slagna av test – ”det kommer fortfarande finnas variation i betygssättningen”, som Brookhart konstaterade.

Det finns dock ett annat sätt att se på betyg kontra test som jag tycker tydligare pekar ut en möjlig väg framåt. De tyngsta och tydligaste argumenten för detta gav Bowers i sin presentation.

Bowers menade att oavsett de framsteg som gjorts när det gäller betygssättningens principer så talar 100 års betygsforskning sitt tydliga språk: korrelationen mellan lärarsatta betyg och test har varit och är fortsatt 0,5 (bild från Bowers presentation nedan. 0,5 = 25 procent gemensam varians).

IMG_2854

Man kan dra olika slutsatser av detta menade Bowers: Ett är att man som betygsförespråkare kastar in handduken till förmån för test. Ett annat att ta fasta på just detta att betyg ger en kompletterande bild av elevers kunskaper och förmågor jämfört med test. Betyg verkar framför allt vara ett bra mått på socioemotionella kunskaper, vilka bättre än testresultat korrelerar med elevens förmåga att lyckas i skolarbete och på arbetsmarknaden. Både betyg och test behövs därför i ett utbildningssystem, menade han.

Both tests and grades are useful but orthogonal measures of what we want out of schooling as students learn cognitive and conative skills (engaged participation). (Bowers, AERA 2016)

Det kan ju som parentes sägas att det finns forskning som pekar på just det, att en kombination av lärarbetyg och test kan ge än bättre information om elevers förmåga att lyckas i sina fortsatta studier jämfört med dessa mått var för sig. Detta talar för att det bästa måttet vid antagning till högre studier skulle vara en kombination, vilket det finns exempel på länder som tillämpar.

Det blev också tydligt under sessionen att den forskning som framför allt intresserar mig och mina kollegor i Sverige, den om hur betyg påverkar undervisning och motivation, lyser med sin frånvaro i den amerikanska betygsdebatten. Och det kan man förstå när alternativet är flervalstest som i USA.

Sammanfattningsvis pekar allt mot att betyg och test båda kommer vara viktiga delar av resultat- och utvärderingssystem i skolan även framöver. Det vi måste lära oss mer om är relationen mellan betyg och test, vilka styrkor dessa båda har och vilken riktning de bör utvecklas för att deras respektive styrkor ska stärkas. Något som bör ske med hänsyn till betyg och test som kompletterande resultatpraktiker, inte uteslutande.

Jag tycker detta sänder en tydlig signal till den svenska betygsdiskussionen: det handlar inte nödvändigtvis om att söka ”tydliga kriterier”, snarare om att lyfta fram och vårda betygens styrkor och fördelar jämfört med test och snarare fokusera på hur man trots betygens brister kan skapa legitimitet i betygssystem. Allt tyder på att Björklunds tjat om ”tydliga kriterier” och den senaste revisionen av vårt betygssystem snarare lett till minskad legitimitet för betyg.

Slutligen, skillnaden mellan kontinenter och traditioner blev än mer uppenbar när forskarparet Smiths kort nämnde Europa och gjorde sig lustiga över det samelsurium av olika betygssystem som finns där. Det ser så olika ut att europerna tvingats införa ett byråkratiskt översättningssystem, ECTS, menade herr Smith och skrattade. För mig som betygsforskare blev det, för att citera förordet i en lärobok i naturvetenskap för barn från 1828, tydligt att “all möda oaktadt, mycket ligger för oss inswept i mörker.” Betygs- och testdebatten lär fortgå.

Linda Darling-Hammond och The “New Accountability” – se hennes keynote från AERA!

De senaste fyra åren har jag försökt följa utvecklingen i USA på skolans område. De första åren var situationen minst sagt pressad. Det hade blivit tydligt för de flesta, från vänster till höger, att No Child Left Behind (NCLB) var en till största delar misslyckad reform, och att den slog hårdast mot de minoritetsgrupper den var utformad för att hjälpa. “No child’s behind left” som reformen även kallas, med parallel dragen till den Katolska kyrkans övergrepp på barn. Obama stod länge bakom reformen och att hans egen “race to the top” 2009 snarare förstärkte än mildrade effekterna av NCLB. Många uttryckte oro inför framtiden.

Idag möts man av hopp när man kommer till USA. “Vindarna har vänt” sa en amerikansk kollega i vintras. Viktiga händelser senaste året har varit att NCLB ersatts av en ny lag, Every Student Succeeds Act (ESSA). Många menar att ESSA innebär ett paradigmskifte när det gäller hur accountabilitysystem på skolans område ska utformas. ESSA har en mycket bredare och därtill mer flexibel ingång till hur skolans resultat ska mätas och följas upp, även om det finns områden som lagen lämnar därhän, såsom den ojämlika resurstilldeldningen: de stater som ger mest per student ger mer än dubbelt jämfört med de som ger minst. Dessa skillnader spär därtill på redan föreliggande ojämlikheter då det är fattiga områden, där skatteintäkterna är låga, som har de lägsta resursnivåerna. Går man ned på skolnivå så kan det skilja så mycket som en faktor tio mellan hur mycket pengar som spenderas per elev!

Hopp är det intryck jag lämnas med efter årets AERA (The American Educational Research Association), en konferens Christian också rapporterade ifrån i ett blogginlägg nyligen. Deras årliga konferens hölls nu i april i Washington D.C. på temat ”Public Scholarship to Educate Diverse Democracies”. Platsen var såklart inte vald av en slump. Medan tidigare års AERA präglats av kritiska och ibland närmast desperata inlägg kring det ökade trycket på mätbarhet och prestation så präglades årets konferens av hopp och blick mot framtiden.

Den som på konferensen fick personifiera den nya inriktning på amerikansk skolpolitik var professor emerita Linda Darling-Hammond. En av de mest inflytelserika personerna på policyområdet inom utbildning i USA. Hon genomförde årets AERA Distinguished Lecture. Titeln på hennes föredrag var “Designing the ‘New Accountability:’ How Public Scholars Can Contribute to a Productive Policy Framework for Education”. I sitt framförande beskrev hon utvecklingen från införandet av NCLB fram till och med ESSA och vad hon ser som en ny typ av accountability, en utveckling till vilken hon själv varit en starkt bidragande faktor.

Det är en av de bättre föreläsningarna inom policyområdet jag lyssnat på, kanske över huvud taget inom utbildningsområdet. Darling-Hammond är en inte bara knivskarp och kraftfull forskare, utan också en forskare som förmår leverera sitt budskap med intelligent och kvick humor. Lyssna på hennes keynote och 13 andra live-streamade föredrag och sessioner som finns fritt tillgängliga via registrering på http://freeman-cloud.com/aera2016/

Det är självklart inte så att det som händer i USA alltid händer här, med fördröjning. Men likheterna är många. NCLBs starka fokus på att få alla elever ”proficient” (godkända), trots att alla indikatorer pekade på det orimliga i detta mått, och kunskapastester som enda godtagbara mått på skolans resultat kan jämföras med sveriges outtröttliga fokus på att få alla elever godkända trots att den årliga utvecklingen visar på orimligheten i detta måldröm (utvecklingen har väl snarast varit den motsatta), samt PISA som den stora sanningen om skolans resultat. Låt Darling-Hammond visa vägen mot en ny skolpolitik. 

OECD och PISA – en guldgruva för skolpolitiker

You never want a serious crisis to go to waste 

Den amerikanske politikern Rahm Emanuel menar att kriser ger politiker mandat att förändra på ett sätt som annars inte varit möjligt. Han vet vad han talar om. ”The US have had six decades of educational reform”, som en amerikansk kollega nyligen sa. Den reformivern hade inte varit möjlig utan rejäla kriser.

Det talas mycket om OECDs ökade inflytande över nationell skolpolitik, mer sällan om att det ömsesidiga beroende som skapats mellan nationell skolpolitik och OECD. De kriser som skapats i kölvattnet av PISA ger politiker möjlighet att visa politisk handlingskraft. Och med tanke på allt OECD önskar Sverige ska göra finns det alltid något som passar den lokala politiska agendan. De båda parterna legitimerar på så sätt varandra. Det är kort sagt win-win!

Krisen inom det allmänna och obligatoriska skolväsendet är nästan lika gamla som skolväsendet självt, vilket vi berört tidigare här på SÖ (Försämringens historia). En intressant belysning av detta ges i en studie av Carol J. Trones, ”A century of educational crisis and reform in the United States”. Studien presenterades vid AERAs årliga konferens i april i år. I sin studie visar Trones hur allmän utbildning blir föremål för medial uppmärksamhet (kris) mot slutet av 1800-talet. Med tiden förstärks och utvecklas den mediala krisbilden av skolan och Trones menar att den till slut börjat leva sitt egna liv. Det har växt fram en medialt konsoliderad bild av krisskolan, en bild som kan verka ganska apart jämfört med den lokala och regionala variation som alltid funnits i skolvärlden.

Men även om skolan befunnit sig i kris i den mediala rapporteringen i olika omgångar och under lång tid har karaktären på kriserna förnyats i takt med samhällsförändringar och i samspel med nya aktörer. Nya teman tillkommer, gamla tolkas om och andra teman försvinner. PISA har givit skolkrisen en ny och fräsch sida, PISA har skapat en kris för 2000-talets politiker och en tid när offentlig sektor mest ses som kostnad och problem. För att nå toppen av PISA krävs inga ökade offentliga utgifter försäkrar OECD, tvärt om, många högpresterande system är billiga.

PISAs upplägg är, som många påpekat, smått genialiskt. I OECDs 185 sidor långa och uppmärksammade rapport Improving Schools in Sweden: An OECD Perspective hittar vi 344 förekomster av ordet prestera (perform*), med som mest 15 förekomster på en sida (sidan 28). Tillsammans med ord som ”top”, ”high” och ”low” och förbättring (”improv*”), ett ord finner man använt 490 gånger i rapporten (ordet nämns på 181 av de 183 sidor som har text i rapporten), skapas ett språk som hämtar inspiration från toppidrott och företagsvärld, teorier som bygger på att alla, vinnare som förlorare, kan utvecklas av jämförelse och rangordning.

Det är upplagt för att skapa ett behov av ständig förbättring och/eller kris och för att skapa politisk legitimitet för förslag inom skolans område. Det finns endast en plats på toppen och alla vill dit. Bilden av krisskolan bidrar dessutom till att legitimera lekmannatyckande inom skolans område och förstärker därmed ytterligare politikernas position. Saknas förtroende för de som utför verksamheten, för lärare och lärarutbildare, öppnas fältet för lycksökare.

Många studentuppsatser som skrivits inom lärarutbildningen de senaste åren har tagit upp PISA i inledning eller bakgrund (och då framför allt den mediala PISA-bilden). Allt är fel, något måste bli bättre. De känner sig hjälplösa. Och som många professioner vars status dalat i allmänhetens ögon så slår de ner på sig själva och sin utbildning, ett självskadebeteende som tar den energi som så väl behövts till annat. Jag ser inget gott i detta. Som lärarutbildare kan jag ibland känna mig beklämd över att många studenter går in i sitt yrke med redan låga huvuden, många känner sig som de förlorare de framställs som.

Vad vi fått, menar Wayne Au, är en förtäckt taylorism för det globaliserade samhället. Ett system som lockar till sig individer med dåligt självförtroende som låter sig styras av privata och statliga aktörer. Ett system som skapat ett politikområde som är alltför viktigt för att lämnas i händerna på en profession.

Wayne Au (2011) Teaching under the new Taylorism: high‐ stakes testing and the standardization of the 21st century curriculum, Journal of Curriculum Studies, 43:1, 25-45

Little Choice But to Cheat – om testkulturens baksidor

George W. Bush styrde Texas innan han blev president. Som guvernör i Texas hade Bush byggt vidare på en lokalt utvecklad modell för skolutveckling. När har 2001 tillträdde posten som president omvandlade han denna till nationell lag genom No Child Left Behind Act. Vid den tidpunkten fanns det inte så mycket tillgänglig forskning på effekterna av denna typ av skolutveckling. De studier som fanns pekade på positiva resultat i Texas. Nu vet vi desto mer.

Det låter så lätt i teorin, som så mycket annat. Om vi kan vända ett företag som går dåligt, varför kan vi då inte vända en skolutveckling som haltar? Vi inför tydliga och hårda krav, vi inför fler tester, vi kräver resultatuppföljning, ständig årlig resultatförbättring och krav på prestationer på individnivå för såväl lärare som elever. Med dessa medel kommer vi inom ett decennium få en skola där alla når målen. Eller?

De förhoppningar som fanns har bara till delar infriats och även negativa effekter har upptäckts. Det verkar som No Child Left Behind Act kan ha haft vissa positiva effekter på elevers matematikkunskaper, men inga på läskunnighet. Men återigen, studierna drar åt olika håll och den riktigt stora frågan kvarstår: Hur beaktar vi alla övriga effekter som reformen haft, de som inte lätt kan mätas i endera förbättrade eller icke förbättrade testresultat? Helt klart är att de resultat No Child Left Behind utlovade inte har infriats. Samtidigt har den inte heller haft fullt så negativa effekter som den ibland anklagats för. En studie visade nyligen att lärares attityder till sitt jobb faktiskt inte försämrats p.g.a. No Child Left Behind Act, se här.

Men även om vi fortfarande inte har svart på vitt på hur pågående reformer som likt No Child Left Behind med fokus på höga krav, fler prov och tester, resultatuppföljning, resultatförbättring, ansvarighet för lärare osv. så återstår frågan: Vad är det för värden och klimat som denna typ av inslag skapar i skolan?

Journalisten Rachel Aviv har i artikeln Wrong Answer: In an era of high-stakes testing, a struggling school made a shocking choice i The New Yorker från i somras givit en gripande skildring av vad som kan hända när trycket på test och ständig förbättring blir för stort, så stort att lärare känner att de inte har annat val än att börja fuska. Det finns en 16 minuters podcast där Aviv intervjuas om sin artikel, Out Loud: Little Choice But to Cheat

Det Amerikanska skolsystemet har i flera avseenden gått längre än det Svenska. Här har mycket av det några av våra skolpolitiker bara drömt om att få införa redan införts: tester från tidiga skolår och kvarhållning/sommarläsning (om man inte når målen). I många delstater i USA kan man sparka lärare vars elever får för dåliga resultat på test. Under Obamas tid som president gjordes en modell för att vända skolor – så kallad School Turnaround –  till nationell policy. Idén hade utvecklats i Chicagos skoldistrikt och var hämtad från företagsvärlden. Den går i korthet ut på att man lägger ner och återstartar skolor som går dåligt och ger dem samtidigt regellättnader för att kunna åstadkomma detta. Effekterna är omtvistade och har i flera fall visat sig katastrofala för enskilda skoldistrikt och för arbetsklimatet på de skolor som ”vänds”.

Som med så mycket inom skolans värld är effekterna ofta kontraintuitiva. Vi som ville så väl… men vad fel det kan bli. Rachel Aviv har som ingen annan journalist tagit sig in i och försökt förstå vad som händer i det utbildningsklimat som utvecklats runt om i världen de senaste decennierna. Detta betyder inte att skolan nödvändigtvis var bättre förr, men nog har vi tappat diskussionen om de större målen och visionerna.

Mer:

Om No Child Left Behind, dess uppgång och fall i Huff post, George W. Bush’s Education Law, No Child Left Behind, Abandoned By Texas.

Artikeln På väg utför med mätbara resultat i Svenska Dagbladet.

Där sportlogiken går in…

Jag var på Skolverket igår för att höra undervisningsrådet Mats Björnsson presentera rapporten Grundskolan i internationella kunskapsmätningar – kunskap, skolmiljö och attityder till lärande. Förutom presentationen kommenterades rapporten av fyra inbjudna representanter för olika perspektiv på skolan: en rektor, en forskare, en utbildningsdirektör och en representant för en oberoende organisation med intresse för skolfrågor samt Skolverkets generaldirektör Anna Ekström (seminariet finns inspelat, här).

Senast Skolverket presenterade en liknande översikt var 2009, Vad påverkar resultaten i svensk skola? Rapporten som presenterades igår bekräftade den bild som gavs i 2009 års rapport samtidigt som den gav en fördjupad och till delar mer nyanserad bild av utvecklingen.

Att svenska elevers kunskapsresultat sjunkit inom områdena matematik, naturvetenskap och läsförståelse relativt andra länder råder det inget tvivel om. Men det verkar enligt Björnsson som att resultaten i årskurs 4 håller bättre jämfört med resultaten i årskurs 8. För de tidigare skolåren finns faktiskt indikationer på att resultaten legat jämt över tid och till och med ökat inom något område. Vad det kunde bero på, om det nu är så, kunde inte Björnsson svara på.

Bilden av klassrumsklimatet i svensk skola var också i huvudsak positiv. Möjligen verkar det blivit stökigare på matematiklektionerna, samtidigt som det är svårt att veta om den förändringen beror på förändrade arbetssätt i matematik (mindre av ensamräkning) eller något annat.

Men trots den till största delar nyanserade bild som gavs av Björnsson var min bestående känsla efter seminariet olust. Det var något som inte stämde. Trots en nyanserad presentation kom diskussionerna i huvudsak att gälla olika aspekter av ”de låga resultaten”. Det var exempelvis tydligt att det bara var en av alla deltagarna på seminariet – kommentatorer, presentatör och åhörare inräknat – som tydligt och om och om igen försökte bredda samtalet. Utan att lyckas.

Det var rektorn för en skola i Stockholmsområdet, en av de fyra inbjudna kommentatorerna. Hennes inlägg framstod som spända, delvis osammanhängande. Det var som om hon upplevde att det var hon och endast hon som av alla i rummet skulle stå till svars för skolans utveckling och att det var hon och endast hon som var den som skulle försvara de mer överordnade grundidéerna i svensk skola och skapa en kompletterande bild av skolan till den bild som kunskapstesterna ger.

En förödande sportlogik har vällt in i skolans värld och kommit att penetrera nästan varje nivå av skodiskussionen. Bjönsson kommenterade just detta inledningsvis, hur de internationella kunskapsmätningarna tydligt fört in metaforer från idrottens värld på skolans område. Han tog exemplet med den Norska utbildningsministerns Kristin Clemets (2001-2005) kommentar av Norges resultat på den första PISA-testen 2001: ”Dette er skuffende, nesten som å komme hjem fra et vinter-OL uten en eneste norsk medalje. Og denne gangen kan vi ikke skylde på at finnene er dopet”.

Varje placering räknas och allt fokus verkar vara på hur vi ska kunna vända utvecklingen så vi äntligen kommer kunna prestera som förut (dvs för svensk del på medelnivå, istället för som nu, strax under medelnivå). 

Jag är glad att den viktigaste representanten vid gårdagens seminarium – representanten för skolväsendet – var den som gav det nyktraste perspektivet på det hela. Som gång på gång vågade lyfta blicken och säga att ”Ja, det är så att vi tappat i de kunskaper som dessa tester mäter, men nej, jag vägrar låta mig styras av detta. Jag tror på en annan skola, med bredare visioner” (inget ordagrant citat, mer tänkt att fånga andemeningen i några av de inlägg rektorn gjorde)

Det är som skoldiskussionen av idag är oförmögen att diskutera och greppa annat än siffror och spel inom ramen för tydliga spelregler. I oändlighet kan vi diskutera hur vi ska kunna ta ut den bästa startelvan till landslaget, så slipper vi allt det komplicerade som finns runtomkring oss, livet i stort och dess mening.

Den bild jag får av skoldiskussionen är den av ett företag som tappat blicken för de mer övergripande visionerna. Tänkt dig följande: En representant för det företag du jobbar vid ska presentera det nya målstyrningssystemet som ska införas. Han inleder med att ge en mycket nyanserad och delvis kritisk bild av systemet. Det mäter inte allt. Det förvånar dig, du känner hopp. Han påpekar att vi måste se nyktert på de resultatmått som många i organisationen redan nu börjat ta till sig och inrikta sin verksamhet mot, annars kan det gå snett för verksamheten i stort. Resultaten säger inget om kvaliteten på verksamheten, säger han. Han tydliggör detta med att på talvan skriva upp: ”Resultat – kvalitet”. Du tänker ”Vad bra, det här företaget gillar jag. De verkar ha en nykter syn på mål- och resultatstyrning”. Men sakteliga förskjuts diskussionen. Nyanserna försvinner och plötsligt märker du hur alla omkring dig, precis alla, enbart diskuterar de där kvantitativa måtten och värdet av att optimera organisationen så att resultaten på dessa mått maximeras. Idén om kvalitet är som bortblåst. Kvar är siffrorna och målet att hamna överst på pallen.

Igår var det en ensam rektor för en skola i Stockholmsregionen som stod upp för ett bredare samtal om skolan. Som visade att en siffra kan vara viktig men likväl inte får tillåtas skymma övertygelsen om och diskussionen av vad en god skola ska vara.