Innan man är van och har lärt sig en viss jargong eller de
ämnesspecifika ord som används inom ett område kan just dessa ämnesspecifika
ord ställa till med problem i förståelsen. Vissa ämnesspecifika ord används i
mitt tycke utan att de egentligen tillför mycket annat till ämnet än en
"air" av seriositet. Medan andra termer är centrala för ämnet och
kunskapsutvecklingen.
Två termer som är mycket centrala i det vetenskapliga hantverket
men dessvärre bringar en del oreda i tänkandet (i alla fall hos mig) på grund
av hur de förklaras i den vanligt förekommande metodlitteraturen är reliabilitet
och validitet.
Egentligen borde det inte vara så komplicerat. Om man utgår från
det engelska originalet så blir det som start ganska tydligt:
Reliable = tillförlitlig, vederhäftig, beprövad, pålitlig.
Valid = giltig, legitim.
Reliable = tillförlitlig, vederhäftig, beprövad, pålitlig.
Valid = giltig, legitim.
Men: Att tillförlitligt och giltig är ord som ligger
ganska nära varandra i betydelse gör i och för sig att man kan börja ana att
det hela kanske kan bli mindre tydligt än vad det först verkar.
Och om man sedan i sitt sökande på nätet råkar hamna till exempel på
Mälardalens högskolas sidor för metod[1] så hittar man där inte
mindre än 9 typer av validitet (inre, yttre, intern, extern, begrepps-,
kriterie-, construct, användar- och kommunikativ validitet). Sidans förklaringar
är korta men riktigt bra så det är inte problemet men jag lutar nog ändå åt att
man blir mer förvirrad är hjälpt av att samma term kan få så många olika
betydelser. Det vore i mitt tycke bättre om man kan använda andra termer i
flera av dessa fall så att möjligheten till missförstånd minskar.
Nå. Här följer i alla fall ett lite kortare försök till grundläggande
förklaring av de lyckliga tu:
Både reliabilitet och validitet är termer som syftat till att
bedöma kvaliteten på den empiri som är tänkt att användas i en undersökning.
Tänk dig att du ska undersöka ett ämne, det kan vara vilka redskap som var
vanliga i bondehushållen i Bohuslän på 1600-talet eller hur konsumtionen av
sociala medier påverkar pensionärers psykosociala hälsa. Oavsett vilket ditt
ämne än är så kommer du behöva ta ställning till vilket material, vilken
empiri, som du skulle vilja använda för att försöka besvara dina frågor och
därefter försöka avgöra kvaliteten på detta material.
I fallet med de Bohuslänska böndernas redskap så kanske materialet/empirin är självskriven på grund av att det bara finns ett material att tillgå - som till exempel en samling bouppteckningar som någon nitisk lokal makthavare sammanställt och som bevarats genom århundradena.
I fallet med de Bohuslänska böndernas redskap så kanske materialet/empirin är självskriven på grund av att det bara finns ett material att tillgå - som till exempel en samling bouppteckningar som någon nitisk lokal makthavare sammanställt och som bevarats genom århundradena.
Nu måste du fråga dig om du kan använda detta material för att få
svar på dina frågor: går materialet att lita på, vilken är dess reliabilitet?
För olika ämnesområden finns olika standarder för att bedöma detta. Inom
historiska studier vill man gärna använda källkritiska metoder för att bedöma
just hur pass trovärdigt materialet/empirin är. Består empirin av intervjuer
med pensionärer så måste man fråga sig just hur trovärdiga intervjusvaren är.
Finns det anledning att tro att de intervjuade rakt av ljugit eller att de
förskönat, ändrat eller glömt bort viktiga delar och att därför de svar man har
fått inte riktigt går att lita på?
Validitet
brukar användas främst i studier där man mäter någonting, som tillexempel folkhälsa
eller kunskap om ett ämne. Om vi ska mäta kunskapen om ett ämne så vill vi
troligen att vår adept ska visa upp denna kunskap. Men hur ska kunskapen visas
upp? Ska vi ha någon typ av prov kanske? Och om vi bestämmer oss för att vi ska
använda ett skriftligt prov då måste vi sedan fråga oss om svaren som vi får
verkligen avspeglar adeptens kunskaper – är vår mätning giltig/valid? Kommer vi
fram till att mätningen har god validitet (mätningen avspeglar faktiskt det vi
vill mäta) då kan vi gå vidare och fråga oss om adepten kanske har fuskat eller
på annat sätt förvrängt svaren – är mätningen trovärdig/har den god
reliabilitet?
I ett annat sammanhang ser detta något annorlunda ut även om principen är den samma. Säg till exempel att vi vill mäta förväntad livslängd med bibehållen god hälsa hos en grupp. Här kan man ju lätt tänka sig ett otal variabler att undersöka; kostvanor, vanor kring rökning och andra missbruk, rörelsemönster, stress i vardagen eller på jobbet, socialt stöd, familjeförhållanden, uppväxtvillkor, utsatthet för miljögifter eller olycksrisker, etc. Om vi vill göra vår undersökning måste vi först bestämma oss för vilka parametrar vi vill undersöka och sedan för hur vi ska samla in denna information. Säg att vi vill se på kostvanor och att vi inte har så mycket pengar till vårt förfogande. Då kanske valet av metod för att samla in vårt material faller på någon typ av enkät där vi ber personerna redogöra för sina kostvanor och så genomför vi denna enkät tre gånger under en period på sex år.
I ett annat sammanhang ser detta något annorlunda ut även om principen är den samma. Säg till exempel att vi vill mäta förväntad livslängd med bibehållen god hälsa hos en grupp. Här kan man ju lätt tänka sig ett otal variabler att undersöka; kostvanor, vanor kring rökning och andra missbruk, rörelsemönster, stress i vardagen eller på jobbet, socialt stöd, familjeförhållanden, uppväxtvillkor, utsatthet för miljögifter eller olycksrisker, etc. Om vi vill göra vår undersökning måste vi först bestämma oss för vilka parametrar vi vill undersöka och sedan för hur vi ska samla in denna information. Säg att vi vill se på kostvanor och att vi inte har så mycket pengar till vårt förfogande. Då kanske valet av metod för att samla in vårt material faller på någon typ av enkät där vi ber personerna redogöra för sina kostvanor och så genomför vi denna enkät tre gånger under en period på sex år.
Möjligheterna att denna studie ska leda till tämligen tunna resultat
är många; Kostvanor säger inte allt om personernas hälsa men hur ska vi avgöra
hur mycket? Hur vet vi att de svar som anges är sanningsenliga? Vet vi hur
svaren (om de nu kan antas stämma) ska tolkas? Hur stort blir bortfallet av
svaranden? …
Att validiteten, och reliabiliteten, i denna studie behöver kontrolleras noggrant tycks tämligen klart.
Att validiteten, och reliabiliteten, i denna studie behöver kontrolleras noggrant tycks tämligen klart.
I en mer avgränsad studie, låt oss säga hur antalet konsumerade
portioner fet fisk påverkar någon hälsoparameter, blir frågan om validitet och
reliabilitet i princip inte aktuell så länge mätningen av antalet portioner och
den valda hälsoparametern sker med noggrannhet. Det som blir viktigt att
fundera på är de slutsatser som kan dras och eventuella generaliseringar som kan
göras av de fakta man kan konstatera.
Empirins validitet och reliabilitet måste, så vitt jag kan se,
bedömas inom alla ämnen. Är empirin på något vis falsk eller missvisande så kan
man ju inte använda denna till att dra några slutsatser alls om verkligheten. Men
hur dessa frågor ska hanteras är olika för olika områden och olika typer av
studier.
Eftersom dessa termer är dåligt definierade, eller kanske snarare används
så att de får täcka diverse olika begrepp, så är detta försök till förklaring
långt från heltäckande. Men mitt förslag är att Du om du tar del av en studie,
eller genomför en själv, tar frågorna kring trovärdighet och tillförlitlighet
på allvar och noga undersöker ditt material eller hur den studie du läser
hanterar dessa frågor. Men hur det görs inom olika områden är olika och därför
gäller inte samma hållpunkter för en historisk studie, som en medicinsk, en
sociologisk eller en inom ekonomi eller teknik.
Glasklart?!
Inga kommentarer:
Skicka en kommentar