A Minority Report

In 2002 maakte Steven Spielberg de film Minority Report. Het is een science fiction film, die op een indringende manier laat zien wat er kan gebeuren als we denken dat we met behulp van wetenschap de toekomst kunnen voorspellen, ook als de bedoelingen goed zijn.

In 2054 is er een speciale eenheid van de polite in Washington D.C, “Pre-Crime” genaamd, die als doel heeft toekomstige moordenaars te arresteren voordat ze deze moord plegen en deze zonder een vorm van proces in een permanente slaapstatus te brengen. Pre-Crime baseert zich hierbij op de visioenen van drie genetisch gemodificeerde mediums, “precogs” genaamd, die foutloos de toekomst kunnen voorspellen. De precogs drijven hun hele leven in een bad. Zodra ze een visioen krijgen over een moord, geven ze de namen door van toekomstige dader en slachtoffer, de tijd waarop het gebeurt en beelden van de misdaad. In 2054 bevindt deze eenheid zich aan het eind van de proeffase, waarna besloten wordt of het systeem doorgaat en landelijk wordt ingevoerd. Tot nu toe lijkt de proef geslaagd: dankzij Pre-Crime is er in zes jaar tijd geen enkele moord gepleegd in Washington. Maar het is niet onomstotelijk te bewijzen dat de gearresteerden ook daadwerkelijk schuldig zijn, aangezien ze worden veroordeeld voor een misdaad die niet begaan is.

Als de hoofdrolspeler ontdekt dat de precogs hem hebben aangewezen als een toekomstige moordenaar, die binnen 36 uur een man zal vermoorden die hij nooit heeft ontmoet, slaat hij op de vlucht voor zijn collega’s en probeert hij achter de identiteit te komen van zijn toekomstige slachtoffer en de reden waarom hij is aangewezen als de moordenaar. Uiteindelijk ontvoert hij een van de precogs en ontdekt hij dat hij er mogelijk is ingeluisd door mensen binnen zijn eigen team. Ook ontdekt hij het bestaan van het “minority report”. De drie precogs zijn het niet altijd met elkaar eens. Het “minority report” is de afwijkende mening van één precog, die door het proces wordt uitgefilterd.

Bij het zien van deze film zag ik grote overeenkomsten met de manier waarop we in het hier en nu gebruik maken van risicotaxatiemethoden in de forensische psychiatrie en psychologie, met name rond het opleggen, verlengen en/of beëindigen van de tbs. Rond dit thema stelde ik me zelf de volgende vragen.

1. Zijn wij ons bewust van de zeer beperkte voorspellende waarde van risicotaxatie?

2. Hoe moeten we hiermee omgaan bij rapportages?

Ad 1. Risicotaxatie heeft een beperkte voorspellende waarde.

Een ideaal instrument (gouden standaard) heeft 100% sensitiviteit en 100% specificiteit. Dat wil zeggen: bij een positieve testuitslag weet je zeker dat iemand opnieuw een delict gaat plegen en bij een negatieve test weet je zeker dat dit niet gebeurt. Dit is, zelfs in science fiction films, een utopie. In werkelijkheid is het zo, dat als je kiest voor een hoge sensitiviteit, omdat je ieder risico op recidieven wil uitsluiten, je hiermee ook een hoog risico risico op vals positieve uitslagen incalculeert.

We zoeken naar een instrument met zo veel mogelijk ware positieven en zo weinig mogelijk vals positieven. De maat voor de verhouding tussen de ware en de vals positieven is de AUC (area under the curve). Het gaat te ver voor deze blog om de precieze betekenis van deze maat uit te leggen, maar cijfermatig zijn er wel ijkpunten voor deze maat. Bij een AUC van 0,5 is de voorspellende waarde van een instrument gelijk aan het toeval. Bij een AUC van 1,0 is de voorspellende waarde perfect

Hoe goed zijn risicotaxatie instrumenten nu eigenlijk? De meeste instrumenten hebben een AUC rond de 0,8. Dat wil zeggen dat de voorspelling 1,6 maal beter is dan het toeval. Dat is niet bepaald indrukwekkend.

In een overzichtsartikel in het British Medical Journal van 2012 wordt een meta-analyse beschreven van de resultaten van een groot aantal studies naar diverse veel gebruikte risicotaxatie instrumenten (Fazel e.a., 2012). Wetenschappers uit 15 landen hebben er aan meegewerkt en de studie behelst vele tienduizenden zaken. De resultaten van dit onderzoek zijn verontrustend. Bij onderzoek naar recidivisten, bij wie tevoren een voorspelling was gedaan, bleek dat in 92 % van de gevallen het risico als matig of hoog was ingeschat. Dit klinkt goed. Bij niet recidivisten was het risico maar in 36% ingeschat als laag (dus bij 74% als matig-hoog). Dat is een stuk minder gunstig.

Als je andersom kijkt wordt het nog duidelijker: Bij mensen die ingeschat werden als hoog risico recidiveerde slechts 41% met een geweldsdelict. Voor seksueel delinquenten slechts 23%. Hoog risico is dus slecht te voorspellen. Het “number needed to detain” is voor geweldsdelicten daarmee 2 en voor seksuele delicten zelfs 5! Dit wil zeggen dat je om 1 geweldsdelict te voorkomen 2 mensen moet vasthouden en om 1 zedendelict te voorkomen 5 mensen moet vasthouden.

Mensen die werden ingeschat als een laag risico recidiveerden slechts in 9%. Laag risico is dus goed te voorspellen. Het “number safely discharged” is 10. Als je 10 mensen met een als laag ingeschat risico vrijlaat, dan zal er 1 recidiveren.

Fazel komt op basis van zijn meta-analyse tot de volgende conclusies: risicotaxatie is geen evidence based wetenschap. De instrumenten zijn niet geschikt om op individueel niveau uitspraken te doen over een criminele prognose. Dit geldt voor geweldsdelicten in het algemeen, maar nog meer voor seksuele delicten. De instrumenten zijn wel geschikt voor ruwe inschattingen op groepsniveau, om laag risico gevallen uit te filteren en om risicomanagement plannen op te baseren.

Ad 2. Wat heeft het voorgaande voor consequenties voor de rapportagepraktijk?

A. Opleggingsrapportages.

Het is zinvol om met behulp van een gestandaardiseerd risicotaxatie-instrument de verschillende risicofactoren in beeld te brengen (zie ook de NVvP richtlijn voor psychiaters). Voordeel is dat geen risicofactoren over het hoofd worden gezien. Vervolgens worden de diverse factoren in hun onderlinge samenhang gewogen. De laag risicozaken kunnen uitgefilterd worden, waarbij ook rekening wordt gehouden met de base rates van de verschillende delicten. Voor de huidige indeling in hoog-gemiddeld-laag risico bestaat onvoldoende wetenschappelijke onderbouwing. De term risicotaxatie zou vervangen moeten worden door kwalitatieve risico analyse, omdat risicotaxatie suggereert dat een en ander in maat en getal uit te drukken is, wat niet het geval is. Op basis van de risico analyse kan een risicomanagement plan opgesteld worden, waarin beschreven wordt hoe de kans op nieuwe delicten in de toekomst verkleind kan worden. Hierbij moet rekening worden gehouden met zaken als responsiviteit en benodigd beveiligingsniveau. Bij het opstellen van een risicomanagement plan is een goede delictanalyse van belang. Overigens is voor het in kaart brengen van de risicofactoren een uitgebreid face tot face onderzoek niet altijd noodzakelijk. Het kan dus ook bij weigerende verdachten. Laag risico is goed uit te filteren met actuariële methodes.

B. Maatregelrapportages

De tbs-maatregel wordt in principe afgegeven voor de duur van 2 jaar bij personen die een ernstig delict hebben geplaagd, bij wie sprake is van een psychische stoornis en van een relatie tussen deze stoornis en het delict en bij wie verwacht wordt dat de kans op herhaling van ernstige delicten groot is. Iedere 2 jaar moet de rechter oordelen of voortzetting van de tbs noodzakelijk is. De rechter laat zich daarbij adviseren door rapportages van de kliniek en na 6 jaar ook van 2 onafhankelijke deskundigen. Om de maatregel te verlengen moet aan twee voorwaarden worden voldaan: er moet nog steeds sprake zijn van een stoornis en het gevaar moet zodanig zijn dat het opheffen van de tbs niet verantwoord is.

Het vaststellen van een stoornis is bij mensen die al lang zijn opgenomen in een klinische setting niet altijd eenvoudig, met name bij persoonlijkheidsproblematiek. Er is een groot grijs gebied tussen gezond en gestoord. Het meer gebruik maken van dimensionele diagnostiek zal hopelijk in de toekomst meer rechtdoen aan de werkelijkheid op dit gebied. Het gaat te ver om hier nu verder op in te gaan.

Bij het inschatten van het risico gaat bij deze rapportages veel mis. In de meeste gevallen wordt het risico bij opheffing van de tbs als onverantwoord hoog gezien. De onderbouwing van deze inschatting is vaak erg mager. Veelal zorgen onveranderbare historische risicofactoren voor een hoog basisrisico, dat door behandeling niet te verminderen is. Uit onderzoek komt naar voren dat veranderbare klinische risicofactoren (persoonlijkheidsstoornis, middelengebruik e.d.) minder gewicht inde schaal leggen bij een inschatting. Situationele/toekomst factoren spelen pas aan het inde van de maatregel een rol. TBS-ers krijgen vaak het nadeel van de twijfel: laten we nog maar met 1 of twee jaar verlengen, als we niet helemaal zeker denken te weten dat het wel goed zit. Dit zijn grotendeels politiek gemotiveerde keuzes: één tbs-er die tijdens de behandeling de fout in gaat wordt als veel erger gezien dan vele tbs-ers die veel te lang vast blijven zitten. Met onze onvoldoende onderbouwde risicotaxaties werken we daar aan mee. We kiezen daarmee impliciet voor beveiliging van de maatschappij ten koste van de individuele vrijheid van (vaak kwetsbare) personen. Psychiaters en psychologen kunnen duidelijk maken dat ze toekomstig (gewelddadig) gedrag niet goed kunnen voorspellen. Dat ze wel risicofactoren in beeld kunnen brengen, behandelbaarheid kunnen inschatten en iets kunnen zeggen over een vereist beveiligingsniveau. Meer dan dat adviseren levert de prangende gewetensvraag voor de beroepsgroep op of die grensoverschrijding moreel, ethisch en normatief verantwoord is.

Wim Canton
Psychiater

Literatuur:
Fazel, S., Singh, J., Doll, H., Grann, M. (2012). Use of risk assessment in instruments to predict violence and antisocial behoavoiour in 73 samples involving 24827 people: systematic review and meta-analysis. British Medical Journal 2012; 345