Kan vi stole på bivirkningsdata fra kliniske studier?

De fleste bivirkningsdata det vises til i preparatomtaler og pakningsvedlegg har fremkommet i kliniske studier. Randomiserte, blindede kliniske studier er gullstandarden for å sammenligne to legemidler, men de har en rekke svakheter når det kommer til risikokartlegging. Kliniske studier er først og fremst utformet for å vise og sammenligne effekt, og har ikke tilstrekkelig omfang til å kunne oppdage annet enn de vanligste bivirkningene. Det er ikke uvanlig at et nyregistrert legemiddel trekkes fra markedet fordi det er oppdaget alvorlige bivirkninger først etter markedsføring. Enda flere preparater får begrensninger i bruken på grunn av bivirkninger som oppdages etter markedsføring.

I løpet av en klinisk studie gjøres det løpende vurderinger som har betydning for de bivirkningsdata som kommer ut i den andre enden. Det gjelder antall pasienter, valg av dose, behandlingsvarighet, metode for å kontrollere pasientene og oppdage bivirkninger, vurderinger av årsak til hendelser, koding av diagnose, hva som tas med i sluttrapport og oppsummeringer for å nevne noe. Rådata må nødvendigvis komprimeres for å passe inn i formatet for en tidsskriftartikkel. Dette innebærer at data må tolkes, filtreres og grupperes. Dessverre har det kommet flere eksempler på at denne prosessen ikke alltid er gjort på en god måte.

Et av de mest kjente eksemplene de senere år er en reanalyse av data fra en klinisk studie av imipramin, paroksetin og placebo ved alvorlig depresjon hos ungdom (Studie 329) (1). I den opprinnelige studien fra 2001 (2) var det ved første øyekast gjort godt rede for både overvåkningsmetode og resultater. Forfatterne skrev at paroksetin generelt ble godt tolerert og at de fleste bivirkningene som forekom ikke var alvorlige. Det var også med en tabell over bivirkninger. Det ble etter hvert reist flere spørsmål rundt denne artikkelen. Først i 2015, dvs. 14 år etter, ble det publisert en ny analyse av resultatene. Den nye analysen var basert på originale studiedata, inkludert pasientskjemaer for enkeltpasienter. Forfatterne kom til motsatt konklusjon, nemlig at det var en klinisk signifikant økning av bivirkninger, inkludert selvmordstanker og andre alvorlige bivirkninger i paroksetingruppen, og en økt risiko for kardiovaskulære bivirkninger i imipramingruppen. Det er svært urovekkende at forskjellige analyser av rådata gir så forskjellig resultat og at det kan ta over ti år før sviktende rapportering fra en klinisk studie dokumenteres.

LeNoury og medarbeiderne påpeker flere faktorer som bidro til at bivirkningskartleggingen ble mangelfull i studie 329. Det er verdt å merke seg disse, fordi de også kan forekomme i andre dokumenter og studier:

  • Når en pasient forteller om en mulig bivirkning, eller registrerer det på et spørreskjema, brukes ikke medisinske ord. Noen andre må oversette pasientens beskrivelse til riktig medisinsk term og overføre hendelsen til databaser. Det viste seg at ikke alle hendelsene var kodet om til medisinske termer, i noen tilfeller fordi pasienten hadde gått ut av studien på grunn av bivirkninger.

  • Valg av medisinsk term kan også føre til feil eller tåkelegging. Det var eksempler på at selvmordstanker i noen tilfeller var registrert som emosjonell labilitet.

  • Et sentralt spørsmål er hvem som vurderer om en negativ hendelse har sammenheng med legemiddelbruken eller ikke. I studie 329 var det den som hadde ansvaret for studien som besluttet om årsakssammenhengen var relatert, eller ikke relatert, til behandlingen. Ved den nye gjennomgangen ble det påvist elleve alvorlige bivirkninger i paroksetingruppen, men bare én av disse var opprinnelig vurdert som relatert til behandlingen. Dette hadde konsekvenser for hva som ble rapportert videre.

  • I den opprinnelige publikasjonen var det, som tidligere nevnt, en tabell over bivirkninger. Det betyr ikke at tabellen beskrev samtlige bivirkninger som var sett i studien. Tabellen omfattet kun bivirkninger som var sett hos minst fem prosent av pasientene. Det innebærer at selv vanlige bivirkninger, som etter definisjonen forekommer hos over en prosent av pasientene, ikke var tatt med.

Det er ikke sikkert at den første publikasjonen av studieresultater inneholder det endelige datasettet og de korrekte tallene for bivirkninger. I en studie av dabigatran og warfarin til pasienter med atrieflimmer (RE-LY-studien) ble resultatene, inkludert bivirkningsdata, publisert i 2009 (3). Året etter kom en ny artikkel som beskrev flere bivirkningshendelser og forfatterne skrev at dette ble oppdaget ved endelig lukking av pasientdatabasen (4). Tittelen på denne tilleggsartikkelen var: «Newly identified events in the RE-LY trial». Fem år etter den første publikasjonen kom det ytterligere et tillegg med tittelen «Additional events in the RE-LY trial» (5). Da var det foretatt en re-evaluering av alle dødsfallene i studien der det ble identifisert ytterligere tilfeller av alvorlige blødninger eller slag.

Moralen er dessverre at bivirkningsoversikter ofte må tas med en klype salt, og at det lønner seg å kunne lese den lille skriften.

Referanser

  1. Le Noury J, Nardo JM, et al. Restoring Study 329: efficacy and harms of paroxetine and imipramine in treatment of major depression in adolescence. BMJ 2015; 351:h4320. doi: 10.1136/bmj.h4320

  2. Keller MB, Ryan ND, et al. Efficacy of paroxetine in the treatment of adolescent major depression: A randomized, controller trial. J Am Acad Child Adolesc Psychiatr 2001; 40(7): 762–72.

  3. Connolly SJ, Ezekowitz MD, et al. Dabigatran versus warfarin in patients with atrial fibrillation. N Engl J Med 2009;361(12): 1139–51.

  4. Connolly SJ, Ezekowitz MD, et al. Newly identified events in the RE-LY trial. N Engl J Med 2010; 363(19): 1875–6.

  5. Connolly SJ, Wallentin L, Yusuf S. Additional events in the RE-LY trial. N Engl J Med 2014: 371(15): 1464–5.