Levende kart over covid-19-forskning

Behovet for rask tilgang til pålitelig kunnskap om et nytt virus og en ny klinisk tilstand har utfordret de tradisjonelle, vitenskapelige publiseringsformene under koronapandemien. Folkehelseinstituttet har etablert et eget prosjekt for å samle og kategorisere forskning om covid-19 til hjelp for beslutningstakere og produsenter av systematiske oversikter.

Illustrasjonsfoto: Colourbox

Koronapandemien har hatt enorme konsekvenser utover sykelighet og dødelighet. De dramatiske smitteverntiltakene førte til sosial isolasjon for mange, og økonomisk tap for enda flere. Slik ble vi minnet om hvilken trussel smittsomme sykdommer fortsatt utgjør.

Samtidig mobiliserte pandemien innovasjon og omstillingsevne på alle områder. Samfunnet ble digitalisert på rekordtid. Kritiske samfunnsaktiviteter ble opprettholdt med tekniske hjelpemidler. Informasjonsteknologi gjorde det mulig for mange å arbeide hjemmefra. I løpet av kort tid ble det fjernundervisning i skoler og universiteter. Bruken av videokonsultasjoner, telemedisin og nettbaserte tjenester økte i helsetjenesten. Også medisinsk forskning og forskningsformidling endret seg.

Koronakunnskap i alle kanaler

Et nytt virus, SARS-CoV-2, med ukjente egenskaper, og en ny klinisk tilstand, covid-19, som spredte seg over hele verden, skapte et akutt kunnskapsbehov. Store forskningsprosjekter, særlig på vaksineutvikling og legemiddelbehandling, ble etablert, og betydelige midler ble investert både nasjonalt og internasjonalt.

Beretninger om covid-19 preget alle nettbaserte medier etter at det første tilfellet ble rapportert i Wuhan, Kina, i slutten av desember 2019. Den 11. mars 2020, dagen da Verdens helseorganisasjon erklærte covid-19 som en pandemi, ble det registrert 20 millioner koronarelaterte termer på sosiale medier i løpet av 24 timer. Koronavirus toppet de globale google-søkene (1).

Med internett er grensen mellom allmennmedier og faglige formidlingskanaler delvis utvisket. Det meste som ble publisert gjennom vinteren og våren 2020, var i alle medier meningsytringer og anekdoter. Men antall vitenskapelige artikler av ulik karakter økte. Vitenskapelige tidsskrifter forserte håndteringen av manuskripter om koronavirus og covid-19 med hurtig fagfellevurdering og publisering (fast track). Veletablerte tidsskrifter, for eksempel The Lancet, opprettet egne nettsteder for koronalitteratur med fri tilgang (open access) (2).

Blant 1703 koronaartikler i PubMed og Embase de tre første måneder i 2020 var de fleste kommentarer og lederartikler uten egne data. Kun 550 artikler oppfylte kriteriene for videre analyse, og av disse var 117 kasuistikker. Asiatiske forfattere dominerte, og 323 artikler kom fra Kina (3). I april 2020 økte antall covid-19-artikler i PubMed kraftig og har fra mai ligget på over 2000 nye artikler hver uke (se figur 1 under).

Figur 1. Antall covid-19-publikasjoner i PubMed uke for uke gjennom første halvår 2020.

Mange artikler om covid-19 ble publisert uten ordinær kvalitetsvurdering, gjerne som såkalt «preprint», uten ekstern fagfellevurdering (peer review), og ble heller ikke indeksert i de tradisjonelle litteraturdatabasene. I april publiserte medRxiv mellom 50 og 100 SARS-CoV-2-relaterte artikler daglig (4). De største, åpne plattformer for medisinsk forskning, medRxiv and bioRxiv, hadde til sammen 5912 preprint-artikler om SARS-CoV-2 og covid-19 ved utgangen av juni 2020.

Behov for systematiske oversikter

Mengden artikler om covid-19 eksploderte våren 2020. I mai ble det anslått at mer enn 23 000 artikler var publisert siden nyttår og at antallet ble doblet hver 20. dag – den raskeste økningen i vitenskapelig publisering noensinne (5). Et uoversiktlig mangfold av publikasjoner og små studier av vekslende kvalitet gjorde det vanskelig å fatte kunnskapsbaserte beslutninger, både om håndtering av pandemien i stort og om behandling av enkeltpasienter.

Enklere ble det ikke av at selv de mest velrenommerte medisinske tidsskrifter som Annals of Internal Medicine (6), The New England Journal of Medicine (7) og The Lancet (8) måtte trekke tilbake tidligere publiserte covid-19-artikler.

Kritisk vurdering av enkeltartikler var åpenbart nødvendig. Dessuten måtte det som fantes av dokumentasjon om en problemstilling samles og syntetiseres. Løsningen ble systematiske oversikter (systematic reviews). Utviklingen avspeiles i databaser over planlagte kunnskapsoppsummeringer, for eksempel PROSPERO, som forvaltes av Centre for Reviews and Dissemination, University of York, Storbritannia. Forskere fra hele verden oppfordres til å publisere sine protokoller for systematiske oversikter her blant annet for å unngå dupliseringer. Før mars 2020 var kun to systematiske oversikter om covid-19 registrert i PROSPERO, men i løpet av den måneden tilkom 80 flere. I april økte antallet til 661 pågående oppsummeringer. Halvparten av disse handlet om prevalens, risikofaktorer, kliniske karakteristika og prognose, mens en tredel handlet om ulike behandlingsmetoder av infiserte pasienter, som legemidler og intensivbehandling. Ved utgangen av juni 2020 var antall registrerte systematiske oversikter om covid-19 i PROSPERO ytterlige fordoblet til 1464.

Produksjonen av en systematisk oversikt er vanligvis tidkrevende og kan ta flere måneder fra utforming av problemstilling med litteratursøk, via analyser og sammenstilling, til skriving og publisering. I en akutt situasjon må imidlertid beslutninger fattes kontinuerlig og uten forsinkelse. Med utgangspunkt i fagmiljøet fra det tidligere Nasjonalt kunnskapssenter for helsetjenesten, nå en del av Folkehelseinstituttet, ble det etablert et team for utarbeidelse av hurtigoppsummeringer (rapid reviews). Målet var å produsere oppsummeringer i løpet av noen få dager til bruk for beslutningstakere, og med forbehold om at slike oppsummeringer må oppdateres etter kort tid (9). Den første oppsummeringen om risiko for luftbåren smitte ble publisert allerede 23. mars 2020, og senere er et tosifret antall oppsummeringer og oppdateringer publisert (10).

Kart over covid-19-forskning

Samtidig ble det etablert et prosjekt for å samle og systematisere forskning om covid-19 til bruk så vel for kunnskapsoppsummerere som for beslutningstakere og andre som vil orientere seg i forskningslitteraturen.

Ambisjonene var store. Målet var å lage et systematisk og levende, dvs. hyppig oppdatert, kart som gir en oversikt over tilgjengelige vitenskapelige publikasjoner om covid-19 (11).

Figur 2. De utvalgte artiklene presenteres i en tabell der de ulike emner framgår av tabellhodet og befolkningsgruppene angis i forspalten. De ulike publikasjonstyper for hver kombinasjon er angitt som fargelagte bobler der størrelsen på boblen viser det relative antallet av hver publikasjonstype.

Litteratursøk

Planen var opprinnelig å gjøre egne litteratursøk i PubMed, Embase og andre relevante databaser daglig eller annenhver dag. Det viste seg raskt at mange utenlandske organisasjoner og institusjoner utførte tilsvarende søk regelmessig. Centers for Disease Control and Prevention (CDC) utfører alle hverdager omfattende søk i mer enn 20 databaser, og deres COVID-19 Research Articles Downloadable Database ble hovedkilden for vårt prosjekt de første månedene.

Fra begynnelsen samarbeidet vi med EPPI-Centre, The Evidence for Policy and Practice Information and Coordinating Center, som er en del av den samfunnsvitenskapelige forskningsenheten ved Institute of Education, University of London. Fra juni 2020 ble litteratursøket om covid-19 som EPPI-Centre utfører ukentlig, også kilden for oss, blant annet fordi vi da kan motta lister over ferdig screenede artikler. Vi supplerer disse funnene med egne søk i SCOPUS.

Innholdet i treffene fra disse litteratursøkene blir gjennomgått, og publikasjoner med egne, empiriske data, systematiske oversikter og modelleringsstudier blir utvalgt for inklusjon i kartet. Pre-print publikasjoner blir foreløpig ikke inkludert.

Kategorisering

Det mest omfattende arbeidet består i å kategorisere og kode de utvalgte artiklene langs tre akser: emne, populasjon og publikasjonstype.

Den mest detaljerte kategoriseringen skjer etter hvilket emne artikkelen omhandler. Ikke mindre enn 92 ulike emnekoder finnes. Disse er fordelt på sju emnegrupper:

  • Prevalens og insidens

  • Etiologi

  • Diagnose

  • Infeksjonsforebygging og -kontroll

  • Intervensjoner for å behandle infiserte pasienter (farmakologisk og ikke-farmakologisk)

  • Prognose

  • Erfaringer og oppfatning, sosiale, politiske, økonomiske aspekter

Med unntak for prevalens og insidens, produseres det egne kart for hver enkelt av disse emnegruppene

De færreste studier er avgrenset til en bestemt befolknings- eller pasientgruppe. Men der det er aktuelt, spesifiserer kartet 42 ulike populasjoner fordelt på seks grupper:

  • Covid-19-status

  • Helsetilstand

  • Alder

  • Yrke

  • Kjønn

  • Sosial og økonomisk setting

Publikasjonstype angir ulike studiedesign og -typer. I alt 19 ulike publikasjonskoder finnes, f.eks. systematiske oversikter, ikke-systematiske oversikter, randomiserte kontrollerte studier (RCT), ikke randomiserte studier med kontroll, kvalitative studier etc.

Organisering

Prosjektet startet med en intern kjernegruppe på fire personer, men ble raskt utvidet. Antall publikasjoner som skulle kategoriseres oversteg kapasiteten, og flere kodere ble rekruttert både internt i Folkehelseinstituttet og eksternt. Etter en internasjonal invitasjon til samarbeid meldte det seg en rekke organisasjoner og enkeltpersoner som bidrar med kodingen på deltid.

Fram til juni ble hver artikkel vurdert av to personer, og eventuelle diskrepanser i kategoriseringen ble avklart i såkalte avstemmingsmøter (reconciling). All kommunikasjon mellom koderne skjedde elektronisk, og arbeidet foregikk og foregår fortsatt i all hovedsak hjemmefra som mye annet arbeid under koronapandemien.

Automatiserte systemer, maskinlæring, ble så tatt i bruk for å effektivisere kodingen. Maskinlæring er en type kunstig intelligens der et program «lærer» å identifisere mønstre i data, for eksempel en vitenskapelig artikkel, med minimal menneskelig intervensjon. Vi tester nå et system der en datamaskin fungerer som den ene koderen, og våre erfarne kodere som den andre koderen, i stedet for å ha to menneskelige kodere. Det kan doble kodingskapasiteten. Jo flere studier som kodes, jo mer data kan vi mate inn i datamaskinen, og jo bedre blir modellene.

Presentasjon

De utvalgte og kategoriserte artiklene presenteres ved hjelp av en programvare som er utviklet av EPPI-Centre og som bygger på en matrisemodell. Kartet (se figur 2 under) er en tabell der de ulike emner presenteres i (vertikale) kolonner og populasjoner i (horisontale) rader. Ved å kombinere et ønsket emne og en populasjon finner brukeren en celle der ulike publikasjonstyper er angitt som fargelagte bobler. Størrelsen på boblen viser det relative antallet av hver publikasjonstype. Grønt indikerer systematiske oversikter, rødt indikerer randomiserte kontrollerte studier og tilsvarende artikler, mens blått er en samlekategori av andre artikler. Publikasjonstype kan også velges ved å bruke filtreringsfunksjonen som finnes under ruten «Filters» øverst til venstre i skjermbildet.

Når man klikker på den valgte cellen, får man opp en alfabetisk liste over alle referanser som svarer til de kategorier som er spesifisert. Under sammendraget av artikkelen finnes forfatterne, hvor artikkelen er publisert (tidsskriftnavn), samt URL (Uniform Resource Locator, lenken til den aktuelle nettsiden), og DOI (Digital Object Identifier, den unike bibliografiske nettadressen) for hver artikkel.

Alt innhold presenteres på engelsk med tanke på en internasjonal brukergruppe. Det gjelder også prosjektets nyhetsbrev som publiseres regelmessig og er tilgjengelig via prosjektets hjemmeside (https://www.fhi.no/en/qk/systematic-reviews-hta/map/). Allerede en måned etter lanseringen 4. april hadde halvpartene av kartbrukerne IP-adresser utenfor Norge, og 82 ulike nasjoner var representert blant brukerne.

Illustrasjonsfoto: Colourbox

Hva inneholder kartet?

Ved inngangen til august 2020, fire måneder etter lansering, inneholder kartet 6513 publikasjoner som er kategorisert etter emne, populasjon og publikasjonstype. Sammen med EPPI Centre har vi screenet 29 317 referanser som er funnet gjennom våre søk, men det er vanskelig å holde tritt med publiseringsaktiviteten. Kartet inneholder alle systematiske oversikter, metodevurderinger, randomiserte kontrollerte studier (RCTer), ikke-randomiserte studier med kontrollgruppe og metodeartikler identifisert inntil 15. juni. For ikke-randomiserte studier uten kontrollgruppe, kvalitative studier og protokoller er kartet bare oppdatert til 4. mai 2020.

Samme publikasjon kan omhandle flere emner. Prognose er den vanligste emnegruppen (2199 artikler), med etiologi (1867 artikler), diagnostikk (1640 artikler), erfaringer og opplevelser (1483 artikler) og forebygging (1330 artikler) på de neste plassene. 684 artikler handler om ulike behandlingstiltak, og 654 om prevalens og insidens av covid-19.

Antall systematiske oversikter har økt jevnt, og i alt 509 av artiklene er nå i den kategorien. 111 av disse handler om farmakologisk og ikke-farmakologisk behandling av covid-19-pasienter. I samarbeid med McMaster University i Canada er målet å inkludere også kvalitetssikrede retningslinjer i kartet.

Referanser

  1. Molla R. How coronavirus took over social media. Vox 12. mars 2020 https://www.vox.com/recode/ 2020/3/12/21175570/coronavirus-covid-19-social-media-twitter-facebook-google

  2. https://www.thelancet.com/coronavirus

  3. Liu N, Chee ML, Niu C et al. Coronavirus Disease 2019 (COVID-19): An Evidence Map of Medical Literature. medRxiv doi: https://doi.org/10.1101/2020.05.07.20093674

  4. All that’s fit to preprint. Nat Biotechnol 38, 507 (2020). https://doi.org/10.1038/s41587-020-0536-x

  5. Brainard J. Scientists are drowning in COVID-19 papers. Can new tools keep them afloat? Science 13 mai 2020 https://www.sciencemag.org/news/ 2020/05/scientists-are-drowning-covid-19-papers-can-new-tools-keep-them-afloat#

  6. Bae S, Kim M-C, Kim JY, Effectiveness of Surgical and Cotton Masks in Blocking SARS–CoV-2: A Controlled Comparison in 4 Patients. Ann Intern Med 2020 Apr 6: M20-1342 https://doi.org/10.7326/M20-1342

  7. Mehra MR, Desai SS, Kuy S, Henry TD, Patel AN. Cardiovascular disease, drug therapy, and mortality in Covid-19. N Engl J Med. DOI: 10.1056/NEJMoa2007621

  8. Mehra MR, Desai SS, Ruschitzka F et al. Hydroxychloroquine or chloroquine with or without a macrolide for treatment of COVID-19: a multinational registry analysis. Lancet. 2020 May 22 doi: 10.1016/S0140-6736(20)31180-6

  9. Fretheim A, Brurberg KG, Forland F. Rapid reviews for rapid decision-making during the coronavirus disease (COVID-19) pandemic, Norway, 2020. Euro Surveill. 2020 May 14; 25(19): 2000687. doi: 10.2807/1560-7917.ES.2020.25.19.2000687

  10. https://www.fhi.no/sys/nytt/?blockId=90712&ownerPage=45271&language=no

  11. A systematic and living evidence map on COVID-19. https://www.fhi.no/contentassets/e64790be5d3b4c4abe1f1be25fc862ce/covid-19-evidence-map-protocol-20200403.pdf