Jag fick ett telefonsamtal för någon vecka sedan, strax efter det jag skrivit ett inlägg här på bloggen om biobanksprojektet LifeGene. Det var chefen för projektet, Jens Mattsson. Han berättade att de tyckte det var roligt att jag skrivit, och att de tyckte jag skrivit rätt bra. Men att där fanns ett par små missförstånd. Dem har jag nu gått in och rättat, i ett tillägg till inlägget.

Under samtalet passade jag på att fråga om jag fick komma och hälsa på. Det fick jag gärna! Det visade sig att LifeGene bor på Karolinska Institutets område, i anslutning till den stora institutionen för medicinsk epidemiologi och biostatistik, två hus bort från den institution (MTC) där jag har en liten skrivplats och försöker gå på några seminarier i månaden. Och att Jens, som förestår satsningen, är gammal kurskamrat sedan jag läste kemi i Uppsala.

Bakgrund

Bakgrunden till det hela, förklarade Jens, är att vi visserligen har en enorm massa biobanker i Sverige. Dvs samlingar med blodprover, där man också har vissa medicinska- och ibland också livsstilsdata. Men de flesta är hopsamlade från deltagarna efter det de blivit sjuka. Eller tagna i fyrtioårsåldern, eller senare, då de bjudits in att vara med i någon stor undersökning.

Däremot har man ingen systematisk samling prover och livsstilsdata från människor tagna redan när de är unga. Vilket skulle behövas för att kunna leta efter faktorer tidigt i livet som skulle kunna förklara varför somliga men inte andra senare blir sjuka. Därför är det bara människor upp till 45 års ålder som aktivt inbjuds att delta i LifeGene.

Vidare finns idag sällan en ordentlig organisation för att styra vilka forskare som ska få tillgång till de olika biobankerna. (Ett gammalt blodprov kan ju inte delas upp i för många små skvättar innan det blir för lite material att göra olika undersökningar på.) Därför har det i alltför stor utsträckning blivit så att det varit forskare som råkat ha bra relationer med dem som haft hand om olika biobanker som fått använda dessa i olika forskningsprojekt. Vilket inte nödvändigtvis alla gånger varit de forskare som haft bäst idéer om vad de velat göra. Eller varit bäst meriterade för att göra det. Därför kommer det att råda fri konkurrens om att få tillgång till LifeGenes material, och besluten kommer att fattas efter kvalitetsgranskning av de forskningsprojekt som ansöker.

Upplägg

Hur arbetar man då mer konkret? LifeGene värvar frivilliga deltagare genom att skicka ut brev till människor i önskad ålder. Vill man delta går man in på internet,  besvarar en massa frågor om sin livsstil, ger sitt samtycke till att svaren används i forskning, och beställer tid på ett testcenter. Där lämnar man ett skriftligt samtycke, bestämmer sig för om man vill få veta resultaten av de tester som görs och prover som tas, varefter man går genom en rad tester (blodtryck, puls, hörseltest, spirometri, mm) samt lämnar blod- och urinprov. På dessa prover görs omedelbart ett antal standardanalyser, varefter resten av materialet sparas i biobank. Blod och urin från var person delas då upp i ett antal små provrör (se bilden ovan), som fryses in och förvaras i minus 80 grader.  Denna biobank är organisatoriskt, fysiskt och datormässigt  separerad från LifeGene.

Olika forskargrupper kan sedan ansöka om att få prover från biobanken och testresultat och livsstilsdata från LifeGene, för att göra olika undersökningar. Till exempel leta efter genvarianter som samvarierar med någon sjukdom.Vilka som ska få material avgörs i slutänden av ett nationellt vetenskapligt råd, med representanter för landets samtliga medicinska fakulteter. Men tanken är att frågorna ska förberedas av beredningsgrupper med aktiva forskare, som bedömer ansökningar och väger dem mot varandra.

Vid forskning på detta material kommer det således att finnas tre separata aktörer:
LifeGene har databaser med testresultat och livsstilsinformation, inte kopplat Peoples State Bank & Trust Routing Number till personuppgifter utan till en kod. Separat har de också nycklar som kopplar ihop personer med rätt kod.
KI Biobank förvarar själva det biologiska materialet, som även det är märkt med en opersonlig kod. Även biobanken har dock en separat databas som kopplar ihop prover med personuppgifter för att kunna försäkra sig om att man inte lämnar ut material från någon, som meddelat att han vill dra tillbaka sitt samtycke.
Forskargruppen får biologiskt material från ett antal personer från biobanken och testresultat plus livsstilsinformation från LifeGene. Bäggedera märkt bara med koderna, så att de ska kunna koppla ihop rätt prov med rätt testresultat och livsstil, men inte med en konkret person. Forskargruppen har alltså aldrig tillgång till databasen som kopplar ihop koderna med personuppgifter.

En viktig missuppfattning i mitt inlägg för två veckor sedan är alltså att som projektet nu är riggat kommer vare sig LifeGene eller KI Biobank ska göra några DNA-tester eller sekvenseringar av materialet. När olika forskargrupper gör sådana analyser hamnar resultaten varken i LifeGenes eller biobankens databaser. Så som projektet nu är organiserat.

Kan LifeGene själva börja lagra DNA-data senare?

När jag fick detta klart för mig blev jag lite förvånad, eftersom det skulle innebära att ett antal olika forskargrupper kan komma att slösa både med sin egen tid och med det värdefulla materialet i biobankerna för att parallellt med varandra göra samma analyser av materialet. Jag frågar därför om de inte funderat över att själva göra sådana analyser, eller på något annat sätt hjälpa forskarna att undvika dubbelarbete.

Jens svarar att det just nu inte finns några konkreta planer på hur detta ska göras, men att det naturligtvis är en fråga man diskuterar. Flera teoretiska möjligheter skulle kunna tänkas: Att man inte gör någonting. Att LifeGene lagrar information om vilka analyser olika forskargrupper gjort, så att dessa kan låna eller byta data av varandra. Att LifeGene själva lagrar resultaten av olika analyser olika forskargrupper gjort på prover, så att en enorm databas uppkommer, som andra forskare kan utnyttja. Att LifeGene kanske till och med självt utför en del DNA-analyser på prover, eller en del av proverna, som man låter forskarvärlden ta del av.

Frågan är komplicerad, säger Jens: Det är en teknisk utmaning att få databaser för sådan information att fungera och vara tillräckligt säkra. Det är en legal utmaning att se till att det genomförs i enlighet med alla regler och föreskrifter som omgärdar sådan verksamhet. Det är en rent praktisk utmaning att få forskargrupper att rapportera tillbaka sina mätdata. Och därtill finns komplicerade etiska frågor kring sådana register och genetisk integritet. Var man eventuellt kommer att hamna vet Jens således inte idag.

Kan man skydda försökspersonernas genetiska integritet?

Naturligtvis pratar vi en hel del om det är möjligt att skydda försökspersonernas integritet i projektet. Jens förklarar att det är självklart att inget system är hundraprocentigt säkert, att det alltid är möjligt för tillräckligt motiverade och skickliga hackers att komma in, att det alltid kan vara möjligt för smarta programmerare att hitta mönster i anonymiserade gendata, som kan göra det möjligt att spåra dem.

Jens försäkrar att de i projektet anstränger sig så mycket de kan för att minska risken för sådant. Till exempel försöker de kombinera olika erfarenheter bland dem som arbetar med IT-säkerheten: En del kommer från bankvärlden, en del från olika myndigheter med särskilt ansvar för krisberedskap osv. Viktigtast är dock att man arbetar systematiskt med informationssäkerhet genom tillämpning av etablerade ISO-standarder.

Men, säger han, med de olika lager av säkerhet LifeGene byggt in i systemen skulle den som vill hacka sig in i någon annans arvsmassa ha ett mycket styvare jobb att göra detta genom deras databaser, än genom att bjuda sitt offer på middag eller spionera på henne under ett restaurangbesök, stjäla ett glas, och skicka det på DNA-analys.

Vad göra?

Så slutar vårt samtal med att Jens kastar över frågan till mig: Hur tycker jag att man ska hantera det faktum att man inte kan ge hundraprocentiga garantier för att ingen knäcker anonymiteten hos DNA-data?

Ja, svarar jag, inte tycker jag att man som amerikanarna i Personal Genome Project ska ge upp tanken på anonymitet, och lägga ut både namn och foto tillsammans med DNA-sekvens och sjukjournaler på nätet. Man vet aldrig i förväg vad framtida forskning kan visa att ens räcka med DNA-bokstäver egentligen betyder. Och även om man själv tar beslutet att skicka ut sin DNA-sekvens i cyber-rymden delar man hälften av den med sina barn och syskon, och kan inget veta om vad sekvenserna kan innehålla för information om dem.

Inte heller tror jag på att stänga in DNA-sekvenser och andra analysresultat i slutna databaser, som bara särskilt betrodda forskare skulle ha tillgång till. Då skulle mängder av viktiga frågor aldrig bli ställda till materialet. Och man skulle förlora den fantastiska chans för forskare från fattiga länder som nu öppnas att göra högklassig forskning utan att själva behöva göra dyra experiment, bara genom att före andra komma på vilka frågor som ska ställas till den allt mer omfattande informationshög som samlas på nätet.

Så jag tror att det bästa är att göra allt som går för att skydda försökspersonernas anonymitet. Men vara öppna med att det inte är helt säkert att man lyckas. Att se till att lagstiftarna förstår hur viktig frågan är så de inte kommer med lagändringar, som naggar de löften som givits i kanten. Och att man tydligt gör det till ett relativt allvarligt brott att försöka knäcka anonymiteten i sådana databaser och biobanker.

Vilket är ungefär som Jens och hans kollegor på LifeGene också tycks tänka.

Märkligt att DN lyckades åstadkomma en artikel som gav rakt motsatt intryck!