Övning: Analysera gener hos en sjukdomsbakterie

Dela upp de olika sekvenserna i klassen så att lika många elever arbetar med vardera av gen nummer 1-5.

I denna övning tänker vi oss att en helt ny bakteriesjukdom har upptäckts och börjat sprida sig över världen. Den orsakar blodiga diarréer och sår i tarmarna, så allvarliga att många smittade dör så snabbt att man inte hinner sätta in antibiotika.

Ni är medlemmar i en forskargrupp som just har isolerat denna bakterie och börjat undersöka den. En av de första saker ni gjorde var att låta sekvensbestämma dess arvsmassa. Till er stora förvåning upptäckte ni då att bakterien är så gott som identisk med en sedan länge välkänd bakterie, som normalt lever i människors tarmar utan att göra någon skada där. Men att denna sjukdomsframkallande variant av bakterien har fem DNA-regioner, som den harmlösa bakterien saknar. Ni vill nu så snabbt som möjligt få reda på vad det kan finnas för gener i dessa regioner, vad de kan beskriva för proteiner, och hur dessa proteiner kan göra bakterien så aggressiv.

Du och dina kamrater ska därför analysera var sin av dessa DNA-sekvenser och försöka förstå vad dess protein kan ägna sig åt. Ni ska då använda olika databaser och verktyg som finns för forskare på Internet. Det material du därigenom samlar ska du klistra in i ett word-dokument, och sedan berätta om för klasskamrater som studerat andra gener.

1. Förberedelser

Ladda ner dokumentet med de fem olika DNA-regionerna.  Dela upp de olika sekvenserna i klassen så att lika många elever arbetar med vardera av gen nummer 1-5. Kopiera den sekvens du fått, och skapa ett word-dokument, där du klistrar in sekvensen.

2. Hitta proteinbeskrivningen och översätta till aminosyresekvens

Du ska nu låta datorn leta reda på det område i din sekvens som beskriver ett protein. För detta utnyttjar datorn det faktum att tre av 64 ord (tripletter) i det genetiska språket betyder ”stopp” och att därför i genomsnitt vart tjugonde ord i en slumpmässig DNA-sekvens säger ”stopp, nu är proteinet färdigt”. Eftersom ett normalt protein består av hundratals aminosyror kan man därför upptäcka beskrivningar av proteiner som större områden där stopp-tripletter saknas. Sådana områden kallas öppna läsramar (open reading frames, ORFs). Eftersom den genetiska koden är känd är det sedan enkelt för datorn att översätta DNA-sekvensen i denna öppna läsram till en aminosyresekvens.

För att kunna hitta en gen måste datorn göra denna undersökning på bägge DNA-strängarna. Eftersom genernas språk bygger på ord med tre bokstäver som följer omedelbart efter varandra måste datorn prova att börja läsa vardera strängen både på första, andra och tredje bokstaven (kallas att läsa i alla tre läsramar.) Ty det som ser ut som en rad bokstäver helt utan mening (och med en massa stopptripletter) om man börjar läsa vid en bokstav kan bära meningsfull information om man börjar läsa vid en annan. För att förstå detta kan man betrakta bokstavsraden ”alminbilvarfintaw” och försöka läsa denna tre bokstäver i taget och börja på första, andra respektive tredje bokstaven. De första två gångerna får man nonsensbudskapen ”alm inb ilv arf int aw” och ” a lmi nbi lva rfi nta w”. Tredje gången upptäcker man dock mitt i bokstavsraden en mening som bär betydelse ”min bil var fin”.

(a) Gå till tjänsten ORF-finder.  På den sida som då kommer upp (figur nedan), klistra in din sekvens i den stora rutan (svart pil) och klicka på knappen ”OrfFind” strax ovanför. Datorn kommer nu att gå igenom både den sekvens du matat in och den sekvens som måste finnas på den komplementära DNA-strängen och läsa dessa två sekvenser i alla tre läsramar.

(b) Du får nu en sida (figur nedan) där sekvensen representeras som en avlång box, som återges en gång för vart tänkbart sätt att läsa DNA-molekylen. Öppna läsramar är markerade som färgade regioner i dessa. Kopiera bilden och klistra in den i ditt word-dokument.

(c) Identifiera den längsta öppna läsramen. Klicka på dess färgade avlånga box.  Nedanför presenteras då DNA-sekvensen i den öppna läsramen tillsammans med en översättning till en aminosyresekvens. (Aminosyror anges med versala bokstäver under första bokstaven i den triplett som beskriver aminosyran.)

(e) Klicka därefter först på knappen ”Accept”, därefter på ”View”. Du får nu en sida (se nedan), där du strax ovanför den långa DNA-sekvensen hittar en rad som börjar med ”/translation=”, följt av en rad versala bokstäver (se pil). Denna bokstavshop anger proteinets aminosyresekvens. Kopiera denna (utan de inledande och avslutande citationstecknen) och klistra in sekvensen i ditt worddokument.

3. Sök membranbundna regioner.

De flesta proteiner som sitter i cellens membran är förankrade i detta med en eller flera alfahelixar, vilka främst består av hydrofoba (vattenhatande) aminosyror. Dessa helixar hålls fast i det vattenhatande inre av membranet. För att ta sig hela vägen genom ett membran måste en sådan hydrofob alfahelix bestå av 15-20 aminosyror. Genom att undersöka ett proteins aminosyresekvens kan datorer hitta sådana helixar: datorn gör då en sk hydrofobicitetsplot, där datorn analyserar var aminosyra tillsammans med dess grannar och därefter ger var aminosyra ett hydrofobicitetsindex. Har 15-20 aminosyror efter varandra ett högt sådant index kan man vara nästan säker på att de bildar en alfahelix som sträcker sig genom ett cellmembran.

(a) Gå till tjänsten Kyte-Doolittle-plot.   Vid (A), välj Kyte-Doolittle Hydropathy plot. Vid (B): Välj FASTA format och klistra in din aminosyresekvensen i det stora vita fönstret. Vid (C): Klicka på ”Submit sequence.”.

(b) Du får nu upp en hydrofobicitetsplot. Ifall hydrofobicitetsindex under en sträcka av 15-20 aminosyror kommer över en viss nivå (1,8) kan man känna sig nästan säker på att denna del av aminosyrekedjan formar en alfahelix som passerar genom ett membran. Klistra in plotten i ditt worddokument, skriv ut det och markera en linje vid 1,8. Sitter ditt protein i bakteriens membran?

4. Jämför med andra sekvenser

Forskarnas viktigaste verktyg för att få information om ett proteins funktion från dess aminosyresekvens är att jämföra den med sekvensen hos andra proteiner. Ty likheter i aminosyresekvens beror så gott som alltid på att proteiner haft ett gemensamt ursprung. Vilket i sin tur innebär att de oftast har samma eller liknande funktion. Ju större överensstämmelse hos aminosyresekvensen, desto likare kan funktionen antas vara.

(a) Gå till sidan NCBI. I listan till höger (se pil i bilden nedan) kickar du ”BLAST”. På den sida som då kommer klickar du en bit ner på på “protein blast.

(b) På den sida som då visar sig, klistra i det stora fönstret in aminosyresekvensen för ditt protein. Klicka sedan på BLAST-knappen nästan längst ned på sidan.

(c) Efter en liten stund får du då en bild som visar så kallade konserverade domäner hos proteinet. Bry dig inte om dessa, de ger ingen betydelsefull information som du inte strax får på ett enklare sätt! (Konserverade domäner är regioner med liknande sekvens hos olika proteiner. Ofta utför dessa regioner samma eller liknande arbetsuppgifter hos de olika proteinerna.  Som att katalysera en viss typ av kemisk reaktion. Eller binda till ett visst slags ämnen.)

(d) Lite senare kommer information om de sekvenser i databasen som har störst likhet med ditt proteins. De presenteras på tre sätt:

  • Som streck i en ruta där färgen markerar grad av likhet,
  • I en lista med länkar till mer information (grå pil),
  • Med de två sekvenserna skrivna över varandra med en mellanliggande rad som visar grad av likhet: Är aminosyrorna identiska skrivs deras bokstav ut, har de liknande kemiska egenskaper (exempelvis att bägge är stora och minusladdade) sätts där ett + och är de olikartade står där ingenting. (För att nå detta måste man scrolla länge nedåt på sidan.)

(e) Titta nu på de proteiner som har högst grad av likhet.  Scrolla ner och titta på hur lika eller olika sekvenserna är. Om mer än hälften av aminosyrorna är identiska kan man utgå från att proteinerna har mycket liknande funktion. Även om så få som 20% av aminosyrorna är identiska är detta ändå tillräckligt lika för att det ska vara troligt att två proteiner har liknande arbetsuppgift. Skriv upp vilket protein som har störst likhet med ditt. Läs faktarutan längre ner på denna sida. Vad säger detta om vilken aktivitet det protein du undersökt kan ha?

6. Från gen till sjukdom

Forma nu grupper så att varje grupp har minst en person som arbetat med vardera av de fem generna. Berätta för varandra om vad ni kommit fram till om er egen gens tänkbara funktion, och fundera tillsammans över hur dessa gener tillsammans kan åstadkomma skillnaden mellan harmlös och aggressiv bakterie.

.



Faktaruta om bakteriers sätt att orsaka sjukdom

Eftersom ni i denna övning är erfarna forskare i mikrobiologi känner ni redan igen en hel del av de ord och begrepp ni möter i databaserna:

Toxin och enterotoxin är här synonyma ord, som betecknar giftiga ämnen som bakterier kan bilda och kasta ut ur sig själv, som på olika sätt skadar den människa där detta händer.

Difteritoxin är ett av de allra starkaste och otäckaste sådana toxinerna, som dödar de celler det kommer i kontakt med. Detta sker genom att toxinet tar sig in i kroppens celler, och fäster en kemikalie på ett protein som hjälper ribosomen. Detta protein kan därefter inte utföra sitt arbete och cellens förmåga att tillverka nya proteiner försvinner. Därmed är cellen dödsdömd. Det räcker med att en enda toxinmolekyl tar sig in i en cell för att den ska dödas.

Adhesiner är proteiner på en bakteries ytor, som binder till något och därmed hjälper bakterierna att hålla sig fast vid ett underlag, till exempel mänskliga celler. Många adhesiner bildar långa fibrer, som är uppbyggda av ett stort antal olika proteiner. Sådana fibrer sticker ut från bakterien som små tunna hårstrån och griper tag i exempelvis ett protein på ytan av en människocell. Afimbriella adhesiner är proteiner som sitter ensamma i bakteriens ytterhölje, men utför samma slags arbete.

Invasiner är proteiner på bakteriers ytor, som hjälper bakterierna att ta sig in i den cell den bundit till. Så att bakterien kan fortsätta att föröka sig inne i den cellen.

IgA-antikroppar tillverkas av människans immunförsvar och binder till bakterier som hakar fast på utsidan av slemhinnor. Därigenom blockerar de bakteriens bindning till slemhinnan, och gör så att bakteriena kan sköljas bort av slem, urin, tårar etc. IgA-proteaser tillverkas av många bakterier och klipper sönder sådana IgA-antikroppar.



Till lärare

Syfte: Denna övning illustrerar:

  • vad som kan skilja sjukdomsframkallande bakterier från harmlösa.
  • att ett och samma protein kan förekomma hos olika arter med endast något förändrad sekvens
  • hur forskare kan utnyttja analyser och jämförelser av sekvenser för att skaffa information om en nyfunnen gens funktion

Förkunskaper: Elever måste veta:

  • att genernas språk arbetar med ord om tre bokstäver, sk tripletter.
  • att tre av sextiofyra sådana tripletter betyder stopp, och att resten beskriver varsin aminosyra.
  • att det inte finns några mellanslag eller andra markeringar mellan orden och att en DNA-sekvens därför säges ha tre olika läsramar, beroende på vilken bokstav man börjar med.
  • Begreppen hydrofil och hydrofob, det faktum att membranen har ett hydrofobt inre medan såväl cytoplasma som områden utanför celler är vattenlösningar där proteiner måste vara hydrofila för att trivas.

Kommentar: Se till att du själv läst in dig på faktarutan i slutet av instruktionen, så att du kan hjälpa eleverna hitta betydelsefull information i de databaser de kommer till.

Dela upp de olika sekvenserna i klassen så att lika många elever arbetar med vardera av gen nummer 1-5.

Kortkurs i bioinformatik: En handledning till olika webbtjänster kring bioinformatik hittar du här.

Elevövningar: Fem olika övningar i bioinformatik för gymnasieelever finns här.