Övning: Undersöka influensavirus med släktträd

Du ska nu gå till en databas och hämta 9 ytterligare hemagluttinin-sekvenser från olika stammar av viruset, hittade hos olika arter i olika delar av världen.

(a) Gå till Influenza Virus Resource på NCBI (US National Center for Biotechnology Information). www.biohealthbase.org. Iden nedre stora fyrkanten: Under Select Sequence type, välj Protein. Under Define search set, välj vid Type “A”. Vid Host, välj Avian, Human eller Swine.  Vid Protein, välj “HA”. Vid Subtype, välj H1N1, H3N2 eller H5N1.  Under “Get sequences from”, välj “include” på Pandemic 2009-viruses och “tha FLU project” men exclude på “Lab strains”. Klicka på “Show results”.

För att kunna förstå och försvara sig mot influensaepidemier är det viktigt att kunna ta reda på ursprunget hos ett virus, som hittas i en patient eller ett djur. Detta görs idag genom att man sekvensbestämmer genen för ett eller flera av virusets proteiner, och jämför med tidigare kända sekvenser. Man kan då exempelvis snabbt se om det är frågan om ett virus från “den nya influensan”, som hoppade till människa våren 2009, av den “klassiska” influensa som cirkulerat innan dess (som dök upp år 1968) eller av den mycket allvarliga fågelinfluensa som av och till hoppat från fågel till människa under 2000-talet.

Influensavirusen delas in i olika stammar beroende på vilka varianter viruset bär av två ytproteiner som kallas hemagluttinin (HA) och neuroaminidas (N). Därav bär de olika stammarna namn som H1N1 (den nya influensan), H3N2 (den tidigare influensan) och  H5N1 (fågelinfluensan).  Idag klassificeras som sagt virus genom att man analyserar DNA-sekvensen hos genen för dessa proteiner. Därigenom kan man inte bara snabbt konstatera vilken stam ett visst virus hör till, man kan också analysera hur virus av en och samma stam i olika delar av världen är släkt med varandra, och därmed få ledtrådar till hur spridningen av viruset skett.

I denna övning ska du få sekvensen för hemagluttinin-genen från ett influensavirus som hittats hos en patient. Sedan ska du ta reda på vilken stam viruset kommer från genom att bygga ett släktträd med din sekvens och ett antal andra sekvenser från influensavirus av olika stammar hittade hos både människor och andra djur.

1. Hämta den sekvens du ska undersöka

Ladda ner dokumentet med virussekvenser att undersöka, och fördela de sex sekvenserna mellan er, så att bara några elever använder samma sekvens. Klipp ut den sekvens du fått, och klistra in den i ett worddokument. Se till att få med den inledande rad som börjar med ett “större än”-tecken.

2. Hämta fler sekvenser till släktträdet

Du ska nu gå till en databas och hämta ytterligare några tiotal hemagluttinin-sekvenser från olika stammar av viruset, hittade hos olika arter i olika delar av världen.

(a) Gå till Influenza Virus Resource på NCBI (US National Center for Biotechnology Information). Du får då upp sidan nedan. Gör följande val i den nedre stora fyrkanten: Under Select Sequence type (pil 1), välj Protein. Under Define search set (pil 2), välj vid Type “A”. Vid Host, välj Avian, Human eller Swine. Vid Protein, välj “HA”. Vid Subtype, välj H1N1, H3N2 eller H5N1. Kryssa i “Full lenght only”. Under “Get sequences from” (pil 3), välj “include” på “Pandemic 2009 viruses” och “the FLU project”, men “exclude” på “Lab strains”. Klicka på “Show results”.


(b) Välj ut en  av de sekvenser du får upp, klicka på det understrukna accessionnumber (se pil 1 bilden nedan), och notera att du då kommer till en sida, där längst ned aminosyresekvensen ges i enbokstavskod.


(c) Copy-pasta in accessionnumber för denna och någon ytterligare sekvens i ett worddokument.  Gå tillbaka till förstasidan, och ändra inställningarna så du kan plocka fram och copypasta in accessionnumber för en handfull sekvenser från var och en av de tre huvudtyperna av viruset (H1N1, H3N2 och H5N1) hittade hos människor, fjäderfän och svin i olika delar av världen. Sammanlagt är det bra om du väljer ut 12-16 sekvenser.

(d) Redigera nu listan med accessionnumbers, så att de särskiljs med ett kommatecken och ett mellanslag.  Se till att du är på databasens förstasida. I det övre blåa fältet på sidan finns ett vitt fönster (pil 4 i den första bilden på denna sida). Klistra in hela raden av accessionnumber i detta, och klicka på “Show results”.

(e) På den sida som då kommer upp finns rätt högt upp till höger en Downloadknapp (pil 2 i figuren ovan). Bredvid denna finns ett fönster, se till att där är valt “Protein (FASTA)”. Tryck sedan på Download-knappen. Välj att ta emot informationen i word eller wordpad.

(f) Copypasta in din din sekvens (från punkt 1) med den inledande raden först i det dokument du därmed får.

3. Redigera dokumentet

Detta dokument måste redigeras något för att det program som ritar släktträd ska kunna arbeta med det.

(a) I början av varje sekvens finns en rad som bland annat innehåller info om vilken typ av virus det är, och var och när den hittats. Rensa bort allt annat från dessa rader än denna nyckelinformation och de inledande “större än”-tecknen. Se vidare till att det inte finns några mellanslag inne i dessa rader, använd istället slash eller understruket mellanslag. Efter detta arbete kan en inledande rad sålunda se ut så här:
>N1N1/USA/2009

(b) Se till att det inte finns några mellanslag i början av någon rad, och inga siffror i raderna med sekvenser. Se till att det inte finns några tomma rader vare sig i eller mellan sekvenserna.

4. Låt datorn göra ett släktträd

Du är nu klar för att låta ett dataprogram jämföra dessa sekvenser med varandra.

(a) Gå till en webbtjänst med programmet ClustalW.  Klistra in dokumentet du gjort i den stora rutan en bit ner på sidan (se nedan), klicka på Execute multiple alignment-knappen och vänta.

(b) Programmet undersöker nu den parvisa likheten mellan de olika sekvenser du matat in. Efter en stund skapas en sida med namnet ”CLUSTALW RESULT”. Scrolla till botten av sidan där du ser ett fönster där du kan välja olika slags släktträd. Välj ” N-J Tree with bransch length” och kicka på knappen ”Exec” till höger.

(c) Du får efter en stund en ny sida på skärmen med ett släktträd för dessa gener för hemagluttinin. Peka på trädet med musen, högerklicka, kopiera bilden, klistra in den i ett nytt word-dokument och skriv ut den.

5. Analysera trädet

I dessa träd är det grenarnas längd i vågrät riktning som bär information. Olikheten mellan två sekvenser avspeglas i den väg i vågrät riktning man behöver tillryggalägga för att förflytta sig längs grenarna mellan sekvenserna. Avstånden i lodrät riktning avspeglar däremot bara att de olika grenarna ska få plats, och deras inbördes placering i lodrät riktning är ofta godtycklig.

Titta på släktträdet. Begrunda:

  • Samlas virus som enligt databasen har samma grundtyp av hemagluttinin på samma huvudgrenar i trädet?
  • Vilken variant förefaller det virus ha, som du skulle undersöka.
  • Kan du urskilja spår av en utveckling även inom de olika virusstammarna?

.



Till lärare

Syfte: Denna övning illustrerar hur generna för influensavirusets ytproteiner skiljer sig dramatiskt mellan olika virusstammar och hur denna kunskap utnyttjas när man idag avgör vilken stam ett nyhittat virus kommer från.

Förkunskaper: Eleverna måste veta

  • vad en gen är
  • att mutationer ändrar ordningsföljden av baser i en gen, och att man därför kan avgöra grad av släktskap genom att studera skillnader i gen-sekvenser.
  • att influensavirus, och i synnerhet generna för deras ytproteiner förändras mycket snabbt och att detta leder till att förra årets influensa sällan ger en fullständig immunitet mot årets.

Om de ”okända” sekvenserna: De sekvenser eleverna tilldelas är något ”muterade” varianter av sekvenser från influensavirus som deponerats i denna databas.

Kommentar: Evolution inom de olika huvudgrupperna av influensavirus upptäcker man framför allt vad gäller H3N2. Detta är inte förvånande, eftersom detta virus cirkulerat bland människor och muterat i över 40 år, medan H1N1 dök upp så sent som våren 2009, och H5N1 bara cirkulerat mellan fåglar ett fåtal år.

Du ska nu gå till en databas och hämta 9 ytterligare hemagluttinin-sekvenser från olika stammar av viruset, hittade hos olika arter i olika delar av världen.

(a) Gå till Influenza Virus Resource på NCBI (US National Center for Biotechnology Information). www.biohealthbase.org. Iden nedre stora fyrkanten: Under Select Sequence type, välj Protein. Under Define search set, välj vid Type “A”. Vid Host, välj Avian, Human eller Swine.  Vid Protein, välj “HA”. Vid Subtype, välj H1N1, H3N2 eller H5N1.  Under “Get sequences from”, välj “include” på Pandemic 2009-viruses och “tha FLU project” men exclude på “Lab strains”. Klicka på “Show results”.

Kortkurs i bioinformatik: En handledning till olika webbtjänster kring bioinformatik hittar du här.

Elevövningar: Fem olika övningar i bioinformatik för gymnasieelever finns här.