Övning: Släktträd från proteinsekvenser

Till läraren

Övningens syfte: Denna övning illustrerar allt livs gemensamma ursprung och hur spåren av evolutionen kan studeras också i protein- och DNA-sekvenser.

Förkunskaper: Eleverna måste veta
• att proteiner består av ogrenade kedjor av aminosyror,
• att sekvensen av dessa kan anges med en enbokstavskod
• att mutationer kan ändra aminosyror och att likhet i aminosyresekvens därför är ett mått på evolutionär släktskap.

Kommentar: Anledningen till att de träd olika elever får upp kan skilja sig mellan varandra och från den etablerade bilden av evolutionen är helt enkelt att ett enda protein är ett så litet material att trädens utseende kan påverkas av rent slumpmässiga sammanträffanden. De träd som återges i läroböcker bygger därför på att man väger samman sekvenserna från en rad olika organismer.

I denna övning ska du skapa ett släktträd över livets utveckling med hjälp av sekvenserna hos olika arter av ett protein som finns i de flesta livsformer. Närmare bestämt av ett protein inblandat i glykolysen, som antas vara en av de första processersom uppkom i ämnesomsättningen, och som finns hos alla levande livsformer.  Dina kamrater kommer att göra motsvarande träd utifrån andra proteiner som deltar i samma process, och ni ska sedan jämföra era träd med varandras.

1. Förberedelser

Välj ett av följande proteiner. Samordna era val inom klassen, så att alla proteiner blir använda, och bara några elever väljer ett och samma protein (Eftersom databaserna är på engelska ger jag enzymnamnen på samma språk):

hexokinase
phosphofructokinase
aldolase
triose phosphate isomerase
glyceraldehyde-3-phosphate dehydrogenase
phosphoglycerate kinase
enolase
pyruvate kinase

2. Samla de sekvenser som ska jämföras

Börja med att göra ett word-dokument där ni samlar sekvenserna för ert protein hos alla de arter som anges i listan till höger. Gör då så här:

(a) Gå till webbsidan www.ncbi.nih.gov.

(b) På sidan du då får(se ovan) titta på listen på övre delen av sidan, välj i den övre rutan (svart pil) ”Protein”, skriv i den undre rutan namnet på ditt protein, och därefter namnet på den första arten i listan.  Klicka på ”Go”.

(c) Datorn söker nu reda på alla sekvenser av proteiner som är lagrade vars uppgifter stämmer med den sökprofil du skrev in. Du får en lista på dessa. Klicka på någon post på listan som ser rätt ut, som har åtminstone några hundra aminosyror. Ifall en post heter “Hypothetical protein” och har ungefär samma storlek som proteinet har hos andra arter kan sekvens användas (Det år då frågan om att man då sekvensen bestämdes inte direkt kopplade ihop den med en viss funktion, och gav den detta namn, men man sedan förstått att det är proteinet ifråga.)  Scrolla till slutet av sidan och kontrollera att där finns en sekvens av enbokstavskoder för aminosyror.

(d) Öppna ett worddokument och skriv på första raden först tecknet ”>”, omedelbart följt av namnet på den art vars sekvens du har hittat. Om denna rad innehåller flera ord ska dessa vara separerade av understrukna mellanslag. Raden kan således se ut så här:
>homo_sapiens

(e) Kopiera sedan sekvensen och klistra in den i dokumentet med början på raden nedanför den du nyss skrev.

(f) Gå sedan vidare till nästa art och gör samma sak, tills du har klistrat in namn och proteinsekvens för alla arter i listan.

(g) Ifall sekvensen för det protein du söker inte går att finna för någon av arterna, utelämna dessa.

3  Redigera sekvenserna

Nu ska du redigera word-dokumentet, så det får en form som dataprogrammet accepterar. I slutändan ska dokumentet få den form som framgår av rutan på nästa sida.

(a) Börja med att radera de siffror som inleder var rad i sekvensen, och radera samtidigt de mellanslag som kommer före siffrorna.

(b) Se till att varje sekvens du klistrat in föregås av en rad med information om vilken art sekvensen är från och att dessa rader börjar med ett ”>”, bara innehåller mellanslag_som_är_understrukna.

(c) Se till att det inte finns några tomma rader mellan eller inne i de olika sekvenserna, samt att det inte finns några mellanslag i början av raderna. Mellanslag inne sekvenser accepteras däremot.

4  Låt datorn göra släktträd

Du är nu klar för att låta en dator jämföra dessa sekvenser med varandra.

(a) Gå till http://align.genome.jp.

(b) Kopiera hela listan med sekvenser ur word-dokumentet och klistra in dem i den stora rutan en bit ner på sidan (pilen i bilden ovan), klicka på knappen Execute multiple alignment strax nedanför och vänta.

(c) Programmet undersöker nu den parvisa likheten mellan de sekvenser du matat in. Efter en stund skapas en sida med namnet ”CLUSTALW RESULT”. Scrolla till botten av sidan där du ser en ruta där du kan välja olika slags släktträd. Börja med att välja ”Unrooted N-J Tree” och kicka på knappen ”Exec” till höger.

(d) Efter en liten stund får du upp en bild av ett släktträd. Högerklicka och skriv ut eller klistra in i ett worddokument. Bilden visar det slags släktträd datorn med säkerhet kan skapa med hjälp av den information du matat in: Genom att parvis jämföra skillnader mellan de olika sekvenserna bygger den ett schema där olikheten mellan varje sekvens avspeglar avståndet mellan dem om man vandrar längs trädets grenar. Vi kan läsa detta träd som att den första genen för ditt protein uppenbarligen uppkom ungefär samtidigt med livet någonstans i mitten av bilden, och genen sedan utvecklats i olika livsformer ungefär längs de vägar bilden visar. Så länge man bara tittar på enstaka proteiner eller gener är det dock vanskligt att dra bestämda slutsatser om exakt hur förgreningarna går: Undersök ifall du i ditt släktträd hittar något som strider mot den etablerade bilden av livets utveckling.

(e) Gå åter till sidan där du kan välja olika slags släktträd. Välj nu ”N-J Tree with bransch length” och klicka på ”Exec”. Efter en stund får du nu upp ett så kallat rotat träd. Högerklicka och skriv ut eller spara. Dataprogrammet har nu gjort en intelligent gissning om var i den förra bildens mitt genen ifråga uppkom, och sedan arrangerat de olika utvecklingslinjerna till ett traditionellt släktträd med en rot. Observera dock att denna gissning inte är helt tillförlitlig, och att detaljerna nära roten i ett sådant träd ofta blir osäkra. Jämför de två träden med varandra och med de släktträd som läroböcker ritar upp.

5  Jämför träd från olika proteiner

Sätt er tillsammans med några elever som byggt sina träd från andra proteiner och jämför era träd. Vilka skillnader hittar ni? Hur kan de förklaras? Diskutera med er lärare.



Till läraren

Övningens syfte: Denna övning illustrerar allt livs gemensamma ursprung och hur spåren av evolutionen kan studeras också i protein- och DNA-sekvenser.

Förkunskaper: Eleverna måste veta

  • att proteiner består av ogrenade kedjor av aminosyror,
  • att sekvensen av dessa kan anges med en enbokstavskod
  • att mutationer kan ändra aminosyror och att likhet i aminosyresekvens därför är ett mått på evolutionär släktskap.

Kommentar: Anledningen till att de träd olika elever får upp kan skilja sig mellan varandra och från den etablerade bilden av evolutionen är helt enkelt att ett enda protein är ett så litet material att trädens utseende kan påverkas av rent slumpmässiga sammanträffanden. De träd som återges i läroböcker bygger därför på att man väger samman sekvenserna från en rad olika organismer.

Till läraren

Övningens syfte: Denna övning illustrerar allt livs gemensamma ursprung och hur spåren av evolutionen kan studeras också i protein- och DNA-sekvenser.

Förkunskaper: Eleverna måste veta
• att proteiner består av ogrenade kedjor av aminosyror,
• att sekvensen av dessa kan anges med en enbokstavskod
• att mutationer kan ändra aminosyror och att likhet i aminosyresekvens därför är ett mått på evolutionär släktskap.

Kommentar: Anledningen till att de träd olika elever får upp kan skilja sig mellan varandra och från den etablerade bilden av evolutionen är helt enkelt att ett enda protein är ett så litet material att trädens utseende kan påverkas av rent slumpmässiga sammanträffanden. De träd som återges i läroböcker bygger därför på att man väger samman sekvenserna från en rad olika organismer.

Arter att ha med i släktträdet

Homo sapiens (människa)
Rattus norvegicus (råtta)
Gallus gallus (kyckling)
Anopheles gambiae (mygga)
Caenorhabditis elegans (rundmask)
Plasmodium falciparum (protozoa, malariaparasit)
Arabidopsis thaliana (backtrav)
Oryza sativa (ris)
Neurospora crassa (mögelsvamp)
Mycobacterium tuberculosis (tuberkelbakterie)
Staphylococcus aureus (stafylokock)
Methanocaldococcus jannaschii (värmetålig arkebakterie)
Halobacterium sp (saltälskande arkebakterie)

Kortkurs i bioinformatik: En handledning till olika webbtjänster kring bioinformatik hittar du här.

Elevövningar: Fem olika övningar i bioinformatik för gymnasieelever finns här.