Bygga släktträd

Bygga släktträd via nätet

Datorer kan enkelt bygga släktträd (fylogenetiska träd) från en uppsättning sekvenser som har gemensamt ursprung. De jämför då alla sekvenserna parvis med varandra och räknar ut ett mått på de parvisa skillnaderna dem emellan. Detta kan grafiskt illustreras som ett grenverk av linjer som förbinder de olika sekvenserna med varandra, där avståndet i grenverket mellan två sekvenser är ett mått på olikheten dem emellan. En sådan illustration kallas för ett orotat släktträd. Man kan enkelt inse att den gemensamma urfadern till sekvenserna motsvaras av en punkt någonstans i grenverkets mitt. Men man kan inte säkert säga exakt var.

För att säkert veta var i grenverket den gemensamma anfadern befann sig måste man jämföra sekvensen med motsvarande sekvens från en art som är mindre släkt med de studerade arterna än dessa är sinsemellan. Om man exempelvis skapat ett orotat släktträd med olika däggdjur kan en fisk eller fågel användas för att hitta den punkt i grenverket som motsvarar ”urdäggdjuret”. Därmed kan den grafiska representationen av släktskapet omvandlas till ett traditionellt släktträd som har en stam/rot. Ett så kallat rotat släktträd. De dataprogram som gör fylogenetiska träd kan emellertid göra intelligenta gissningar om var stammen/roten i ett träd sitter. Man kan därför välja om det träd programmet ritar upp ska vara orotat eller rotat. Väljer man ett rotat träd ska man dock vara medveten om att rotens plats (och därmed det exakta förgreningsmönstret nära roten) är den bästa gissning datorn kan göra från det material du matat in, inte ett hårt vetenskapligt resultat.

Här ses ett orotat och ett rotat träd som bygger på jämförelser av aminosyresekvensen hos enzymet alkoholdehydrogenas hos en rad olika arter. De träd över livets utveckling som visas i moderna läroböcker bygger på hopvägningar av sådana träd från ett stort antal olika gener och proteiner. Ett enda protein är nämligen ett så litet material att enstaka ansamlingar av mutationer i en gen under en viss utvecklingslinje kan påverka trädets utseende. I dessa träd har sådana tillfälligheter gjort att kycklingen förefaller stå musen närmare än vad människan gör. Och en kombination av tillfälligheter och den ofrånkomliga osäkerheten i närheten av trädets rot har lett till att svamparna (jäst, Candida och Neurospora) förefaller ha delat sin tidigaste utveckling med eubakterier, inte övriga eukaryoter.

Du ska nu själv göra detta släktträd.

Steg 1: Samla de sekvenser som ska jämföras

Skapa ett worddokument att klistra in de olika sekvenserna i. Gå sedan till NCBIs webbsida.

I det gråa fältet högt upp på sidan, välj i det övre vita fönstret databasen ”Protein”, och skriv i det nedre fönstret namnet på proteinet (alcohol dehydrogenase) samt det latinska namnet på den första art du ska hämta sekvensen från. Klicka på ”Search”. Leta i listan som kommer upp en post som förefaller innehålla det protein du söker. Klicka på det understrukna namnet på proteinet.

Scrolla till botten av sidan som då kommer upp. Där finns längst ner en grupp rader med proteinets aminosyresekvens i enbokstavskod, med bokstäverna grupperade tio och tio. Strax ovan till vänster är med versaler skrivet ”ORIGIN”. Klipp ut denna sekvens och klistra in den i worddokumentet. Skriv på raden ovanför sekvensens början namn på den art du tagit sekvesnen från föregånget av ett ”större än”-tecken. Lämna inga mellanslag i raden, som sålunda exempelvis kan se ut så här:
>Människa

Upprepa proceduren för var och en av arterna som ska ingå i trädet: Homo sapiens (människa), Mus musculus (mus), Rattus norvegicus (råtta), Gallus gallus (kyckling), Xenopus laevis (groda), Danio rerio (zebrafisk), Caenorhabditis elegans (rundmask), Pisum sativum (ärta), Arabidopsis thaliana (backtrav), Sacharomyces serevisiae (jäst), Candida albicans (sjukdomsalstrande svamp), Neurospora crassa (mögelsvamp), Staphylococcus aureus (stafylokockbakterie), Corynebacterium (difteribakterie), Streptomyces (bakterie), sulfolobus (arké), Haloarcula (arké), Picrophilus torridus (arké) och Thermoplasma (arké).  Eller ladda ner ett färdigt dokument med alla dessa sekvenser här.

Steg 2: Redigera sekvenserna

Nu ska du redigera word-dokumentet, så det får en form som dataprogrammet accepterar.

(a) Börja med att radera de siffror som inleder var rad i sekvensen, och radera samtidigt de mellanslag som kommer före siffrorna.

(b) Se till att varje sekvens du klistrat in föregås av en rad med information om vilken art sekvensen är från och att dessa rader börjar med ett ”>”, och inte innehåller några mellanslag. (Använd istället slash eller undxerstrukna mellanslag).

(c) Se till att det inte finns några tomma rader mellan eller inne i de olika sekvenserna, samt att det inte finns några mellanslag i början av raderna.

Steg 3: Låt datorn göra släktträdet

(a) Gå till en webbsida med programmet ClustalW.

(b) Kopiera listan av sekvenser från ditt dokument och klistra in det i den stora rutan (se pil i bilden ovan). Klicka på Execute multiple alignment och vänta. Programmet undersöker nu den parvisa likheten mellan de olika sekvenser du matat in.

(c) Efter en stund skapas en sida med namnet ”CLUSTALW RESULT”.  Scrolla till botten av sidan där du ser en ruta där du kan välja olika slags släktträd. Börja med att välja ”Unrooted N-J Tree” och kicka på knappen ”Exec” till höger.

(d) Efter en liten stund får du upp en bild. Den visar ett orotat släktträd. Peka på trädet med musen och högerklicka. Spara/kopiera trädet, klistra in det i ett worddokument och skriv ut det.

(e) Gå tillbaka till sidan där du kunde välja mellan olika slags träd. Välj nu ”N-J Tree with bransch length” och klicka på ”Exec”. Efter en stund får du nu upp ett rotat träd, som du på motsvarande sätt kan spara.



Övningar för elever

På denna sida kan du hitta två utprovade övningar för elever, där de bygger släktträd:

Undersöka influensavirus med släktträd: Eleverna tilldelas en DNA-sekvens från ett virus från en död fågel eller en sjuk människa och ska sedan hämta sekvenser från en rad kända influensavirus och bygga ett släktträd av dessa och sin egen sekvens, och studera var i släktträdet den egna sekvensen hamnar. Övningen finns här!

Bygga släktträd från proteinsekvenser: Eleverna väljer varsitt protein från glykoloys eller citronsyracykeln (finns i flertalet livsformer), hämtar sekvenser för dessa proteiner från en uppsättning arter som är lika för alla elever, och låter datorer göra släktträd. Eleverna kan sedan jämföra träd man från olika proteiner. Övningen finns här!