Mar enllà

Alineaments I

Publicat per Antoni a Febrer 18, 2007

La pedra angular de l’anàlisi de seqüències és el concepte d’alineament. Se suposa que en un passat poc o molt llunyà les dues seqüències que comparam eren iguals ja que pertanyien al mateix ésser viu. Però per efecte de les mutacions successives associades a l’evolució, apareixen dos tipus d’éssers distints; poc o molt, això no ens importa ja que podem estar parlant des d’individus distints de la mateixa espècie fins a individus de dues espècies distintes. La imatge més gràfica sol ser escriure dues seqüències, una damunt de l’altra i veure quin és el nivell de coincidència. Podria ser així:

AACGT -                 - AACGT                      AA - CGT -

ACCGTT                 ACCGTT                       A - CCGTT

Com es pot veure, l’habitual és que hi hagin diverses possibilitats d’alineament. Ara bé, quina és la bona?. El primer alineament indica que hi ha hagut dos fenomens evolutius que han allunyat les dues seqüències: una mutació puntual a la segona posició i una inserció o deleció a la darrera posició. El segon cas implica que hi ha hagut fins a cinc fenomens evolutius que han allunyat ambdues seqüències. Aquí és quan el criteri a seguir és el de la parsimònia que pensam que regeix l’evolució. En altres paraules, la solució bona probablement sigui aquella que implica menys fenomens evolutius. En el nostre cas, el primer alineament.

Tot això intuïtivament és lògic des del punt de vista biològic. Però cal tenir un sistema que assigni uns valors determinats per a cada tipus d’alineament ja que no podem anar “a ull”. La manera més senzilla és el que es coneix com el linear gap model. Segons aquest model, cada buit (gap) a la seqüència, que s’ha simbolitzat abans amb una ratlla, és penalitzat amb un valor G = L · ge, on la L és l’extensió del buit i ge és la penalització per base de la seqüència estesa. Malgrat tot, es pot tenir més cura de model si hi afegim endemés una penalització per obertura de buit ja que els estudis de biologia molecular indiquen que és més senzill estendre un gap ja obert que obrir-ne un de nou. Així, quedaria G = go + L · ge. I go tindria assignat un valor més negatiu que go.

Amb això més o menys podem anar quedant contents. Però no és un model perfecte ni molt menys. Per començar no es fa distinció transicions (canvi entre purina-purina*, o pirimidina-pirimidina**) o les transversions (el canvi purina-pirimidina). Essent més freqüents aquestes darreres. Malgrat tot, el model funciona prou bé inclús sense aquesta distinció.

La cosa comença a fer patir quan en lloc de analitzar seqüències de nucleòtids, analitzam seqüències d’aminoàcids. Aquí les tasses de mutació són molt distintes per a cada aminoàcid i cal fer distincions entre unes situacions i les altres. No podem anar tan alegrement com en el cas anterior. És per això que caldrà posar en marxa les sempre interessants matrius de substitució d’aminoàcids que més endavant discutiré.

*Adenina (A) i Guanina (G)
** Timina(T) i Citosina (C)

Deixa un comentari

XHTML: Pots fer servir aquestes etiquetes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>