Mar enllà

Comparar seqüències Howto

Publicat per Antoni a Juliol 12, 2006

Al món de la informàtica s’acompleix una màxima: el més complexe és manejat amb fluïdesa per l’ordinador i allò de sentit comú no li pots fer entendre ni a potades.

Per poder treure tota la informació d’una seqüència de DNA o d’aminoàcids no ens queda més remei que saber emprar les bases de dades disponibles a internet. No és qüestió de de reinventar la roda si un altre ja ha fet allò que intentam esbrinar. Aquí és on poden veure com s’acompleix la màxima anterior. El concepte de comparar una seqüència desconeguda amb les ja treballades de les bases de dades, és molt senzill de comprendre per nosaltres però fer-ho entendre a l’ordinador és tot un show que ha calgut dècades perfeccionar.

Els camins a seguir són diversos i moltes vegades un poc metafísics. Les opcions són cinc, com els dits de la mà.

  1. Ets collonut i has nascut amb una flor al cul. Agafes la seqüència problema i la compares directament amb les de les bases de dades emprant el sempre diví BLAST. No, comparar per alineament no funciona si no vols estar més temps que l’edat de l’univers per comparar un miler de seqüències. La comparació es fa per mètodes heurístics i generalment les matrius de substitució BLOSUM. Si la cosa no funciona, vol dir que ets com la majoria dels mortals i et toca emprar altres camins més complexes.
  2. Si ets aquí és perquè la teva seqüència no s’assembla prou a res conegut a les bases de dades; no sempre ets guai i et quedes al punt 1. Et toca parir un patró de seqüències i comparar-lo amb les bases de dades. La idea és agafar el conjunt de seqüències que es pareixen més a la teva i fer un patró general prou representatiu de totes plegades, per això feim un alineament múltiple de seqüència (MSA) amb ClustalW i amb el resultat empram Pratt obtenir el patró. Fer feina amb un patró implica tenir un marc de recerca més ampli i poder trobar seqüències d’homologia llunyana que s’havien escapat amb el primer BLAST i de les que es coneix la seva funció. I ja se sap: si es pareixen és probable que serveixin pel mateix. Amb el patró a les teves mans vas a Scanprosite i mires si ha servit de res tot això.
  3. Podem tirar per un altre camí comparant la nostra seqüència directament amb bases de dades de patrons de funcions conegudes. Aquí has de confiar en els experts que han assignat a cada patró unes determinades funcions. I el de sempre, si el patró que trobam és representatiu de la nostra seqüència dons és molt possible que tengui la funció assignada al patró. Un cop més caldrà fer una visita a sant ScanProsite o a MotifScan.
  4. Arribats aquí ja hi comença a haver mal rotllo si no t’ha sortit res aprofitable. Però som caparruts i arribarem fins al final. Sense gens de por compararem la seqüència problema amb una base de dades de perfils o HMMs (o hidden Markov models). Fins ara havíem estat molt estrictes amb les recerques però ara serem més flexibles però més cabronets. Un perfil no és més que una matriu de substitució específica per a cada posició de la seqüència, la més popular és la de Gribskov i aquí tenim en compte tant la informació del MSA com de la matriu BLOSUM. Malgrat tot, la potència estadística del procediment és bastant magre. Tot lo contrari que si empram els HMMs. I aquí tenim un bon grapat d’opcions per manejar: Pfam, ScanProsite o MotifScan.
  5. A partir d’aquest punt ja jugam fort. Comparam els perfils o els HMMs directament amb bases de seqüències. Partim d’un MSA i el passam per ProfileWeight, que ens genera una matriu que no és més que el perfil. L’empram per fer una recerca amb Profilesearch i ens proporciona una llista de seqüències d’homòlegs llunyans. Es pot fer exactament el mateix amb PSI-BLAST aplicant-ho durant diverses rondes. Si per un casual tampoc obtenim res, només ens queda fer un hmmsearch amb el paquet HMMer a un cluster local d’ordinadors amb les bases de dades necessàries i invertir un parell d’hores de càlcul.

Malgrat tot, moltes vegades no podem anar més enllà d’aquestes possibilitats i no queda més remei que tornar-nos a embrutar les mans al laboratori per obtenir uns resultats més aclaridors.

Deixa un comentari

XHTML: Pots fer servir aquestes etiquetes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <pre> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>