Vés al contingut

Universitat Internacional de Catalunya

Bioinformàtica Estructural

Bioinformàtica Estructural
3
14864
4
Primer semestre
op
Llengua d'impartició principal: anglès

Altres llengües d'impartició: català, castellà

Professorat


Els dubtes seran resolts abans o després de la classe. Per resoldre dubtes de forma no presencial es farà mitjançant videoconferència.

Presentació

En aquesta assignatura es proporcionen els conceptes fonamentals per a lús de la informació estructural en problemes biomèdics/clínics. Per això s'abordarà la relació fonamental entre estructura i funció, analitzant les estructures tridimensionals de proteïnes, ADN i ARN. Veurem com processar gràficament i automàticament les estructures tridimensionals de les macromolècules. Posteriorment veurem les diferents metodologies per generar informació estructural mitjançant metodologies capdavanteres que inclouen algorismes d'Intel·ligència Artificial. Finalment veurem com podem utilitzar la bioinformàtica estructural per abordar problemes biomèdics relacionats amb la comprensió molecular de les malalties hereditàries.

Requisits previs

Es recomana haver cursat i superat:

 Introducció a la bioinformàtica

 Interaccions biomoleculars

Objectius

  • Comprendre com la relació entre estructura i funció és la base de l'aplicació dels mètodes de bioinformàtica estructural a la biomedicina
  •  Saber generar informació estructural: diferència entre extracció i predicció
  •  Utilitzar la informació estructural per analitzar la informació genètica i resoldre problemes biomèdics/clínics associats

 

Competències/Resultats d’aprenentatge de la titulació

  • CB01 - Que els estudiants hagin demostrat que posseeixen i comprenen coneixements en una àrea d'estudi que parteix de la base de l'educació secundària general, i s’acostuma a trobar en un nivell que, si bé es recolza en llibres de text avançats, inclou també alguns aspectes que impliquen coneixements procedents de l'avantguarda del seu camp d'estudi.
  • CB03 - Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins de la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes rellevants d'índole social, científica o ètica.
  • CB04 - Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tant especialitzat com no especialitzat.
  • CB05 - Que els estudiants hagin desenvolupat les habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia.
  • CE07 - Aplicar les eines estadístiques a estudis en Ciències de la Salut.
  • CE19 - Reconèixer els principis de les ciències biomèdiques relacionades amb la salut i aprendre a treballar en qualsevol àmbit de les ciències biomèdiques (empresa biomèdica, laboratoris de bioinformàtica, laboratoris d'investigació, empresa d'anàlisis clíniques, etc.).
  • CG07 - Integrar els conceptes bàsics relacionats amb el camp de la biomedicina tant teòrics com experimentals.
  • CG10 - Dissenyar, redactar i executar projectes relacionats amb l'àrea de les ciències biomèdiques.
  • CG11 - Reconèixer conceptes bàsics de diferents àmbits vinculats a les ciències biomèdiques.
  • CT01 - Desenvolupar la capacitat d'organització i planificació adequades al moment.
  • CT02 - Desenvolupar la capacitat per a la resolució de problemes.
  • CT03 - Desenvolupar la capacitat d'anàlisi i síntesi.
  • CT04 - Interpretar resultats experimentals i identificar elements consistents i inconsistents.
  • CT05 - Fer servir internet com a mitjà de comunicació i com a font d'informació.
  • CT06 - Saber comunicar, fer presentacions i redactar treballs científics.
  • CT07 - Ser capaç de treballar en equip.
  • CT08 - Raonar i avaluar les situacions i resultats des d'un punt de vista crític i constructiu.
  • CT09 - Tenir la capacitat de desenvolupar habilitats en les relacions interpersonals.
  • CT10 - Ser capaç de dur a terme un aprenentatge autònom.
  • CT11 - Aplicar els coneixements teòrics a la pràctica.
  • CT12 - Aplicar el mètode científic.
  • CT13 - Reconèixer els aspectes generals i específics relacionats amb el camp de la nutrició i envelliment.
  • CT14 - Respectar els drets fonamentals d'igualtat entre homes i dones, i la promoció dels drets humans i els valors propis d'una cultura de pau i de valors democràtics.

Resultats d’aprenentatge de l’assignatura

Com a resultat daprenentatge específic daquesta menció es contemplen el següent:

- Aprendre a analitzar els problemes biomèdics ia identificar els aspectes que requereixen lús dinformació estructural. Aprendre a obtenir la informació estructural d'interès aplicant les tècniques de l'àmbit de la bioinformàtica estructural, com l'extracció d'informació estructural, el modelatge/predicció molecular, el maneig de bases de dades/generació de big data, etc. Aplicar el coneixement a la comprensió de la base molecular de les malalties hereditàries ia la predicció de la patogenicitat de les variants genètiques.

Continguts

La bioinformàtica com a eina per gestionar informació heterogènia, extreure coneixements sobre problemes clínics/biomèdics, des del diagnòstic d'imatge fins a la identificació de variants genètiques patògenes. En Struc. Bioinf. ens centrem en aquests problemes que ocorren a nivell molecular. La majoria d'ells estan relacionats amb la visió molecular de la malaltia, especialment la malaltia genètica. Exemples: variants patògenes en seqüència codificant i no codificant. Aquestes variants provoquen un mal funcionament molecular; per entendre aquest mal funcionament hem d'entendre primer la funció i això significa mirar l'estructura. És important tenir en compte que la informació que tenim sobre l'estructura determinarà el que sabem sobre la funció. És a dir: la qualitat determina la utilitat.
Preguntes rellevants: (i) com determinar quin nivell d'informació volem; (ii) com extreu informació en 3D; (iii) com concloure del que tenim? (buscar la coherència entre diferents fonts d'evidència), especialment en el context d'aplicacions biomèdiques.

A. ESTRUCTURA: EL LOCUS DE LA FUNCIÓ
1) PRINCIPIS DE BIOLOGIA ESTRUCTURAL
1.1 Funció a nivell de seqüència.
• Classe magistral

  • Dominis, regions desordenades, regions repetitives.
  • Valor i limitacions. És útil per a una primera valoració de l'impacte de les variants proteiques; insuficient per a una comprensió més profunda. No té valor per al disseny de fàrmacs, ni per a una interpretació mecanicista de la malaltia

• Mètodes de casos

  • UniProt: el recurs més important d'informació general sobre proteïnes.
  • Recursos específics per a dominis funcionals, regions desordenades i repetitives. PFAM i SMART.


1.2 L'estructura de les macromolècules
• Classe magistral

  • Què entenem per estructura? Exemples de 3D per a diferents macromolècules, per exemple, proteïnes, ARN, DNA i estructura de la cromatina.
  • Aspectes clau rellevants de la funció que depenen de l'estructura: estabilitat i interaccions (el paper de l'entorn)


1.3 Relacionar estructura amb funció.

  • Classe magistral
  • L'ampli espectre de funció de les proteïnes. Anticòs, hemoglobina, a-galactosidasa, BRCA1, etc. Proteïnes del clar de lluna.
  • ADN: l'estructura del codi genètic
  • Cromatina: l'empaquetament és la clau de la compactació. Però també requereix desembalar.


• Mètodes de casos.

  • PDB: La comprensió experimental de l'estructura i les bases de dades d'emmagatzematge. PDB. EMDB.


1.4 Quines parts de l'estructura són rellevants per a la funció? Depèn de la proteïna. Com ens permet la bioinformàtica conèixer-los?
• Classe magistral.

  • Comprensió de l'estructura I. (i) La jerarquia de l'estructura de les proteïnes: 1D, 2D, 3D i quaternari. (ii) Nucli/Superfície. (iii) La necessitat de tenir una estructura 3D en molts problemes.
  • Comprensió de l'estructura II. (i) La xarxa d'interaccions atòmiques. No totes les interaccions són iguals (ii) L'energia de les estructures 3D. Prediccions d'estabilitat de proteïnes (iii) Complexos proteics.
  • Comprensió de l'estructura III. Proteïnes/regions desordenades. Recursos


B. ÚS DE LA BIOINFORMÀTICA PER GENERAR INFORMACIÓ ESTRUCTURAL
2) EXTRACCIÓ D'INFORMACIÓ DE L'ESTRUCTURA: EXPLORACIÓ VISUAL I ANÀLISIS COMPUTACIONALS.
• Classe magistral.

  • Com recuperar informació estructural experimental: (i) nom de proteïna/gen (uniprot); (ii) seqüència d'explosio Possibles situacions: sempre està disponible l'estructura?
  • Trieu el vostre programari de visualització: PyMol / VMD
  • Què mirar? Les diferents representacions que podem triar: alfa, cadena principal, tots els àtoms, se centren en regions locals.
  • Aclarir el teu objectiu: entendre la contribució d'un residu a l'estabilitat o la seva interacció amb altres molècules, definir la quantitat de treball
  • Eines: Arpegi, Corda.
  • Aneu amb compte amb el que analitzeu: algunes estructures no tenen sentit biològicament, p. contactes de cristall, etc. Treballar amb el monòmer és l'opció més segura, llegir els documents originals és el següent pas, consultant webs especialitzades com Eldorado (per a RMN) o complexos biològics a l'EBI.


• Mètodes de casos:

  • PYMOL: Representant variants de la seqüència de proteïnes


3) GENERACIÓ D'INFORMACIÓ ESTRUCTURAL: PREDICCIÓ DE L'ESTRUCTURA
3.1 De la seqüència a l'estructura: un problema clau.
• Classe magistral.

  • Com la seqüència determina el 3D. Per què la predicció és un problema tan difícil?
  • Alternatives: la relació més fonamental en biologia molecular: conservació vs estructura/estabilitat
  • Un altre principi fonamental: la conservació de l'estructura més enllà de la identitat de la seqüència


• Mètodes de casos:
o Homologia. Alineació i comparació de seqüències.
o Construcció i comprensió de MSA: comparació de seqüències generalitzades a moltes seqüències. Un problema difícil: NP-complet. Eines principals: clustal, T-Coffee, Muscle, etc. Representació i edició de MSA.

• Mètodes de casos:

  • Comparació d'estructures. Anar més enllà de la semblança de seqüències: alinear diferents versions de la mateixa estructura. Trobar com de semblants són les diferents estructures. Comparació d'estructures: DALI. Classificació de l'estructura: CATH, SCOP.

3.2 Homologia/modelització comparada.
• Classe magistral

  • Predicció de l'estructura d'homòlegs propers
  1. El pipeline de modelització comparada
  2. Controls de qualitat: PROSA, llistats de programes, etc
  3. Modelatge en línia: SwissProt
  • Predicció de l'estructura d'homòlegs/paràlegs remots: threading
  • L'espai de plec
  • Threading: principis i eines.


• Classe magistral

  • Predicció de l'estructura ab initio. AlphaFold: el nou paradigma.


3.3. Prediccions de trastorns.
• Classe magistral.

  • Estat desordenat
  • Trastorn predictiu


4) APLICACIÓ DE LA BIOINFORMÀTICA ESTRUCTURAL EN BIOMEDICINA
5) APLICACIÓ DE L'APRENENTATGE MÀQUIN PER ENTENDER LA MALALTIA
• Classe magistral.

  • Una introducció lleu a la intel·ligència artificial i l'aprenentatge automàtic.


• Mètodes de casos.

  • Construcció d'un model d'aprenentatge automàtic: quatre passos principals
  • Recuperació de variants de la seqüència de proteïnes. Clinvar. HGMD. Mapejar variants de la nostra proteïna: quina informació necessitem saber.
  • Generar prediccions de patogenicitat per a les nostres variants. Polyphen-2, SIFT, PON-P2, CADD, REVEL, EVE, etc.
  • Predicció de l'impacte funcional vs. fenotip clínic.


Classes magistrals: 15 hores 

Métodos del Caso: 15 hores

Pràctiques: 0 hores

 

Metodologia i activitats formatives

Modalitat totalment presencial a l'aula



  • Classes magistrals: exposició durant 50 minuts d'un tema teòric per part del professor.
  • Casos clínics o mètodes del cas (MC): Plantejament d'una situació real o imaginaria. Els alumnes treballen les preguntes formulades en grups reduïts o en interacció activa amb el professor i es discuteixen les respostes. El professor intervé activament i fa falta aportar nous coneixements.

Educació virtual (EV): Material en línia que l'alumne pot consultar des de qualsevol ordinador, a qualsevol hora i que contribuirà a l'autoaprenentatge de conceptes relacionats amb l'assignatura.

 

Sistemes i criteris d'avaluació

Modalitat totalment presencial a l'aula



1. Alumnes en primera convocatòria:
Resolució de mètodes del cas: 35%
Examen final: 50%
Presentació d'un article científic: 15%
2. Alumnes en segona convocatòria posterior: els mateixos criteris que en la primera convocatòria. La nota d'avaluació continuada i participació es guardarà.
Punts generals a tenir en compte sobre el sistema d'avaluació:

  • 1. Per poder fer mitjans, a l'examen final haurà d'obtenir un 5 de nota mínima.
  • 2. L'assistència a mètodes del cas és obligatori.
  • 3. Per participació en classe per atendre l'aportació d'idees interessants o el plantament de preguntes pertinents que ajuden a millorar la qualitat de la sessió, ia la lectura magistral o mètodes del cas.
  • 4. L'assistència a les classes teòriques no és obligatòria, però els assistents tindran que regir per les normes que indiquen els professors. En cas de no arribar puntual, entrar en silenci sense molestar o interrompre a la classe. En cas de no assistir un mínim del 65%, la participació en classe serà puntuada de forma molt reduïda.

 

Bibliografia i recursos

  • Kessel, A. i Ben-Tal, N. (2018). Introducció a les proteïnes: estructura, funció i moviment. Chapman i Hall/CRC.
  • Xiong, J. (2006). Bioinformàtica essencial. Cambridge University Press
  • Creighton, Thomas E. La química biofísica dels àcids nucleics i les proteïnes. Helvetian Press, 2010
  • PETER ALAN & Tompa FERSHT Estructura i funció de les proteïnes intrínsecament desordenades / per Peter Tompa, Fersht Alan Publications. 2010