Pasar al contenido principal

Universitat Internacional de Catalunya

Bioinformática Estructural

Bioinformática Estructural
3
14864
4
Primer semestre
op
Lengua de impartición principal: inglés

Otras lenguas de impartición: catalán, castellano

Profesorado


Las dudas seran resueltas aantes o después de la clase. Para resolver dudas de forma no presencial se hará mediante videoconferencia.


Presentación

En esta asignatura se proporcionan los conceptos fundamentales para el uso de la información estructural en problemas biomédicos/clínicos. Para ello se abordará la relación fundamental entre estructura y función, analizando las estructuras tridimensionales de proteínas, ADN y ARN. Veremos cómo procesar gráfica y automáticamente las estructuras tridimensionales de las macromoléculas. Posteriormente veremos las diferentes metodologías para generar información estructural mediante metodologías punteras que incluyen algoritmos de Inteligencia Artificial. Finalmente veremos cómo podemos utilizar la bioinformática estructural para abordar problemas biomédicos relacionados con la comprensión molecular de las enfermedades hereditarias.


Requisitos previos

Se recomienda haber cursado y superado: 

  • Introducción a la bioinformática 

  • Interacciones biomoleculares

Objetivos

  • Comprender cómo la relación entre estructura y función es la base de la aplicación de los métodos de bioinformática estructural en biomedicina

  • Saber generar información estructural: diferencia entre extracción y predicción 

  • Utilizar la información estructural para analizar la información genética y resolver problemas biomédicos/clínicos asociados

Competencias/Resultados de aprendizaje de la titulación

  • CB01 - Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  • CB03 - Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CB04 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • CB05 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.
  • CE07 - Aplicar las herramientas estadísticas a estudios en Ciencias de la Salud.
  • CE19 - Reconocer los principios de las ciencias biomédicas relacionadas con la salud y aprender a trabajar en cualquier ámbito de las ciencias biomédicas (empresa biomédica, laboratorios de bioinformática, laboratorios de investigación, empresa de análisis clínicos, etc.).
  • CG07 - Integrar los conceptos básicos relacionados con el campo de la biomedicina tanto a nivel teórico como experimental.
  • CG10 - Diseñar, redactar y ejecutar proyectos relacionados con el área de las ciencias biomédicas.
  • CG11 - Reconocer conceptos básicos de diferentes ámbitos vinculados a las ciencias biomédicas.
  • CT01 - Desarrollar la capacidad de organización y planificación adecuadas al momento.
  • CT02 - Desarrollar la capacidad para la resolución de problemas.
  • CT03 - Desarrollar la capacidad de análisis y síntesis.
  • CT04 - Interpretar resultados experimentales e identificar elementos consistentes e inconsistentes.
  • CT05 - Usar internet como medio de comunicación y como fuente de información.
  • CT06 - Saber comunicar, hacer presentaciones y redactar trabajos científicos.
  • CT07 - Ser capaz de trabajar en equipo.
  • CT08 - Razonar y evaluar las situaciones y resultados desde un punto de vista crítico y constructivo.
  • CT09 - Tener la capacidad de desarrollar habilidades en las relaciones interpersonales.
  • CT10 - Ser capaz de llevar a cabo un aprendizaje autónomo.
  • CT11 - Aplicar los conocimientos teóricos a la práctica.
  • CT12 - Aplicar el método científico.
  • CT13 - Reconocer los aspectos generales y específicos relacionados con el campo de la nutrición y envejecimiento.
  • CT14 - Respetar los derechos fundamentales de igualdad entre hombres y mujeres, y la promoción de los derechos humanos y los valores propios de una cultura de paz y de valores democráticos.

Resultados de aprendizaje de la asignatura

Como resultado de aprendizaje específico de esta mención se contemplan el siguiente:

- Aprender a analizar los problemas biomédicos y a identificar los aspectos que requieren el uso de información estructural. Aprender a obtener la información estructural de interés aplicando las técnicas del ámbito de la bioinformática estructural, tales como la extracción de información estructural, el modelado/predicción molecular, el manejo de bases de datos/generación de big data, etc. Aplicar el conocimiento a la comprensión de la base molecular de las enfermedades hereditarias y a la predicción de la patogenicidad de las variantes genéticas.


Contenidos

La bioinformática como herramienta para gestionar información heterogénea, extrayendo conocimiento sobre problemas clínicos/biomédicos, desde el diagnóstico por imagen hasta la identificación de variantes genéticas patógenas. En Struc. Bioinf. nos centramos en aquellos problemas que ocurren a nivel molecular. La mayoría de ellos están relacionados con la visión molecular de la enfermedad, especialmente la enfermedad genética. Ejemplos: variantes patógenas en secuencia codificante y no codificante. Estas variantes causan mal funcionamiento molecular; para entender este mal funcionamiento necesitamos entender primero la función y esto significa observar la estructura. Es importante señalar que la información que tenemos sobre la estructura determinará lo que sabemos sobre la función. Es decir: la calidad determina la utilidad.
Preguntas relevantes: (i) cómo determinar qué nivel de información queremos; (ii) cómo extraemos información 3D; (iii) cómo sacar conclusiones de lo que tenemos (buscando consistencia entre diferentes fuentes de evidencia), particularmente en el contexto de aplicaciones biomédicas.

A. ESTRUCTURA: EL LUGAR DE LA FUNCIÓN
1) PRINCIPIOS DE BIOLOGÍA ESTRUCTURAL
1.1 Función a nivel de secuencia.
• Clase magistral

  • Dominios, regiones desordenadas, regiones repetitivas.
  • Valor y limitaciones. Es útil para una primera evaluación del impacto de las variantes de proteínas; inadecuada para una comprensión más profunda. No tiene valor para el diseño de fármacos ni para una interpretación mecanicista de la enfermedad.


• Métodos de casos

  • UniProt: el recurso más importante para obtener información general sobre proteínas.
  • Recursos específicos para dominios funcionales, regiones desordenadas y repetitivas. PFAM y SMART.


1.2 La estructura de las macromoléculas
• Clase magistral

  • ¿Qué queremos decir con estructura? Ejemplos de 3D para diferentes macromoléculas, p. ej., proteínas, ARN, ADN y estructura de la cromatina.
  • Aspectos clave relevantes de la función que dependen de la estructura: estabilidad e interacciones (el papel del entorno)


1.3 Relación entre la estructura y la función.
• Clase magistral

  • El amplio espectro de la función de las proteínas. Anticuerpos, hemoglobina, a-galactosidasa, BRCA1, etc. Proteínas Moonlighting.
  • ADN: la estructura del código genético
  • Cromatina: el empaquetamiento es la clave para la compactación. Pero también requiere desempaquetamiento.


• Métodos de casos.

  • PDB: La comprensión experimental de la estructura y las bases de datos de almacenamiento. PDB. EMDB.


1.4 ¿Qué partes de la estructura son relevantes para la función? Depende de la proteína. ¿Cómo nos permite la bioinformática conocerlas?
• Clase magistral.

  • Entendiendo la estructura I. (i) La jerarquía de la estructura de las proteínas: 1D, 2D, 3D y cuaternaria. (ii) Núcleo/Superficie. (iii) La necesidad de tener una estructura 3D en muchos problemas.
  • Entendiendo la estructura II. (i) La red de interacciones atómicas. No todas las interacciones son iguales (ii) La energética de las estructuras 3D. Predicciones de estabilidad de proteínas (iii) Complejos proteicos.
  • Entendiendo la estructura III. Proteínas/regiones desordenadas. Recursos


B. USO DE BIOINFORMÁTICA PARA GENERAR INFORMACIÓN ESTRUCTURAL
2) EXTRACCIÓN DE INFORMACIÓN DE LA ESTRUCTURA: EXPLORACIÓN VISUAL Y ANÁLISIS COMPUTACIONAL.


• Clase magistral.

  • Cómo recuperar información estructural experimental: (i) nombre de proteína/gen (uniprot); (ii) secuencia blast
  • Posibles situaciones: ¿la estructura siempre está disponible?
  • Elige tu software de visualización: PyMol / VMD
  • ¿Qué mirar? Las diferentes representaciones que podemos elegir: Calpha, cadena principal, todos los átomos, enfocarse en regiones locales.
  • Aclarar tu objetivo: entender la contribución de un residuo a la estabilidad o su interacción con otras moléculas, definir la cantidad de trabajo
  • Herramientas: Arpeggio, String.
  • Ten cuidado con lo que analizas: algunas estructuras no son significativas biológicamente, p. ej. contactos de cristales, etc. Trabajar con el monómero es la opción más segura, leer los artículos originales es el siguiente paso, consultar sitios web especializados como Eldorado (para RMN) o complejos biológicos en el EBI.


• Métodos de caso:

  • PYMOL: Representación de variantes de secuencias de proteínas


3) GENERACIÓN DE INFORMACIÓN ESTRUCTURAL: PREDICCIÓN DE ESTRUCTURA
3.1 De la secuencia a la estructura: un problema clave.
• Clase magistral.

  • Cómo la secuencia determina el 3D. ¿Por qué la predicción es un problema tan difícil?
  • Alternativas: la relación más fundamental en biología molecular: conservación vs. estructura/estabilidad
  • Otro principio fundamental: la conservación de la estructura más allá de la identidad de secuencia


• Métodos de caso:

  • Homología. Alineamiento y comparación de secuencias.
  • Construcción y comprensión de MSA: generalización de la comparación de secuencias a muchas secuencias. Un problema difícil: NP-completo. Herramientas principales: clustal, T-Coffee, Muscle, etc. Representación y edición de MSA.


• Métodos de casos:

  • Comparación de estructuras. Más allá de la similitud de secuencias: alineando diferentes versiones de la misma estructura. Hallando cuán similares son las diferentes estructuras. Comparación de estructuras: DALI. Clasificación de estructuras: CATH, SCOP.

3.2 Homología/modelado comparativo.
• Clase magistral

  • Predicción de la estructura de homólogos cercanos
  1. El flujo de trabajo del modelado comparativo
  2. Controles de calidad: PROSA, listados de programas, etc.
  3. Modelado en línea: SwissProt
  • Predicción de la estructura de homólogos/parálogos remotos: enhebrado
  • El espacio de pliegues
  • Enhebrado: principios y herramientas.


• Clase magistral

  • Predicción de la estructura ab initio. AlphaFold: el nuevo paradigma.


3.3. Predicciones de desorden.
• Clase magistral

  • Estado desordenado
  • Predicción de desorden


4) APLICACIÓN DE LA BIOINFORMÁTICA ESTRUCTURAL EN BIOMEDICINA
5) APLICACIÓN DEL APRENDIZAJE AUTOMÁTICO PARA ENTENDER LAS ENFERMEDADES
• Clase magistral.

  • Una introducción ligera a la inteligencia artificial y al aprendizaje automático.


• Métodos de casos.

  • Construcción de un modelo de aprendizaje automático: cuatro pasos principales o Recuperación de variantes de secuencia de proteínas. Clínvar. HGMD. Mapeo de variantes de nuestra proteína: qué información necesitamos saber.
  • Generar predicciones de patogenicidad para nuestras variantes. Polyphen-2, SIFT, PON-P2, CADD, REVEL, EVE, etc. o Predicción del impacto funcional vs. fenotipo clínico.


Clases magistrales: 15 horas 

Métodos del Caso: 15 horas 

Prácticas: 0 horas




Metodología y actividades formativas

Modalidad totalmente presencial en el aula



 

Metodología y actividades formativas (totalmente presencial) 

  • Clases magistrales: exposición durante 50 minutos de un tema teórico por parte del profesor.
  • Casos clínicos o métodos del caso (MC): Planteamiento de una situación real o imaginaria. Los alumnos trabajan las preguntas formuladas en grupos reducidos o en interacción activa con el profesor y se discuten las respuestas. El profesor interviene activamente y si hace falta aporta nuevos conocimientos.

Educación virtual (EV): Material en línea que el alumno puede consultar desde cualquier ordenador, a cualquier hora y que contribuirá al autoaprendizaje de conceptos relacionados con la asignatura.

 


Sistemas y criterios de evaluación

Modalidad totalmente presencial en el aula



  1. Alumnos en primera convocatoria:   

Resolución de métodos del caso: 35%

Examen final: 50%

Presentación de un artículo científico: 15%

2. Alumnos en segunda o posterior convocatoria: mismos criterios que en la primera convocatoria. La nota de evaluación continuada y participación se guardará. 

Puntos generales a tener en cuenta sobre el sistema de evaluación:  

  • Para poder hacer media, en el examen final se deberá obtener un 5 de nota mínima.
  • La asistencia a métodos del caso es obligatoria.
  • Por participación en clase se entiende la aportación de ideas interesantes o el planteamiento de cuestiones pertinentes que ayuden a mejorar la calidad de la sesión, ya sea lección magistral o métodos del caso.
  • La asistencia a las clases teóricas no es obligatoria, pero los asistentes se tendrán que regir por las normas que indiquen los profesores. En caso de no llegar puntual, entrar en silencio sin molestar o interrumpir a la clase. En caso de no asistir un mínimo del 65%, la participación en clase será puntuada de forma muy reducida.

Bibliografía y recursos

  • Kessel, A., & Ben-Tal, N. (2018). Introduction to proteins: structure, function, and motion. Chapman and Hall/CRC.
  • Xiong, J. (2006). Essential bioinformatics. Cambridge University Press
  • Creighton, Thomas E. The biophysical chemistry of nucleic acids & proteins. Helvetian Press, 2010 
  • PETER ALAN & Tompa FERSHT Structure and function of intrinsically disordered proteins / by Peter Tompa, Fersht Alan Publications. 2010