Manual Operativo

ussmmanual    biotecnologia    unam

Contenido:


Misión
Ofrecer servicios de secuenciación masiva de ADN, novedosas y a la vanguardia, a la comunicad científica, tanto de instituciones públicas como privadas, organismos gubernamentales y empresas privadas, impulsando áreas científicas estratégicas comoson la genómica y la bioinformática.

Visión
Que la UNAM se posicione a la vanguardia en el uso de las más novedosas y eficientes metodologías para el desarrollo de la genómica, contando con la infraestructura mas actual a nivel mundial, que impulse y potencialice el trabajo genómico de la comunidad científica y el sector productivo nacional.

Objetivos
La UUSMB fue establecida a instancia de la Coordinación de la Investigación Científica, las facultades de Química y Medicina, los Institutos de Biotecnología, Neurobiología e Investigaciones Biomédicas y del Centro de Ciencias Genómicas, todas ellas entidades académicas de la UNAM. Los objetivos de la UUSMB son:

  • Ofrecer a la comunidad científica y al sector productivo nacional e internacional servicios de secuenciación masiva de DNA utilizando tecnologías de última generación.
  • Desarrollar y optimizar metodologías para la preparación y secuenciación de bibliotecas de ácidos nucleicos de cualquier origen.
  • Formar recursos humanos altamente especializados en las tecnologías de secuenciación masiva y en el análisis bioinformático relacionado.
  • Fortalecer el desarrollo de la bioinformática, así como el uso, desarrollo e implementación de sus herramientas.


Justificación
Actualmente México cuenta con muy pocas unidades de secuenciación masiva que ofrezcan servicios a la comunidad científica o al sector productivo nacional de manera comercial. Los Institutos de investigación que poseen este tipo de tecnologías las utilizan para la realización de proyectos propios y cuando se logra obtener el servicio es a través de acuerdos de colaboración. Es por esta razón que un grupo de Entidades Universitarias junto con la Coordinación de la Investigación Científica lograron concretar la instalación de la UUSMB.


Personal Adscrito a la UUSMB
Actualmente laboran en la UUSMB dos académicos, el Dr. Ricardo Grande como jefe operativo de la unidad y la M. en C. Verónica Jiménez-Jacinto encargada del área de bioinformática, teniendo como Investigador responsable al Dr. Enrique Morett.


Comité Técnico
El comité técnico de la UUSMB está constituido por un representante de cada una de las entidades que conforman el consorcio que adquirió el equipo de secuenciación y que fueron designados por cada uno de los directores de las dependencias correspondientes. De esta forma el comité técnico está conformado por los siguientes representantes:

Instituto de Biotecnología:

Responsable Académico de la UUSMB: Dr. Enrique Morett

Jefe Operativo UUSMB: Dr. Ricardo Grande

Instituto de Investigaciones Biomédicas: Dr. Alfonso León del Río

Instituto de Neurobiología: Dra. Anaid Antaramián

Facultad de Química: Dr. Felipe Cruz García

Facultad de Medicina: Maria del Carmen Jiménez Martinez. Suplente y Dr Juan Carlos Zenteno.

Centro de Ciencias Genómicas: Dr. Miguel ángel Cevallos


Infraestructura de equipo y espacios disponibles.
La UUSMB está ubicada en el Instituto de Biotecnología, en Cuernavaca, Morelos. Cuenta actualmente con un equipo de secuenciación masiva de DNA de última generación, el Genome Analyzer IIx (GAIIx) de la compañía Illumina para secuenciar bibliotecas de DNA o cDNA. Este equipo está complementado con un módulo para la generación de arreglos de DNA (cluster generation), un módulo adicional utilizado para la preparación de lecturas dobles (paired end module) y un servidor de discos con 3 Terabytes (TB) de capacidad para almacenar información de manera transitoria. La unidad cuenta también con un Bioanalizador de la marca Agilent Technologies (Bioanalyzer 2100) para realizar electroforesis en capilar y una campana de bioseguridad tipo II/A2 para la preparación de bibliotecas en condiciones controladas. La UUSMB cuenta además con equipo menor necesario para la construcción y secuenciación de las bibliotecas como son: dos sistemas de electroforesis horizontal y uno vertical marca Biorad; un sistema de foto documentación de imágenes UVP; una microcentrifuga ventilada y otra refrigerada marca Eppendorf; minicentrifugas marca Labnet; y un concentrador de vacío marca Thermo Scientific. Contamos también con un baño de temperatura marca Labnet; un rotador de tubos marca Labnet; un congelar a -20° C y un refrigerador a 4° C ambos marca Sanyo; y también un horno de microondas.

Adicionalmente, la UUSMB cuenta con un cluster con 38 nodos de cálculos (164 cores en total), y tres servidores de discos con 27 TB de capacidad total en donde se almacena la información de las diferentes corridas. 35 nodos de cálculo con CPUs 2 dual core AMD opteron 2214 a 2.2Ghz con 4Gb de memoria y disco Seagate de 120 Gb y 3 nodos de cálculo con CPUs de 2 Quad-Core AMD Opteron(tm) con procesador 2354 2.2GHz, con 64 Gb de memoria y disco duro de 500 GB. Esta infraestructura computacional, aunque pertenece a la unidad, reside en la Unidad de Cómputo del Instituto de Biotecnología.


Descripción de la instalación UUSMB.
La unidad de secuenciación masiva está dividida en dos secciones de trabajo, una oficina y un área utilizada como bodega. El espacio total que actualmente ocupa la UUSMB es de 32 m2.

área de trabajo:
área de preparación de librerías. Aquí reside el equipo menor necesario para la preparación de las bibliotecas como termociclador y centrífugas, además de una campana de bioseguridad tipo II/A2.

área de Secuenciación. En esta área es en donde se realiza la preparación del chip de secuencia y la secuenciación de las bibliotecas. Aquí reside el equipo de secuenciación, el módulo para la generación de los arreglos de DNA (cluster generation), el módulo auxiliar para la realización de lecturas dobles (paired end) y el bioanalizador (Bioanalyzer 2100) para cuantificar las muestras a secuenciar.

La separación de las áreas de trabajo no está delimitada físicamente. La UUSMB cuenta con un ambiente controlado de temperatura constante a 20° C y una entrada de aire filtrado para evitar en lo posible la contaminación exterior en el momento de la preparación de las librerías.


Servicios que ofrece la UUSMB.
La UUSMB ofrece los servicios de preparación y secuenciación de bibliotecas de DNA a Investigadores nacionales o extranjeros, tanto a miembros del Instituto o de la UNAM, de otras Universidades o Institutos de Investigación superior o de dependencias gubernamentales.

El análisis final de los resultados de secuenciación masiva correrá a cargo de los usuarios.

Los servicios que ofrece la UUSMB son:

  • Preparación de bibliotecas de DNA o cDNA de cualquier organismo para lecturas sencillas o pareadas (multiplexing).
  • Secuenciación de bibliotecas de DNA o cDNA en la modalidad de lectura sencilla o doble para las siguientes aplicaciones:
    • Secuenciación genómica de novo.
    • Resecuenciación de genómas de cualquier organismo
    • análisiss de expresión y regulación génica (transcriptoma) con base en secuencia.
    • Descubrimiento de SNPs y análisis de variación estructural.
    • Descubrimiento y análisis de RNA’s pequeños (small RNA’s).
    • Detección de interacciones DNA-proteínas (ChIP-Seq).
    • Cuantificación de metilación de DNA basado en secuencia.
    • Secuenciación de librerías combinadas (multiplexing) para cualquier aplicación.
  • Asesoría en el análisis de datos generados por secuenciación masiva.
  • Análisis y cuantificación de muestras de DNA o RNA por electroforesis capilar.
  • Análisis de la calidad de las secuencias entregadas.


Costos de los servicios.
El costo por los servicios de preparación de librerías y secuenciación de las mismas varía dependiendo de la adscripción del solicitante. Para los Investigadores adscritos a cualquiera de las dependencias que participaron en la compra del equipo el precio por los servicios, los insumos necesarios para la preparación y secuencia de las librerías, tiene un descuento global de 50%. Para los usuarios que pertenezcan a instituciones de la UNAM pero que no son parte del consorcio, el descuento es de 30% al precio total, mientras que para los investigadores de otras universidades nacionales o extranjeras, así como para dependencias públicas nacionales, recibiran un descuento del 25% sobre el precio total. Mientras que para los usuarios de sector privado el precio no recibe ningun descuento. Para obtener una cotización a la medida solicite vái correo al Dr. Ricardo Grande: rgrande@ibt.unam.mx


Horarios de servicio
El horario de recepción de muestras es de las 8:00 a las 14:00 horas de lunes a viernes. Durante vacaciones no se recibirán muestras. Para asesorías sobre el análisis de resultados de secuenciación masiva, se deberá solicitar una cita con los responsables del área de bioinformática de la unidad cuando menos con tres días de anticipación. Toda solicitud de servicio será dirigida al Dr. Ricardo Grande, jefe operativo de la UUSMD.


Procedimientos y requisitos para solicitar el servicio
La solicitud de servicio deberá ser dirigida al Dr. Ricardo Grande, Jefe Operativo de la UUSMD. Todo material a secuenciar deberá venir claramente identificado, liofilizado o en el volumen y solución acordada siempre en hielo seco.

En la página de la Unidad se encuentran disponibles los protocolos para preparar diferentes tipos de muestras.

El personal de la UUSMD brindará asesoría a los responsables del proyecto que así lo soliciten, para proponer alternativas sobre el tipo de secuencia más apropiado y cómo realizar el análisis posterior. Regularmente una sola reunión con los usuarios es suficiente..

Requisitos:

Por el momento la UUSMD se hará cargo de la preparación de las librerías. En este sentido, la Unidad recibirá únicamente DNA o RNA como material inicial, es decir la unidad no purificará material genético de ningún tipo. El usuario proporcionará una fotografía de un gel en donde previamente haya corrido sus muestras y proporcionará la concentración mínima del material a secuenciar.

Secuenciación de DNA

  1. Para gDNA se requerirá de 3 a 5 microgramos (µg)1 totales de DNA determinado por fluorescencia.
  2. El material tiene que ser de la más alta calidad sin muestras aparentes de degradación cuando se corra en un gel y con una relación 260/280 entre 1.8 y 2.0.
  3. La concentración de las muestras debe de estar en un volumen máximo de 50 µL de TE o Elution Buffer. Es importante señalar que si las muestras están en un volumen mayor a 50 µL deberán concentrarse a través de vacío por lo que es importante que estén en Tris o agua ultrapura.

Para Bibliotecas Mate Pair se deben tomar en cuanta los siguientes puntos:

  1. Se requiere de 10 µg totales de DNA determinado por fluorescencia.
  2. El material tiene que ser de la más alta calidad sin muestras aparentes de degradación cuando se corra en un gel y con una relación 260/280 entre 1.8 y 2.0.
  3. La concentración de las muestras debe de estar en un volumen máximo de 50 µL de TE o Elution Buffer. Es importante señalar que si las muestras están en un volumen mayor a 50 µL deberán concentrarse a través de vacío por lo que es importante que estén en Tris o agua ultrapura.

Secuenciación de transcriptoma

  1. Para bibliotecas de mRNA se tiene que tomar en cuenta lo siguiente:
  2.  Se requieren 5-10 µg2 de RNA total determinado por fluorescencia.
  3. Las muestras deben estar en un volumen máximo de 25 µL de agua libre de RNAsas.
  4. El número de integridad de RNA (RIN RNA Integrity Number) debe ser mayor de 7 y las muestras deben tener una relación 28S/18S mayor de 1.6. La relación 260/280 nm deberá ser de entre 1.8 y 2.0. Todas estas cuantificaciones pueden ser hechas como parte del proceso de preparación de la biblioteca. Si después del análisis se decide no proceder con la preparación de la biblioteca se hará un cargo por la cuantificación de las muestras. De la misma forma, si después del análisis se decide continuar con la preparación de la biblioteca aun cuando los valores no son los adecuados, será bajo responsabilidad del usuario y si la preparación de la biblioteca falla, aun se cobrará por la preparación de la biblioteca.
  5. Es posible la preparación de la biblioteca a partir de 100 ng de mRNA purificado previamente, en este caso es responsabilidad del usuario la remoción completa de los rRNA’s y la UUSMD quedará exenta de responsabilidad alguna si al final de la corrida gran parte de las lecturas son de rRNA.

Para bibliotecas de smallRNA se tiene que tomar en cuenta lo siguiente:

  1. Se requieren 5-10 µg2 de RNA total
  2. Las muestras deben de estar en un volumen máximo de 5 µL de agua libre de RNAsas
  3. El número de integridad de RNA (RIN, RNA Integrity Number) debe ser mayor de 7 y las muestras deben tener una relación 28S/18S mayor de 1.6. La relación 260/280 deberá ser de entre 1.8 y 2.0 y la relación 260/230 debe ser cercana a 1.8. Todas estas cuantificaciones pueden ser hechas como parte del proceso de preparación de la biblioteca. Si después del análisis se decide no proceder con la preparación de la biblioteca se hará un cargo por la cuantificación de las muestras. De la misma forma, si después del análisis se decide continuar con la preparación de la biblioteca aun cuando los valores no son los adecuados, será bajo responsabilidad del usuario y si la preparación de la biblioteca falla, aun se cobrará por la preparación de la biblioteca.
  4. Es posible construir la biblioteca a partir de muestras de smallRNA preparadas previamente, en este caso es necesario utilizar la fracción completa de smallRNA’s purificada de muestras de 5-10 µg de RNA total. Será responsabilidad del usuario si al final el producto final no es suficiente para secuenciar.


Sobre las corridas
El número mínimo de muestras requeridas para comenzar una corrida será de 5, de tal manera que los usuarios tendrán que esperar a que este número de muestras se complete cuando así sea el caso. Las muestras a secuenciar se procesarán en estricto orden de solicitud pero de acuerdo a las siguientes limitaciones: Puesto que una corrida requiere de un mínimo de cinco muestras, de las siete posibles, para ser económicamente viable, y que las corridas varían de acuerdo a las aplicaciones, las muestras se procesarán tratando de maximizar dicho espacio.

3.- En ocasiones una corrida podría tener que esperar a que se junten suficientes muestras a secuenciar con la aplicación específica, en consecuencia, algunas muestras no serán procesadas en el orden de solicitud, sino en función de la optimización de los recursos.

4.- El tiempo de entrega de resultados dependerá de la aplicación, cantidad y tipo de muestras a secuenciar, anticipando que rara vez será menor a tres semanas.


Seguimiento del estado de los servicios en curso
A través de la pagina WEB http://www.uusmd.unam.mx/siuus/ los usuarios puedan acceder al estatus del servicio de sus muestras. Puesto que cada tipo de metodología requiere de una preparación particular, y que se requiere tener como mínimo 5 muestras para que el servicio sea económicamente viable, cuando el usuario haga su solicitud, el sistema lo colocará de manera automática en la lista correspondiente. El usuario podrá consultar en todo momento, el status de su solicitud y el número de solicitudes acumuladas del mismo tipo que la suya, de modo que sabrá en todo momento cuántas muestras faltan para iniciar la secuenciación. De esta manera el usuario podrá saber en qué fase se encuentran sus muestras en todo momento.

Entrega de Resultados
Una vez terminada la secuenciación y el análisis de calidad que garantice la confiabilidad de los resultados, el personal de la UUSMD se pondrá en contacto con el usuario a fin de entregar los archivos digitales que contienen los resultados finales de la secuenciación masiva mediante alguno de los siguientes mecanismos:

√ Disco duro externo: Este mecanismo se puede solicitar cuando:

  1. El usuario cuenta con este tipo de dispositivo de almacenamiento externo.
  2. El usuario quiere conservar una copia completa de la corrida con todos los archivos intermedios que son generados durante el proceso (imágenes, archivos de intensidades, archivos con y sin calidad, etc) y no solo los archivos finales.
  3. Cuando el tamaño total de una corrida no exceda la capacidad del dispositivo. Es decir, si la corrida tiene un tamaño por ejemplo de 1.3 Tb, el disco duró deberá tener al menos una capacidad de 1.3 Tb
  4. El usuario no cuente con un servidor para recibir los datos vía ftp y el tamaño de la corrida no permita entregarla vía DVD ó USB.

√ Vía scp ( Secure copy): Permite transferir archivos desde el cluster de IBT hacia una máquina remota, siempre y cuando cuente con ip. Hace uso del protocolo ssh ( secure Shell). El personal de la UUSMD requiere tener acceso a una cuenta y su password correspondiente en la máquina destino. En el caso de los usuarios en CCG, por ejemplo, la UUSMD, cuenta con acceso al servidor meyahil.ccg.unam.mx. Este mecanismo se recomienda para usuarios con cuentas en servidores con capacidad de procesamiento masivo.

√ Via cp: Cuando el usuario tiene cuenta en el cluster de ibt, el personal de la UUSMD, simplemente tranfiere los datos a una ruta indicada por usuario, siempre y cuando el usuario alla otorgado permisos de escritura para el usuario illumina del cluster y tenga espacio suficiente para recibir los datos.

√ En todos los casos anteriores, el usuario recibe, los archivos conteniendo las secuencias de mas alta calidad en formato fastq. El nombre de estos archivos en general sigue el siguiente formato

<NombreDelaMuestra>_<Tags>_<lane>_<Lectura>.fastq

Cuando el archivo fastq es demasiado grande, se generan varios archivos comprimidos con un numero consecutivo al final del nombre, cada uno de los cuales tiene a lo mas 4 millones de secuencias.

<NombreDelaMuestra>_<Tags>_<lane>_<Lectura>_<Num consecutivo>.fastq.gz

Generalmente, acompañando las secuencias, se entyrega un reporte cuantitativo y cualitativo describiendo la cantidad de secuencias genradas, porcentajes de composición por nucleotido, porcentajes de calidad por nucleotido y confiabilidad de los datos entregados, porcentajes de GC por nucleotido y vs. el porcentaje teórico esperado. Cuando se presenta el caso, lista de secuencias sobrerepresentadas. Para los casos de Pair End, gráfica de Distribución de los tamaño de inserto.

Dependiendo de la solicitud específica de cada usuario, puede recibir también los archivos con las secuencias alineadas vs. un genóma de referencia en formato bam.

Resguardo de los Datos
A partir de la fecha de término de la secuenciación, el usuario tendrá 2 meses para obtener (si así lo desea) un respaldo de los archivos correspondientes a sus secuencias. Pasado este periodo la UUSMD borrará los archivos no reclamados para así poder hacer espacio requerido para nuevas corridas. La eliminación de datos será de manera automática. Finalmente, la UUSMD no conservará ninguna de las muestras entregadas para secuenciar.

Una vez entregados los datos, la UUSMD devolverá el sobrante o desechará todas aquellas muestras que fueron entregadas para su análisis y las generadas durante el proceso de preparación y secuenciación. Cualquier asunto no contemplado en el presente manual será revisado de manera particular con él o los responsables de la unidad.

Cuernavaca, Mor. 25 de septiembre del 2012