PRÁCTICA 15 Teórica de secuenciación

INTRODUCCION:

Para la revisión de secuencias de ADN y la exploración de la página WEB del GeneBank se explican los pasos de las metodologías que se utilizarán.

Para el reporte de práctica se recomienda investigar el marco de referencia teórico de la sesión, así como la introducción para el reporte, por parte del estudiante

Secuenciación

Durante 1977, Frederick Sanger utilizando un método basado en la síntesis enzimática de cadenas de ADN complementarias a la cadena a secuenciar, empleando un método de marcación radioactiva desarrollado por Allan Maxam y Walter Gilbert. Con el método de Sanger a partir de un hilo de un fragmento del genoma se sintetiza al hilo complementario, con cuatro reacciones enzimáticas.

Durante 1977, se podían secuenciar hasta 100 bases por experimento, utilizando marcadores radioactivos y actualmente, existen equipos que pueden secuenciar hasta unos cientos o unos miles de bases. La mayoría de los equipos son para menos de 1000 bases, y utilizan marcadores colorimétricos, de más fácil manejo y que combinan los métodos de PCR.

 

Secuenciación Masiva

El acelerado crecimiento tecnológico para el estudio del ADN, brindo diversas herramientas para incrementar la velocidad de secuenciación así como el desarrollo de estrategias alternas como lo es la pirosecuenciación. Consideremos que los métodos tradicionales de secuenciación permiten analizar en una electroforesis capilar una muestra de entre 100 a 1000 pares de bases, por lo que evaluar un genoma completo implica el análisis de fragmento en fragmento hasta completarlo, lo que implica el consumo de grandes cantidades de materiales y equipos.

Con la pirosecuenciación se puede evaluar todo un genoma en un experimento. La forma que se lleva a cabo es a nanoescala, en donde todo el genoma se fragmenta en hilos individuales de entre 300 y 1000 pares de bases. Cada hilo se polimeriza en una reacción en donde al unirse cada una de las bases se une liberando dos grupos fosfatos que reaccionan con una enzima emitiendo un brillo que es captado y se almacena dicha información. La base de datos generada incluye la secuencia de cada uno de los hilos que se analiza, de tal forma que se obtienen millones de secuencias cortas. Posteriormente con paquetería para el análisis masivo de datos, se efectúa el análisis. 

Un experimento de pirosecuenciaciòn se puede ensamblar la secuencia completa de un organismo procariote, que tiene hasta 6,000,000 de pares de bases. La misma técnica tiene otras aplicaciones, entre las que se incluyen diversos análisis metagenómicos, en la cual se pueden analizar e identificar numerosas especies de microrganismos de una muestra. Otras de las aplicaciones incluyen el descubrimiento de secuencias microsatelites o SNP, para especies poco estudiadas.

 

Competencia: Aplicar técnicas de replicación artificial de ADN para analizar sus fases con actitud crítica y profesional

 

Materiales y Equipos

¿Qué debe llevar al laboratorio?

Equipo de computo

Metodología.

Secuencias en GENE BANK

 

El acceso al “Gene Bank” es público, de tal forma que de cualquier equipo se puede ingresar a la siguiente liga:

                http://www.ncbi.nlm.nih.gov/

El sitio WEB es muy grande, con diversas herramientas y paquetes de información, por lo que se le recomienda explorarlo muy ampliamente.

Para revisar algunas de las secuencias disponibles, en la barra de búsqueda anote el nombre de una especie, por ejemplo, el nombre de la trucha en inglés “trout” o si lo desea su nombre científico Oncorhynchus mykiss.

La página que se despliega muestra todos los registros que se tienen en bibliografía (Literature), aspectos relacionados con la salud (Health), genomas (Genomes), genes (Genes), proteínas (Proteins) y aspectos relacionados con la química (Chemicals).

En genomas puede dar click en botón izquierdo del ratón con el cursor señalando la palabra “Nucleotide”. Al momento que se despliega la nueva página puede visualizar en números en color café, el número de entradas (secuencias) que están registradas.

En letras color azul se indica el nombre de cada una de las entradas, señalando el nombre del gen o de la secuencia específica. Al click con el cursor señalando las letras color azul, aparece el registro correspondiente, con una amplia información relativa a la secuencia.

En cada registro se detalla diversos aspectos, por ejemplo, quien descubrió la secuencia, para que estudio y si este ya se publicó en alguna obra científica. También puede encontrar la traducción de la secuencia a proteínas indicado con el código de una letra:

 

Aminoácido

Código de tres letras

Código de una letra

Alanina

Ala

A

Arginina

Arg

R

Asparagina

Asn

N

Ácido aspártico

Asp

D

Cisteína

Cys

C

Glutamina

Gln

Q

Ácido glutámico

Glu

E

Glicina

Gly

G

Histidina

His

H

Isoleucina

Ile

I

Leucina

Leu

L

Lisina

Lys

K

Metionina

Met

M

Fenilalanina

Phe

F

Prolina

Pro

P

Serina

Ser

S

Treonina

Thr

T

Triptófano

Trp

W

Tirosina

Tyr

Y

Valina

Val

V

 

La secuencia esta numerada a partir de la primera base del gen o de la primera base adecuadamente reconocida y validada.

En la misma página, con letras en color azul, en el área central al inicio de la pantalla, podrá encontrar la palabra “Send”. Cuando da click, se despliega un menú, en el que señalando alguna de las opciones puede descargar la entrada completa en su computadora. En nuestro caso le recomiendo señale “Complete Record” y en la sección “Choose destination” indique “File”. Para descargar elija el formato “Fasta”, el cual es reconocido por una amplia diversidad de aplicaciones.

El archivo descargado lo puede abrir con cualquier paquete para leer textos, por ejemplo, con “notepad” y podrá observar que el formato Fasta tiene diversas particularidades. Primero están los identificadores de la entrada en el “Gene Bank” y posteriormente la secuencia completa sin espaciadores, escrita a renglón continuo. Por supuesto, existen diversas aplicaciones que pueden interpretar y analizar la o las secuencias que descargue.

Dentro del sitio del “Gene Bank”, en todas sus páginas dentro de la sección de “Nucleotide”, se mantiene la barra de búsqueda, por lo que, en cualquier momento puede iniciar una nueva búsqueda o realizarla en forma más específica.

Blast

La consulta y revisión de secuencias puede realizarse con la estrategia denominada “Blast”, con la cual a partir de una secuencia se puede realizar el contraste con todas las que están alojadas en el “Gene Bank”.

Como ejemplo descargue una secuencia en formato Fasta y posteriormente abra el archivo con la aplicación “Notepad”, posteriormente utilizando los comandos –control-C-, copie exclusivamente la secuencia o una parte de la misma.

En la página del “Gene Bank” ingrese utilizando la liga “BLAST” ubicada al lado derecho de la página principal. Posteriormente en la imagen donde están las palabras “Nucleotide BLAST”, ingrese dando click en el icono.

En el espacio ubicada abajo del texto “Enter accession number(s), gi(s), or FASTA sequence(s)”, coloque el cursor y con los comandos –control-v-, pegue la secuencia que había copiado previamente. En la parte inferior de la página se encuentra un botón azul con el texto “BLAST”. Aparecerá una pantalla temporal en lo que se realiza la búsqueda.

En la pantalla aparecerá un gráfico con el encabezado “Distribution of 100 Blast Hits on the Query Sequence”. Las líneas rojas representan las primeras secuencias con un alto grado de similitud. Cuando pasa el cursor en cada línea, aparecen caracteres básicos de cada secuencia encontrada. Puede acceder a una mayor información avanzando hacia abajo en la página o dando click con el cursor señalando la línea roja.

En cada secuencia puede encontrar los estadígrafos básicos del análisis y la comparación base por base entre la secuencia que envió y las que encontró el sistema BLAST.

En la cabecera de la pantalla también podrá encontrar otras opciones de análisis, como, por ejemplo: “Search Summary [Taxonomy reports] [Distance tree of results]”.

El Gene Bank tiene una amplia diversidad de herramientas, así como un amplio menú de ayudas. Vale la pena una amplia revisión de los contenidos.

 

 

adn