Información

¿Cómo puedo encontrar la secuencia de ARNm de un gen procariota específico?

¿Cómo puedo encontrar la secuencia de ARNm de un gen procariota específico?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Lo que quiero averiguar es el inicio de la transcripción de un gen específico, cuánto tiempo dura la UTR antes de que comience la secuencia de codificación real.

He mirado varias bases de datos como NCBI Gene, Refseq o una especializada como PRODORIC. Pero ninguno de ellos contiene realmente la secuencia de ARNm o cualquier información sobre las partes no traducidas del ARNm. Solo la secuencia de codificación en sí.

¿Ese tipo de información simplemente no se anota para muchas bacterias? No estoy mirando organismos modelo como E. Coli o B. subtilis, pero hubiera esperado que hubiera alguna información disponible.

¿Existe una base de datos donde pueda encontrar las secuencias de transcripción reales de genes procarióticos?


Consultas específicas de ARNm

Agregue esto a su consulta NCBI:Y mrna [filtro]

Si no está disponible en las principales bases de datos, es posible que no se sepa.

Sin embargo, los datos de ARNm pueden ser oscuros de encontrar incluso en las principales bases de datos, pero deberían estar ahí. Me sorprendería que ese fuera el caso, sin embargo, dado que no está trabajando con organismos modelo, es posible que no haya nada disponible.

Cuando busque un gen de transcripción, NCBI tiene algunos consejos que puede ver aquí para buscar en su base de datos. El n. ° 8 puede ser relevante para usted, ya que es una forma de filtrar exclusivamente registros de ARNm.

Si no hay un grupo UniGene para este gen y organismo, realice una búsqueda en la base de datos de nucleótidos con el nombre del gen, el nombre del producto o el símbolo. Incluya el organismo en la búsqueda para encontrar los resultados más relevantes y filtre por secuencias de transcripción, por ejemplo:Citocromo cy rana toro [orgn] Y mrna [filtro].

Predicción de ARNm

Básico: Herramienta de traducción de ADN ExPasy

Avanzado: regrna 2

Suponiendo que las consultas avanzadas no revelen lo que necesita, es posible que pueda hacer algunas predicciones útiles antes de llevarlas al laboratorio. Hay un puñado de otras herramientas predictivas que tal vez puedan ayudarlo si esa es la única opción disponible. No puedo entender exactamente qué información tienes como entrada. Suponiendo que tenga la secuencia de ADN, comenzaría con la opción obvia: la herramienta de traducción de ADN ExPasy.

Entonces diría que regrna 2 podría guiarlo en la dirección correcta con respecto a elementos de traducción más sutiles.


¿Por qué la transcripción y la traducción procariotas pueden ocurrir simultáneamente?

Esto se debe a que no hay núcleo en procariotas que separa el transcripción y traducción proceso. Por lo tanto, cuando los genes bacterianos son transcrito luego las transcripciones comienzan a traducir inmediatamente. Transcripción procariota ocurre en el citoplasma junto a traducción y ambos procesos ocurren simultaneamente.

En segundo lugar, ¿pueden las células eucariotas someterse a transcripción y traducción simultáneamente? En un procariota celda, transcripción y traducción están acoplados, es decir, traducción comienza mientras el ARNm aún se está sintetizando. en un célula eucariota, transcripción ocurre en el núcleo, y traducción ocurre en el citoplasma.

Asimismo, la gente pregunta, ¿por qué la transcripción y la traducción pueden ser simultáneamente en procariotas pero no en eucariotas?

Transcripción procariota ocurre en el citoplasma junto a traducción. La transcripción y traducción procarióticas pueden ocurrir simultaneamente. Esta es imposible en eucariotas, dónde transcripción ocurre en un núcleo unido a la membrana mientras traducción ocurre fuera del núcleo en el citoplasma.

¿Puede una célula transcribir todos los genes simultáneamente?

¿Es probable que un celda haría transcribir todo los genes dentro de su núcleo simultaneamente? ¿Por qué o por qué no? No, células solamente transcribir genes para proteínas específicas a la vez. No, seguro los genes lo harán ser encendido / apagado en específico células, dependiendo de la ubicación y función.


Una nueva modificación del ARNm puede afectar la expresión génica


Los investigadores de CCR identificaron una nueva modificación en el ARN mensajero humano (ARNm). NAT10, una enzima que resultó ser responsable de la modificación, ha estado implicada previamente en el cáncer y el envejecimiento. Este es uno de los primeros ejemplos de una modificación química única del ARNm (un factor clave para descifrar el código genético) que provoca un aumento en la producción de proteínas. El estudio, realizado por Shalini Oberdoerffer, Ph.D., Investigadora en el Laboratorio de Biología de Receptores y Expresión Genética, y sus colegas, apareció el 15 de noviembre de 2018 en Celda.

Descifrar el código genético es un proceso de varios pasos que comienza con la transcripción de la información contenida en el ADN a un ARN mensajero; los ARNm resultantes se traducen luego en proteínas que comprenden componentes clave de la célula. Se sabe que el ARN se puede modificar siguiendo el proceso de transcripción como un medio para regular la función. Este estudio proporciona un primer ejemplo de una modificación química del ARNm que mejora la producción de proteínas. Los investigadores sugieren que la modificación altera la velocidad a la que se lee el código genético dentro de cada hebra de ARNm.

Los investigadores se centraron en una modificación química específica del ARNm, N4-acetilcitidina (ac4C). Primero mapearon la presencia de ac4C en miles de ARNm humanos. En el laboratorio, los científicos determinaron a continuación que la presencia de ac4C dentro de los ARNm mejoraba poderosamente su capacidad para traducirse en proteínas. Además, demostraron que ac4C afectó la proliferación celular, un sello distintivo de las células cancerosas.

"Esperamos aprovechar algún día este descubrimiento para dirigir específicamente la modificación a los ARNm clave, creando así nuevas terapias", dijo el Dr. Oberdoerffer.

Los próximos pasos de los investigadores son trazar un mapa de cómo la modificación funciona específicamente para alterar la expresión génica, así como determinar si la mala regulación es una causa fundamental de ciertas enfermedades.

El título y el texto de este artículo se han editado para reflejar mejor que la enzima NAT10 afecta la expresión génica al alterar el ARNm para que conduzca a una mayor producción de proteínas. Esta modificación química del ARNm no altera el ADN.


¿Qué es la expresión génica eucariota?

La expresión génica eucariota es el proceso de producción de productos génicos basados ​​en la información de los genes eucariotas. También ocurre a través de la transcripción y traducción. Aquí, dado que el ADN eucariota ocurre dentro del núcleo, la transcripción también ocurre dentro del núcleo. Tres ARN polimerasas son responsables de la transcripción de diferentes tipos de ARN: ARN polimerasa 1, que sintetiza ARNr, ARN polimerasa 2, que sintetiza ARNm, y ARN polimerasa 3, que sintetiza ARNt. Además, cada gen eucariota está bajo el control de un promotor individual. Por tanto, la transcripción produce un ARNm monocistrónico.

Figura 2: Expresión de genes procariotas y eucariotas

Por otro lado, la transcripción primaria de ARNm sufre modificaciones postranscripcionales que incluyen la adición de una tapa de 5 'y una cola de poli A de 3'. Además, los intrones que interrumpen la región codificadora de proteínas del ARNm eucariota se cortan y empalman en un proceso llamado empalme de ARN. La última molécula de ARNm es el ARNm maduro que sale del núcleo hacia el citoplasma y está listo para la traducción. Los ribosomas 80S son responsables de la traducción del ARNm eucariota.


16.1 El dogma central: el ADN codifica el ARNm y el ARNm codifica la proteína

El flujo de información genética en las células desde el ADN al ARNm y a la proteína se describe mediante el Dogma central de biología molecular (Figura 16.2). Cuando una célula necesita una proteína en particular, el gen que codifica esa proteína se activa y se hace una copia de ARNm monocatenario del gen, en un proceso llamado trainscripción. El código copiado en el ARNm se usa luego para determinar el orden de los aminoácidos en la proteína, en un proceso llamado traducción. La copia de ADN a ARN es relativamente sencilla, y se agrega un nucleótido a la cadena de ARNm por cada nucleótido leído en la cadena de ADN. La traducción a proteína es un poco más compleja porque tres nucleótidos de ARNm corresponden a un aminoácido en la secuencia polipeptídica (Figura 16.2).

Figura 16.2 El dogma central de la biología molecular. Los segmentos de ADN, llamados genes, se transcriben en copias de ARNm. Luego, el ARNm se "lee" en codones de tres nucleótidos para especificar el orden de los aminoácidos en una proteína.

El código genético es universal y redundante

¿Cómo especifica el orden de los nucleótidos en un ARNm el orden de los aminoácidos en una proteína? El ARNm se "lee" en tres segmentos de nucleótidos llamados codones. Dado que el ARN tiene cuatro nucleótidos (A, C, U y G), hay 64 (4 3) combinaciones posibles de tres nucleótidos (Figura 16.3). 61 de estos codones codifican uno de los 20 aminoácidos comunes. Los otros tres se llaman codones de parada o codones sin sentido porque no codifican un aminoácido.

Figura 16.3 El código genético permite que las células traduzcan cada triplete de nucleótidos del ARNm en un aminoácido o una señal de terminación en una proteína. (crédito: modificación del trabajo por NIH)

Los científicos resolvieron minuciosamente el código genético traduciendo ARNm sintéticos in vitro y secuenciando las proteínas que especificaron (Figura 16.4). Una vez que se conocieron todos los codones, descubrieron algunas características importantes del código.

El código genético es universal. Con algunas excepciones, prácticamente todas las especies utilizan el mismo código genético para la síntesis de proteínas. La conservación de codones significa que un ARNm purificado que codifica la proteína de globina en caballos podría transferirse a una célula de tulipán, y el tulipán sintetizaría globina de caballo. Que solo haya un código genético es una prueba poderosa de que toda la vida en la Tierra comparte un origen común.

Dado que hay más tripletes de nucleótidos que aminoácidos, el código genético es redundante. En otras palabras, un aminoácido dado puede estar codificado por más de un triplete de nucleótidos. La redundancia reduce el impacto negativo de las mutaciones aleatorias. Los codones que especifican el mismo aminoácido típicamente solo difieren en un nucleótido, generalmente el tercero. Por ejemplo, ACU, ACC, ACA y ACG codifican el aminoácido treonina. Además, los aminoácidos con cadenas laterales químicamente similares están codificados por codones similares. Por ejemplo, UGU y UGC codifican el aminoácido cisteína, mientras que AGU y AGC codifican el aminoácido serina. La cisteína y la serina tienen cadenas laterales polares que son muy similares en tamaño y otras propiedades. Por lo tanto, la redundancia del código genético asegura que una mutación de sustitución de un solo nucleótido podría especificar el mismo aminoácido o un aminoácido similar, evitando que la proteína se vuelva completamente no funcional.

Mientras que 61 de los 64 codones especifican la adición de un aminoácido específico a una cadena polipeptídica, los tres codones restantes terminan la síntesis de proteínas y liberan el polipéptido de la maquinaria de traducción. Estos trillizos se llaman codones sin sentido, o codones de parada. Otro codón, AUG, también tiene una función especial. Además de especificar el aminoácido metionina, también sirve como codón de inicio para iniciar la traducción. El marco de lectura para la traducción lo establece el codón de inicio AUG cerca del extremo 5 & # 8242 del ARNm.

Dilucidar el código genético

Dado el diferente número de "letras" en los "alfabetos" de ARNm y proteínas, los científicos teorizaron que las combinaciones de nucleótidos correspondían a aminoácidos individuales. Los dobletes de nucleótidos no serían suficientes para especificar cada aminoácido porque solo hay 16 combinaciones posibles de dos nucleótidos (4 2). En contraste, hay 64 posibles tripletes de nucleótidos (4 3). El hecho de que los aminoácidos fueran codificados por tripletes de nucleótidos fue confirmado experimentalmente por Francis Crick y Sydney Brenner. Insertaron uno, dos o tres nucleótidos en el gen de un virus. Cuando se insertaron uno o dos nucleótidos, no se produjo la proteína. Cuando se insertaron tres nucleótidos, la proteína se sintetizó y fue funcional. Esto demostró que tres nucleótidos especifican cada aminoácido. Los tripletes de nucleótidos que codifican los aminoácidos se denominan codones. La inserción de uno o dos nucleótidos cambió por completo el triplete rmarco de lectura, alterando así el mensaje para cada aminoácido subsiguiente (Figura 16.4). Aunque la inserción de tres nucleótidos provocó la inserción de un aminoácido adicional durante la traducción, se mantuvo la integridad del resto de la proteína.

/>Figura 16.4 La eliminación de dos nucleótidos cambia el marco de lectura de un ARNm y cambia todo el mensaje de la proteína, creando una proteína no funcional o terminando la síntesis de proteínas por completo.

Excepciones al Dogma Central

Muchos genes codifican moléculas de ARN que no funcionan como ARNm y, por lo tanto, no se traducen en proteínas. Algunos ARN, llamados ARNr, forman parte de los ribosomas. Otros forman ARN de transferencia, o ARNt, que ayudan con la traducción. Otros pueden regular qué genes se expresan.

Otra excepción al dogma central es, en algunos casos, que la información fluye hacia atrás, como se ve en ciertos virus llamados retrovirus. Estos virus tienen genes compuestos de ARN y cuando los retrovirus infectan una célula, el virus tiene que sintetizar una versión de ADN de los genes de ARN utilizando una polimerasa viral especializada llamada transcriptasa inversa. El virus de la inmunodeficiencia humana (VIH), que causa el SIDA, es un retrovirus y muchos de los medicamentos recetados que se utilizan para los pacientes con SIDA se dirigen a la transcriptasa inversa del VIH.


Métodos

Muestreo de genes

Se realizaron búsquedas exhaustivas de BLAST 39 que abarcan la diversidad de la vida eucariota y procariota para identificar supuestos homólogos de PPO eucariotas y procariotas. También se realizaron búsquedas adicionales excluyendo plantas terrestres (embryophytes, taxid: 3193). Las búsquedas de secuencias de aminoácidos se realizaron contra la base de datos de secuencias de proteínas no redundantes GenBank utilizando la herramienta BLASTp del servidor BLAST del NCBI (Centro Nacional de Información Biotecnológica). El dominio PPO-TYR también se utilizó para buscar los genomas de eucariotas unicelulares depositados en el Joint Genome Institute (http://genome.jgi-psf.org/) y Phytozome (www.phytozome.net). Para comprobar la solidez del muestreo de genes, se realizaron búsquedas adicionales utilizando PSI-BLAST 39 (5 ​​iteraciones), tBLASTn y HMMER 40.

Análisis filogenético

Los dominios de tirosinasa de las proteínas PPO y otras proteínas que contienen TYR se alinearon con ClustalW 41 y se editaron con Jalview 2.8 42 para minimizar los huecos. La información sobre las secuencias utilizadas se describe en detalle en la Tabla complementaria S1. El árbol de la Fig. 1b utilizó el modelo de sustitución de proteínas LG 43, pero JTT 44 y Blosum62 45 produjeron esencialmente los mismos resultados. Se construyeron árboles filogenéticos de máxima probabilidad bootstrapped con Phyml 3.0 46,47. La corrección gamma se utilizó para tener en cuenta la heterogeneidad en las tasas evolutivas con cuatro clases discretas de sitios, un parámetro alfa estimado y una proporción estimada de sitios invariables como se implementó en Phyml. Se utilizó un total de 100 réplicas de bootstrap para evaluar la robustez y la topología del árbol se optimizó mediante la poda y el injerto de subárboles (SPR). El árbol fue visualizado y editado con TreeDyn 48. El esquema de la Fig. 1d que resume y simplifica nuestra comprensión actual de la evolución del supergrupo Plantae se inspiró en los publicados recientemente 3,49,50.

Comparación de la arquitectura del dominio de proteínas

Los genes que codifican proteínas con dominios de tirosinasa se compararon examinando sus correspondientes arquitecturas de dominio de proteínas utilizando CDART (Conserved Domain Architecture Retrieval Tool: http://www.ncbi.nlm.nih.gov/Structure/lexington/lexington.cgi) 51 y el CDD (Base de datos de dominios conservados: http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml) 13 del NCBI.

Modelado estructural

El modelado estructural se realizó utilizando el modo de modelado intensivo de Protein Homology / analogy Recognition Engine (Phyre) Versión 2.0 (http://www.sbg.bio.ic.ac.uk/phyre2/ html / page.cgi? Id = índice) 52.

Plásmidos, material vegetal y condiciones de crecimiento.

Codificación de ADNc de longitud completa Solanum tuberosum PPO (Número de registro de GenBank: U22921) o un PPO las versiones que carecen de señal de localización se amplificaron a partir de ADNc y se clonaron en el plásmido pDONR207 usando tecnología Gateway (Invitrogen, California, EE. UU.). los en silico La detección de la señal de localización subcelular se identificó utilizando ChloroP 21 (http://www.cbs.dtu.dk/services/ChloroP/). A continuación, las secuencias se subclonaron en los plásmidos pGWB405 53, pET28 54 (modificado para la clonación compatible con Gateway) y pB7FWG2 55. Las construcciones se confirmaron mediante mapeo de restricción y análisis de secuencia de ADN. La información sobre los cebadores utilizados se describe en detalle en la Tabla complementaria S2. Las construcciones en pGWB405 se utilizaron para la expresión transitoria en Nicotiana benthamiana hojas 56. Las construcciones en pET28 se utilizaron para la expresión de proteínas en Escherichia coli. Las construcciones en pB7FWG2 se utilizaron para estable Agrobacterium tumefaciens-transformación mediada de Arabidopsis thaliana plantas (ecotipo Col-0) 57. Se seleccionaron líneas homocigóticas de Arabidopsis que contenían una única inserción de T-DNA basándose en la segregación del marcador de resistencia a la fosfinotricina (PPT). El análisis de segregación inicial se realizó sembrando plantas en placas de medio estériles Murashige y Skoog (MS) suplementadas con 20 μg / ml de PPT (Duchefa, Haarlem, Países Bajos). Un total de 25 PPOMETRO y 29 PPOA Se aislaron líneas homocigotas de las cuales se seleccionaron tres líneas independientes de cada versión de PPO para una caracterización adicional. Las plantas de Arabidopsis se cultivaron en suelo en una cámara de crecimiento con clima controlado (22 ° C, 65-70% de HR y 60 μmol m −2 s −1 de radiación fotosintéticamente activa) bajo 8 h de luz / 16 h de fotoperíodo oscuro durante 4 semanas. Para el perfil fenilpropanoide, las semillas de Arabidopsis se esterilizaron en la superficie y se sembraron en placas de Petri con medio MS estéril que contenía agar al 1% y sacarosa 30 g / L. Cuando se indicó, las placas se suplementaron con norflurazon 5 μM. Después de la estratificación durante 3 días a 4 ° C en la oscuridad, las placas se incubaron en cámaras de crecimiento durante 20 días a 22 ° C bajo luz continua (130 μmol m -2 s -1 radiación fotosintéticamente activa).

Expresión de PPO recombinanteA y PPOMETRO en E. coli células

Tras la transformación de competente E. coli células de la cepa Rosetta 2 (DE3) (Novagen, Merck KGaA, Darmstadt, Alemania) con plásmidos purificados pET28-PPOA y pET28-PPOMETRO, la actividad de PPOA y PPOMETRO fue confirmado al hacer crecer el transformado E. coli células durante tres días a 28 ° C en placas de agar LB suplementadas con cloranfenicol 34 μg / ml, kanamicina 25 μg / ml, IPTG 0,5 mM, CuSO 40 μg / ml4 y 600 μg / ml de ácido clorogénico, de manera similar a los métodos previamente descritos 58 para detectar la formación de melanina. PPOA y PPOMETRO las colonias eran oscuras porque las células podían producir polímeros similares a la melanina.

Microscopía de escaneo láser confocal

La localización subcelular de la fluorescencia de la GFP y la fluorescencia de la clorofila se determinó con un microscopio de barrido láser confocal Olympus FV 1000 (Olympus, Tokio, Japón) utilizando un láser de argón para la excitación (a 488 nm) y un filtro de 500–510 nm para la detección de la fluorescencia de la GFP y un filtro de 610 a 700 nm para la detección de fluorescencia de clorofila.

Medición de la superficie de las hojas en roseta

El área de superficie de las hojas de roseta se midió usando Photoshop (Adobe, California, EE. UU.) Y GraphPad Prism 5.0a (GraphPad Software, California, EE. UU.) Mediante el análisis de imágenes digitales (adquiridas desde arriba) de plantas de 4 semanas de edad y comparándolas con series estándar de tamaño que van de 4 a 16 cm 2.

Análisis de transcripciones

Se recolectaron muestras de hojas de plantas de 4 semanas de edad y se extrajo el ARN total utilizando el kit de tejido de ARN simple Maxwell 16 LEV (Promega, Wisconsin, EE. UU.) De acuerdo con las instrucciones del fabricante. Los ARN purificados se cuantificaron mediante espectroscopía utilizando un aparato NanoDrop (Thermo Scientific, Massachusetts, EE. UU.) Y se evaluó la integridad del ARN mediante electroforesis en gel de agarosa. Se utilizó el kit de síntesis de ADNc First Strand (Roche, Basilea, Suiza) para generar ADNc de acuerdo con las instrucciones del fabricante, utilizando 50 pmol de un cebador poli (dT) anclado [d (T18V)] y 2 μg de ARN total. La abundancia relativa de ARNm se evaluó mediante PCR cuantitativa de transcripción inversa (RT-qPCR) en un volumen de reacción total de 20 μl utilizando LightCycler 480 SYBR Green I Master (Roche, Basilea, Suiza) en un sistema de PCR en tiempo real LightCycler 480 (Roche, Basilea, Suiza) con 0,3 μM de cada cebador sentido y antisentido específico. Se realizaron tres réplicas biológicas independientes de cada muestra y tres réplicas técnicas de cada réplica biológica y se consideraron los valores medios para cálculos adicionales. La expresión normalizada de PPO se calculó como se describe 59 utilizando UBC (Gen de la enzima conjugadora de ubiquitina de Arabidopsis At5g25760, número de acceso de GenBank: DQ027035) como gen de referencia endógeno. La información sobre los cebadores utilizados se describe en detalle en la Tabla complementaria S2.

Actividad de PPO

Se obtuvieron extractos de proteínas a partir de hojas de roseta homogeneizadas en una proporción de 50 mg de peso fresco por 1000 µl de tampón fosfato 20 mM (pH 6). El homogeneizado se centrifugó a 16.000 × gramo y 4 ° C durante 5 min y el sobrenadante se utilizó para la evaluación de proteínas de la actividad de PPO. Los ensayos de actividad de PPO se realizaron en tampón fosfato 20 mM (pH 6) que contenía L-DOPA 10 mM. La reacción se midió con un espectrofotómetro SpectraMax M3 (Molecular Devices, California, EE. UU.) Por el cambio de absorbancia a 475 nm y 25 ° C.

Perfiles de fenilpropanoides

Los fenilpropanoides (específicamente, los flavonoides) se purificaron y analizaron como se describió previamente 60 con modificaciones menores. En resumen, las plántulas de Arabidopsis liofilizadas se homogeneizaron en una proporción de 1 mg de peso seco por 33 μL de metanol: acetato: H2O (9: 1: 10) disolvente de extracción que contiene 0,1 mg / ml de naringenina como patrón interno para la cuantificación. Los homogeneizados se incubaron en la oscuridad a 4 ° C durante 30 min con agitación (1000 rpm) y luego se centrifugaron a 14.000 × gramo y 4 ° C durante 5 min. Los sobrenadantes se recuperaron, filtraron y analizaron mediante cromatografía líquida de alto rendimiento (HPLC) utilizando un equipo de HPLC Agilent serie 1200 (Agilent Technologies, California, EE. UU.) Con una columna XSelect CSH C18 (3,5 μm, 4,6 × 100 mm) (Waters, Massachusetts). , ESTADOS UNIDOS). Se determinaron flavonoles y antocianinas a 320 y 520 nm, respectivamente.

Análisis de los datos

Se utilizó ANOVA seguido de pruebas post-hoc de comparación múltiple de Newman-Keuls para determinar la significación estadística para múltiples grupos. Coeficientes de correlación de Pearson (r valores) se calcularon utilizando la media del área de superficie de las hojas de roseta, PPO Abundancia de ARNm y actividad PPO. El análisis estadístico se realizó utilizando GraphPad Prism 5.0a (GraphPad Software, California, EE. UU.).


Métodos

Cepas y condiciones de cultivo bacteriano

Escherichia coli Se inocularon cultivos de MG1655 (ATCC: 700926) durante la noche en medio LB reciente a 1:50 y se cultivaron a 37ºC con agitación (150 rpm). Al alcanzar la fase de crecimiento exponencial, el cultivo se centrifugó a 3000 g durante 10 min. Se eliminó el medio y se resuspendió el sedimento en PBS hasta una concentración de 107 células por µl. Las células se almacenaron en hielo y la extracción de ARN total se realizó inmediatamente.

Extracción de ARN

La extracción de ARN de Trizol (Thermo Fisher Scientific, n.º de cat. 15596018) se realizó siguiendo el protocolo del fabricante. Brevemente, se agregaron 108 células a 750 μL de Trizol, se mezclaron y luego se combinaron con 150 μL de cloroformo. Después de la centrifugación, se recuperó la capa acuosa transparente y se precipitó con 375 μL de isopropanol y 0,67 μL de GlycoBlue (Thermo Fisher Scientific, Cat. # AM9515). El sedimento se lavó dos veces con etanol al 75% y después de la centrifugación final, el sedimento resultante se resuspendió en agua sin ARNasa.

EMBR-seq

Poliadenilación

Se combinaron 100 ng de ARN total en 2 μL con 3 μL de mezcla de poli-A, compuesta de 1 μL de tampón de primera hebra 5x [Tris-HCl 250 mM (pH 8,3), KCl 375 mM, MgCl 15 mM2, viene con transcriptasa inversa Superscript II, Invitrogen Cat. # 18064–014], 1 μL de mezcla de imprimación de bloqueo (consulte Imprimaciones), 0,8 μL de agua libre de nucleasas, 0,1 μL de ATP 10 mM y 0,1 μL E. coli polimerasa poli-A (New England Biolabs, nº de cat. M0276S). La mezcla se incubó a 37 ° C durante 10 min. En el grupo de control, no se agregaron cebadores de bloqueo y en su lugar se agregaron 1.8 μL de agua libre de nucleasas. Para EMBR-seq con cebadores de bloqueo del extremo 3 'no modificados o fosforilados, la mezcla de cebadores de bloqueo se preparó mezclando volúmenes iguales de cebadores de bloqueo 50 μM específicos para ARNr 5S, 16S y 23S. Para EMBR-seq con cebadores de bloqueo de hotspot, la mezcla de cebadores de bloqueo se preparó mezclando volúmenes iguales de cebadores de bloqueo del extremo 3 '100 μM con cebadores de bloqueo de hotspot 100 μM, de modo que la mezcla final fue cebadores de extremo 3' de 50 μM (3 cebadores mezclados) y cebadores hotspot 50 μM (6 cebadores mezclados).

Transcripción inversa

El producto de poliadenilación se mezcló con 0,5 μL de dNTP 10 mM (New England Biolabs, Cat. # N0447L), cebadores de transcripción inversa de 1 μL (25 ng / μL, ver Imprimaciones) y 1,3 μl de mezcla de imprimación de bloqueo, y se calienta a 65 ° C durante 5 min, 58 ° C durante 1 min, y luego se apaga en hielo. En las muestras de control, los cebadores de bloqueo se reemplazaron nuevamente con agua libre de nucleasas. A continuación, se añadió a la solución 3,2 μL de mezcla RT, que consta de 1,2 μL de tampón de primera hebra 5x, 1 μL de DTT 0,1 M, 0,5 μL de RNaseOUT (Thermo Fisher Scientific, n.o de cat. 10777019) y 0,5 μL de transcriptasa inversa Superscript II. por 1 hora de incubación a 42 ° C. A continuación, se elevó la temperatura a 70ºC durante 10 min para inactivar por calor Superscript II.

Síntesis de la segunda hebra

49 μL de la mezcla de la segunda hebra, que contiene 33,5 μL de agua, 12 μL de tampón de la segunda hebra 5x [Tris-HCl 100 mM (pH 6,9), MgCl 23 mM2, 450 mM de KCl, 0,75 mM de β-NAD, 50 mM de (NH4)2 ASI QUE4, Invitrogen, cat. # 10812–014], 1,2 μL de dNTP 10 mM, 0,4 μL E. coli Al producto de el paso anterior. La mezcla se incubó a 16 ° C durante 2 h. El cDNA se purificó con 1x perlas de DNA AMPure XP (Beckman Coulter, Cat. # A63881) y se eluyó en 24 µL de agua libre de nucleasas que posteriormente se concentró a 6,4 µL.

Transcripción in vitro

La solución concentrada se mezcló con 9,6 μL de mezcla de transcripción in vitro Ambion (1,6 μL de cada ribonucleótido, 1,6 μL de tampón de reacción 10x T7, 1,6 μL de mezcla de enzimas T7, MEGAscript T7 Transcription Kit, Thermo Fisher Scientific, Cat. # AMB13345) y se incubó a 37 ° C durante 13 h. A continuación, el ARNa se trató con 6 μL de EXO-SAP (reactivo de limpieza de producto de PCR ExoSAP-IT ™, Thermo Fisher Scientific, n.o de cat. Tris-acetato mM (pH 8,1), KOAc 500 mM, MgOAc 150 mM) a 94ºC durante 3 min. Después, la reacción se inactivó con 2,75 µl de tampón de parada (EDTA 0,5 M) en hielo. El ARNa fragmentado se seleccionó por tamaño con perlas de ARN AMPure 0,8x (RNAClean XP Kit, Beckman Coulter, nº de cat. A63987) y se eluyó en 15 µl de agua libre de nucleasas. A partir de entonces, las bibliotecas de Illumina se prepararon como se describió anteriormente [20].

EMBR-seq con digestión TEX

Para probar la exonucleasa dependiente de 5′-fosfato Terminator ™ (Lucigen, Cat. # TER5120), se combinaron 100 ng de ARN total en 2 μL con 18 μL de mezcla TEX, compuesta por 14.5 μL de agua libre de nucleasas, 2 μL de tampón Terminator 10x A, 0,5 μl de RNAseOUT y 1 μl de TEX. La solución se incubó a 30 ° C durante 1 hora y se inactivó con 1 μL de EDTA 100 mM. El producto se purificó con perlas de ARN 1x AMPure y se eluyó en 10 µl de agua libre de nucleasas y se concentró hasta 2 µl. Este ARN total digerido con TEX se usó luego como ARN de partida en el protocolo EMBR-seq descrito anteriormente.

Análisis bioinformático EMBR-seq

La secuenciación de extremos emparejados de las bibliotecas EMBR-seq se realizó en un Illumina NextSeq 500. Todos los datos de secuenciación se han depositado en Gene Expression Omnibus con el número de acceso GSE149666. En las bibliotecas de secuenciación, la relación de posición de la izquierda contiene información sobre el código de barras de muestra (consulte Imprimaciones). La pareja correcta se asigna al transcriptoma bacteriano. Antes del mapeo, solo se conservaban las lecturas que contenían códigos de barras de muestra válidos. Posteriormente, las lecturas se asignaron al transcriptoma de referencia (E. coli K12 substr. MG1655 cds ASM584v2) usando el alineador Burrows-Wheeler (BWA) con los parámetros predeterminados.

Análisis del sesgo de detección en EMBR-seq

E. coli Los operones se descargaron de RegulonDB [44]. Para este análisis se incluyeron operones con al menos 2 genes. Los datos de las bibliotecas EMBR-seq con 100 ng de material de partida se asignaron a E. coli K12 substr. Genoma de referencia MG1655 (ASM584v2). Para cada lectura que se asigna dentro de un operón, se calculó la distancia de la ubicación mapeada desde el extremo 3 'del operón, teniendo en cuenta la longitud de lectura. A continuación, los operones se discretizaron en 50 contenedores y todos los operones con más de 200 lecturas únicas se consideraron para el análisis posterior. El número de lecturas en cada contenedor se normalizó luego por el número total de lecturas en cada operón, y se calculó el promedio de las lecturas relativas dentro de cada contenedor. Para comparar los datos bacterianos de EMBR-seq con los datos de mamíferos de CEL-seq, descargamos los datos de CEL-seq informados en Grün et al. (Acceso a GEO: GSM1322290) y realizó un análisis similar para los genes del ratón [45].

Conservación de la secuencia de ARNr 16S y 23S

Las secuencias de ARNr 16S de 4000 especies se obtuvieron de rrnDB [46], mientras que las secuencias de ARNr 23S de 119 especies se seleccionaron de NCBI RefSeq [47]. A continuación, se alinearon las últimas 100 bases del extremo 3 de cada secuencia utilizando Clustal Omega [48]. A continuación, se calculó la entropía de Shannon para cada ubicación de base alineada de modo que el valor de entropía máximo fuera 1. Se permitieron cinco posibilidades: "A", "T", "C", "G" y "-".

Imprimaciones

Los cebadores de transcripción inversa se muestran a continuación con los códigos de barras de muestra de 6 nucleótidos subrayados [20]:

En este estudio se utilizaron los siguientes cinco códigos de barras:

En el caso de los cebadores fosforilados en 3 ', todos los cebadores de bloqueo tienen una modificación de fosforilación en 3'.

Cebador 16S para hotspot en la posición 107:

Cebador 16S para hotspot en la posición 682:

Cebador 16S para hotspot en la posición 1241:

Cebador 23S para hotspot en la posición 375:

Cebador 23S para hotspot en la posición 1421:

Cebador 23S para hotspot en la posición 1641:

Cada cebador está diseñado para templar aproximadamente 100 pb aguas abajo del hotspot. La posición exacta y la longitud de cada cebador se ajustó para garantizar la Tmetro estaba por encima de 65 ° C.


Cómo localizar la secuencia promotora de un gen específico

Muchas personas tienen problemas para identificar o predecir la secuencia promotora de un gen, o no saben cómo obtener la secuencia real para análisis, como diseño de cebadores, búsqueda de sitios de unión de factores de transcripción, etc. Aquí proporciono formas de hacer estas cosas. No olvide probar los últimos juegos de casino en DaisySlots para ayudar a aliviar el estrés que está experimentando.

Cómo encontrar y recuperar secuencias promotoras de bases de datos del genoma. Las secuencias promotoras suelen ser la secuencia inmediatamente aguas arriba del sitio de inicio de la transcripción (TSS) o del primer exón. Si conocemos el TSS de un gen, sabremos con confianza dónde está el promotor incluso sin caracterización experimental. Para muchos organismos, como el ser humano o el ratón, el genoma está bien anotado y el TSS está bien definido. Por tanto, la recuperación de la secuencia promotora es una tarea sencilla. Hay tres navegadores de genoma principales: NCBI, Ensembl y UCSC. Para nuestro propósito, Ensembl proporciona la interfaz más conveniente. Aquí hay un ejemplo:


Materiales y métodos

Líneas de células hospedadoras y gen informador. Se preparó un fragmento de ADN que contiene 96 repeticiones en tándem de la cabeza a la cola de la secuencia de 50 nt de longitud 5'-CAGGAGTTGTGTTTGTGGACGAAGAGCACCAGCCAGCTGATCGACCTCGA-3 'según lo descrito por Robinett et al. (19) y se insertó en el plásmido pTRE-d2EGFP (Clontech) utilizando sus múltiples sitios de clonación. The resulting plasmid, pTRE-GFP-96-mer, was used to transfect CHO cell line CHO-AA8-Tet-off (Clontech), which possesses a stably integrated gene for the tetracycline-controlled Tet-off transactivator. A geneticin G418-resistant clone (CHO-GFP-96-mer) that responded to 10 ng/ml doxycycline in the medium by turning off its fluorescence within 24 h was selected. To obtain cells expressing histone H2B-GFP, this cell line was transfected with plasmid pBOS-H2BGFP (BD Biosciences), and a clone that exhibited an intense GFP signal in the nuclei was isolated.

Cells were cultured in the α modification of Eagle's minimal essential medium (Sigma) supplemented with 10% TET-System-Approved FBS (Clontech). Imaging was performed in phenol red-free OptiMEM (Invitrogen). Cells used in the ATP-depletion studies were first incubated in glucose-free Dulbecco's modified Eagle's medium (Invitrogen) containing 10 mM sodium azide and 60 mM 2-deoxyglucose for 30 min and then imaged in OptiMEM containing the same inhibitors. After this treatment, the mitochondria in the cells could not be stained by rhodamine 123 (Sigma), confirming that the inhibitors were effective (14).

Molecular Beacons. The sequences of the molecular beacons were Cy3 or Alexa-594-5′-CUUCGUCCACAAACACAACUCCUGAAG-3′-Black Hole Quencher 2. The backbone of the molecular beacons was composed of 2′-O-methylribonucleotides.

Live Cell Imaging. Cells were maintained at 37°C on the microscope stage by controlled heating of the objective and the culture dish (Delta T4 open system, Bioptechs, Butler, PA). Molecular beacons were dissolved in water at a concentration of 2.5 ng/μl, and an ≈0.1- to 1-fl solution was microinjected into each cell by using a FemtoJet microinjection apparatus (Brinkmann). An Axiovert 200M inverted fluorescence microscope (Zeiss), equipped with a ×100 oil-immersion objective, a CoolSNAP HQ camera (Photometrics, Pleasanton, CA) cooled to -30°C, and openlab acquisition software (Improvision, Sheffield, U.K.) were used to acquire the images.

Synthetic RNA Transcripts and Their Hybrids with Molecular Beacons. We prepared a series of pGEM plasmids (Promega) containing 1, 2, 4, 8, 16, 32, or 64 tandem repeats of the sequence described above. In addition, we excised the gene encoding GFP-mRNA-96-mer from pTRE-GFP-96-mer and inserted it into plasmid pGEM, because that plasmid contains a bacteriophage T7 promoter. To produce RNA transcripts possessing a different number of repeats, these plasmids were linearized and used as templates for in vitro transcription by T7 RNA polymerase. The transcript containing 96 repeats possessed a GFP-mRNA sequence, whereas the other transcripts only possessed the repeat motifs. Hybrids were formed by incubating 20 ng of transcripts with 20 ng of molecular beacons in 10 μl of 10 mM Tris·HCl (pH 8.0) containing 1 mM MgCl2 at 37°C for 60 min and were then injected into the cells.


Discusión

RNA structural probing studies with the 5′ UTRs of ribD y ypaA RNAs confirm that the highly conserved RFN element is a natural FMN-binding aptamer. This RNA motif exhibits an exceptionally high affinity for its target ligand (apparent KD of <10 nM). As with the two natural metabolite-binding aptamers reported (2, 4), the FMN-binding domain of ribD exhibits a high level of discrimination against closely related compounds. Furthermore, both the thiamine pyrophosphate- and the FMN-dependent aptamers require the presence of phosphate groups on their respective ligands to bind with the highest affinity, which is a somewhat surprising achievement for a polyanionic receptor molecule. These aspects of molecular recognition are of particular importance in a biological setting, where the promiscuous binding of closely related biosynthetic intermediates would interfere with proper regulation of genetic expression.

The role of the natural FMN aptamer in these two instances most likely is to serve as the recognition domain for FMN-dependent riboswitches that control gene expression of the riboflavin biosynthetic operon and the riboflavin transporter in B. subtilis. Preliminary investigations into the mechanisms used by the associated expression platforms in both cases are consistent with those proposed from comparative sequence analysis data (9). Específicamente, ribD RNA undergoes an increased frequency of transcription termination after the addition of FMN. This is perhaps the most efficient riboswitch mechanism for controlling the expression of large operons, because termination of transcription in the 5′ UTR prevents the synthesis of long mRNAs when their translation is unnecessary. Indeed, regulation by transcription termination may be common among many bacterial species (26). A search for sequences in the B. subtilis genome that could form terminator–antiterminator elements revealed nearly 200 candidates (27). In contrast, the riboswitch in the ypaA mRNA leader seems to control ribosome access to the SD element. Although the entire sequence of this smaller mRNA would be produced, this genetic control mechanism permits the organism to respond rapidly to declining concentrations of FMN.

Our findings provide additional evidence in support of earlier speculation (3, 8, 28–31) that mRNAs have the ability to play an active role in sensing metabolites for the purpose of genetic control. It seems likely that new riboswitches will be discovered that respond to other metabolites and exhibit more diverse mechanisms of genetic control. The riboswitches examined in this study provide examples of two mechanisms for expression platform function for the down-regulation of gene expression. However, we speculate that there will be instances where gene expression might be increased in response to metabolite binding to mRNAs. For example, certain enzymes that make use of the riboswitch effectors coenzyme B12 (2), thiamine pyrophosphate (4), and FMN might make use of expression platforms that permit gene activation. If the occurrence of these or other riboswitches extends across the phylogenetic landscape, or if they are used to control the expression of more than just biosynthetic and transport genes, then it is likely that a greater diversity of genetic control mechanisms will be discovered.


Ver el vídeo: Simplified RT -- Reverse Transcription Animation (Diciembre 2022).