Tubo en espiral soldado de acero inoxidable 304, componente zémico de tubos, potencial biosintético del microbioma marino mundial

Gracias por visitar Nature.com.Está utilizando una versión del navegador con soporte CSS limitado.Para obtener la mejor experiencia, le recomendamos que utilice un navegador actualizado (o deshabilite el Modo de compatibilidad en Internet Explorer).Además, para garantizar un soporte continuo, mostramos el sitio sin estilos ni JavaScript.
Controles deslizantes que muestran tres artículos por diapositiva.Utilice los botones Atrás y Siguiente para moverse por las diapositivas, o los botones del controlador de diapositivas al final para moverse por cada diapositiva.

Descripción detallada del producto

Tubo/tubo en espiral soldado de acero inoxidable 304
1. Especificación: Tubo/tubos de bobina de acero inoxidable
2. Tipo: soldado o sin costura
3. Estándar: ASTM A269, ASTM A249
4. Tubo de bobina de acero inoxidable OD: 6 mm a 25,4 mm
5. Longitud: 600-3500MM o según los requisitos del cliente.
6. Espesor de la pared: 0,2 mm a 2,0 mm.

7. Tolerancia: OD: +/-0,01 mm;Espesor: +/-0,01%.

8. Tamaño del orificio interior de la bobina: 500 MM-1500 MM (se puede ajustar según los requisitos del cliente)

9. Altura de la bobina: 200MM-400MM (se puede ajustar según los requisitos del cliente)

10. Superficie: Brillante o recocida
11. Material: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, aleación 625, 825, 2205, 2507, etc.
12. Embalaje: bolsas tejidas en cajas de madera, paletas de madera, ejes de madera o según los requisitos del cliente.
13. Prueba: componente químico, límite elástico, resistencia a la tracción, medición de dureza.
14. Garantía: Inspección por parte de terceros (por ejemplo: SGS TV), etc.
15. Aplicación: Decoración, muebles, transporte de petróleo, intercambiadores de calor, fabricación de barandillas, fabricación de papel, automóviles, procesamiento de alimentos, medicina, etc.

Toda la composición química y propiedades físicas del acero inoxidable como se muestra a continuación:

Material ASTM A269 Composición química % máx.
C Mn P S Si Cr Ni Mo NÓTESE BIEN Nb Ti
TP304 0,08 2.00 0,045 0.030 1.00 18,0-20,0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0,045 0.030 1.00 18,0-20,0 8.0-12.0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0.030 1.00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035D 2.00 0,045 0.030 1.00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0.030 1.00 17,0-19,0 9.0-12.0 ^ ^ ^ 5ºC -0,70
TP347 0,08 2.00 0,045 0.030 1.00 17,0-19,0 9.0-12.0 10ºC -1,10 ^

 

Material Tratamiento térmico Temperatura F (C) mín. Dureza
Brinell rockwell
TP304 Solución 1900 (1040) 192 HBW/200 HV 90HRB
TP304L Solución 1900 (1040) 192 HBW/200 HV 90HRB
TP316 Solución 1900(1040) 192 HBW/200 HV 90HRB
TP316L Solución 1900(1040) 192 HBW/200 HV 90HRB
TP321 Solución 1900(1040)F 192 HBW/200 HV 90HRB
TP347 Solución 1900(1040) 192 HBW/200 HV 90HRB

 

DE, pulgadas Tolerancia OD pulgadas (mm) % de tolerancia de peso Longitud Tolerancia pulgadas (mm)
+ -
≤ 1/2 ± 0,005 ( 0,13 ) ± 15 1/8 (3.2) 0
> 1/2 ~1 1/2 ± 0,005 (0,13) ± 10 1/8 (3,2) 0
> 1 1 / 2 ~ < 3 1 / 2 ± 0,010 (0,25) ± 10 3/16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015 (0,38) ± 10 3/16 (4,8) 0
> 5 1 / 2 ~ < 8 ± 0,030 (0,76) ± 10 3/16 (4,8) 0
8~<12 ± 0,040 (1,01) ± 10 3/16 (4,8) 0
12~<14 ± 0,050 (1,26) ± 10 3/16 (4,8) 0

Las comunidades microbianas naturales son filogenética y metabólicamente diversas.Además de los grupos de organismos poco estudiados1, esta diversidad también encierra un rico potencial para el descubrimiento de enzimas y compuestos bioquímicos2,3 de importancia ecológica y biotecnológica.Sin embargo, estudiar esta diversidad para determinar las vías genómicas que sintetizan dichos compuestos y los unen a sus respectivos huéspedes sigue siendo un desafío.El potencial biosintético de los microorganismos en mar abierto sigue siendo en gran medida desconocido debido a las limitaciones en el análisis de los datos de resolución del genoma completo a escala global.Aquí, exploramos la diversidad y la diversidad de grupos de genes biosintéticos en el océano mediante la integración de alrededor de 10,000 genomas microbianos de células cultivadas y células individuales con más de 25,000 borradores de genomas recién reconstruidos de más de 1,000 muestras de agua de mar.Estos esfuerzos han identificado alrededor de 40.000 supuestos grupos de genes biosintéticos, en su mayoría nuevos, algunos de los cuales se han encontrado en grupos filogenéticos previamente insospechados.En estas poblaciones, identificamos un linaje enriquecido en grupos de genes biosintéticos ("Candidatus Eudormicrobiaceae") que pertenecía a un filo bacteriano no cultivado e incluía algunos de los microorganismos biosintéticamente más diversos en este entorno.De estos, hemos caracterizado las vías de fosfatasa-péptido y pitonamida, identificando casos de estructura y enzimología de compuestos bioactivos inusuales, respectivamente.En conclusión, este estudio demuestra cómo las estrategias basadas en el microbioma pueden permitir la exploración de enzimas y alimentos naturales no descritos anteriormente en una microbiota y un entorno poco conocidos.
Los microbios impulsan los ciclos biogeoquímicos globales, mantienen las redes alimentarias y mantienen saludables a las plantas y los animales5.Su enorme diversidad filogenética, metabólica y funcional representa un rico potencial para el descubrimiento de nuevos taxones1, enzimas y compuestos bioquímicos, incluidos productos naturales6.En las comunidades ecológicas, estas moléculas proporcionan a los microorganismos una variedad de funciones fisiológicas y ecológicas, desde la comunicación hasta la competencia 2, 7.Además de sus funciones originales, estos productos naturales y sus vías de producción genéticamente codificadas proporcionan ejemplos de aplicaciones biotecnológicas y terapéuticas2,3.La identificación de tales vías y conexiones se ha visto enormemente facilitada por el estudio de microbios cultivados.Sin embargo, estudios taxonómicos de ambientes naturales han demostrado que la gran mayoría de los microorganismos no han sido cultivados8.Este sesgo cultural limita nuestra capacidad para explotar la diversidad funcional codificada por muchos microbios4,9.
Para superar estas limitaciones, los avances tecnológicos de la última década han permitido a los investigadores secuenciar directamente (es decir, sin cultivo previo) fragmentos de ADN microbiano de comunidades enteras (metagenómica) o células individuales.La capacidad de ensamblar estos fragmentos en fragmentos de genoma más grandes y reconstruir múltiples genomas ensamblados metagenómicamente (MAG) o genomas amplificados únicos (SAG), respectivamente, abre una oportunidad importante para estudios taxocéntricos del microbioma (es decir, comunidades microbianas y el microbioma).allanar nuevos caminos.propio material genético en un ambiente determinado) 10,11,12.De hecho, estudios recientes han ampliado enormemente la representación filogenética de la diversidad microbiana en la Tierra1, 13 y han revelado gran parte de la diversidad funcional en comunidades microbianas individuales que anteriormente no estaban cubiertas por secuencias genómicas de referencia (REF) de microorganismos cultivados14.La capacidad de ubicar la diversidad funcional no descubierta en el contexto del genoma huésped (es decir, la resolución del genoma) es fundamental para predecir líneas microbianas aún no caracterizadas que presumiblemente codifican nuevos productos naturales15,16 o para rastrear dichos compuestos hasta su productor original17.Por ejemplo, un enfoque combinado de análisis metagenómico y genómico unicelular ha llevado a la identificación de Candidatus Entotheonella, un grupo de bacterias metabólicamente ricas asociadas a esponjas, como productoras de una variedad de potenciales fármacos18.Sin embargo, a pesar de los recientes intentos de exploración genómica de diversas comunidades microbianas,16,19 aún faltan más de dos tercios de los datos metagenómicos globales del océano de ecosistemas más grande de la Tierra16,20.Por lo tanto, en general, el potencial biosintético del microbioma marino y su potencial como depósito de nuevos productos enzimáticos y naturales siguen estando poco estudiados.
Para explorar el potencial biosintético de los microbiomas marinos a escala global, primero agrupamos genomas microbianos marinos obtenidos utilizando métodos dependientes del cultivo y no culturales para crear una base de datos extensa de filogenética y función genética.El examen de esta base de datos reveló una amplia variedad de grupos de genes biosintéticos (BGC), la mayoría de los cuales pertenecen a familias de grupos de genes (GCF) aún no caracterizados.Además, identificamos una familia bacteriana desconocida que exhibe la mayor diversidad conocida de BGC en mar abierto hasta la fecha.Seleccionamos dos vías de síntesis ribosómica y de péptidos modificados postraduccionalmente (RiPP) para la validación experimental en función de sus diferencias genéticas con las vías actualmente conocidas.La caracterización funcional de estas vías ha revelado ejemplos inesperados de enzimología, así como compuestos estructuralmente inusuales con actividad inhibidora de proteasas.
Al principio, nuestro objetivo era crear una fuente de datos global para el análisis del genoma, centrándonos en sus componentes bacterianos y arqueales.Con este fin, agrupamos datos metagenómicos y 1038 muestras de agua de mar de 215 sitios de muestreo distribuidos globalmente (rango de latitud = 141,6 °) y varias capas profundas (de 1 a 5600 m de profundidad, que cubren las zonas pelágica, mesopelágica y abisal).Antecedentes21,22,23 (Fig. 1a, datos ampliados, Fig. 1a y Tabla complementaria 1).Además de proporcionar una amplia cobertura geográfica, estas muestras filtradas selectivamente nos permitieron comparar varios componentes del microbioma marino, incluidos los ricos en virus (<0,2 µm), los ricos en procarióticos (0,2–3 µm) y los ricos en partículas (0,8 µm). ).–20 µm) y colonias empobrecidas por virus (>0,2 µm).
a, Un total de 1038 genomas (metagenómica) disponibles públicamente de comunidades microbianas marinas recopilados en 215 ubicaciones distribuidas globalmente (62 ° S a 79 ° N y 179 ° W a 179 ° E).Mosaicos de mapas © Esri.Fuentes: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ y Esri.b, estos metagenomas se utilizaron para reconstruir MAG (métodos e información adicional), que difieren en cantidad y calidad (métodos) en los conjuntos de datos (marcados en color).Los MAG reconstruidos se complementaron con genomas (externos) disponibles públicamente, incluidos MAG26, SAG27 y REF hechos a mano.27 Compile OMD.c, en comparación con informes anteriores basados ​​únicamente en SAG (GORG)20 o MAG (GEM)16, OMD mejora la caracterización genómica de las comunidades microbianas marinas (tasa de mapeo de lectura metagenómica; método) de dos a tres veces con una representación más consistente en profundidad y latitud..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, la agrupación OMD en el nivel de grupos de especies (95% de identidad media de nucleótidos) identifica un total de aproximadamente 8300 especies, más de la mitad de las cuales no se han caracterizado previamente según anotaciones taxonómicas utilizando la GTDB (versión 89) e, la clasificación de especies por tipo de genoma mostró que MAG, SAG y REF se complementan bien entre sí al reflejar la diversidad filogenética de El microbioma marino.En particular, el 55%, 26% y 11% de las especies fueron específicas de MAG, SAG y REF, respectivamente.BATS, Serie temporal del Atlántico de las Bermudas;GEM, genomas del microbioma de la Tierra;GORG, genoma de referencia oceánica global;Serie temporal CALIENTE del océano hawaiano.
Utilizando este conjunto de datos, reconstruimos un total de 26,293 MAG, en su mayoría bacterianos y arqueales (Fig. 1b y datos ampliados, Fig. 1b).Creamos estos MAG a partir de ensamblajes de muestras metagenómicas separadas en lugar de agrupadas para evitar el colapso de la variación de secuencia natural entre muestras de diferentes ubicaciones o puntos de tiempo (métodos).Además, agrupamos fragmentos genómicos en función de sus correlaciones de prevalencia en una gran cantidad de muestras (de 58 a 610 muestras, según la encuesta; el método).Descubrimos que se trata de un paso importante, que lleva mucho tiempo24 y que se omitió en varios trabajos de reconstrucción a gran escala del MAG16, 19, 25 y que mejora significativamente la cantidad (2,7 veces en promedio) y la calidad (+20% en promedio) de la genoma.reconstruido a partir del metagenoma marino estudiado aquí (datos ampliados, Fig. 2a e información adicional).En general, estos esfuerzos dieron como resultado un aumento de 4,5 veces en los MAG microbianos marinos (6 veces si solo se consideran los MAG de alta calidad) en comparación con el recurso MAG más completo disponible en la actualidad16 (Métodos).Este conjunto MAG recién creado se combinó con 830 MAG26, 5969 SAG27 y 1707 REF cuidadosamente seleccionados.Veintisiete especies de bacterias y arqueas marinas formaron una colección combinatoria de 34.799 genomas (Fig. 1b).
Luego evaluamos el recurso recién creado para mejorar su capacidad de representar comunidades microbianas marinas y evaluar el impacto de la integración de diferentes tipos de genomas.En promedio, encontramos que cubre aproximadamente entre el 40% y el 60% de los datos metagenómicos marinos (Figura 1c), dos o tres veces la cobertura de informes anteriores solo de MAG tanto en profundidad como en latitud Más serie 16 o SAG20.Además, para medir sistemáticamente la diversidad taxonómica en colecciones establecidas, anotamos todos los genomas utilizando el conjunto de herramientas (métodos) de la Base de datos de taxonomía del genoma (GTDB) y utilizamos una identidad de nucleótidos promedio en todo el genoma del 95%.28 para identificar 8.304 grupos de especies (especies).Dos tercios de estas especies (incluidos nuevos clados) no habían aparecido previamente en la GTDB, de las cuales 2790 fueron descubiertas utilizando el MAG reconstruido en este estudio (Fig. 1d).Además, encontramos que los diferentes tipos de genomas son altamente complementarios: el 55%, el 26% y el 11% de las especies están compuestos enteramente por MAG, SAG y REF, respectivamente (Fig. 1e).Además, MAG cubrió los 49 tipos encontrados en la columna de agua, mientras que SAG y REF solo representaron 18 y 11 de ellos, respectivamente.Sin embargo, SAG representa mejor la diversidad de los clados más comunes (datos ampliados, Fig. 3a), como Pelagic Bacteriales (SAR11), con SAG cubriendo casi 1300 especies y MAG solo 390 especies.En particular, los REF rara vez se superponían con MAG o SAG a nivel de especie y representaban >95% de los aproximadamente 1000 genomas no encontrados en los conjuntos metagenómicos de océano abierto estudiados aquí, principalmente debido a interacciones con otros tipos de especímenes marinos representativos aislados (por ejemplo, sedimentos). .o anfitrión-asociado).Para que esté ampliamente disponible para la comunidad científica, este recurso del genoma marino, que también incluye fragmentos no clasificados (por ejemplo, de fagos predichos, islas genómicas y fragmentos de genoma para los cuales no hay datos suficientes para la reconstrucción MAG), se puede comparar con datos taxonómicos. .Acceda a anotaciones junto con la función genética y los parámetros contextuales en la base de datos de microbiología oceánica (OMD; https://microbiomics.io/ocean/).
Luego nos propusimos explorar la riqueza y la novedad del potencial biosintético en los microbiomas de mar abierto.Con este fin, primero utilizamos antiSMASH para todos los MAG, SAG y REF encontrados en 1038 metagenomas (métodos) marinos para predecir un total de 39,055 BGC.Luego los agrupamos en 6907 GCF no redundantes y 151 poblaciones de grupos de genes (GCC; Tabla complementaria 2 y métodos) para tener en cuenta la redundancia inherente (es decir, el mismo BGC puede codificarse en múltiples genomas) y los datos metagenómicos Fragmentación de BGC concentrados.Los BGC incompletos no aumentaron significativamente, si los hubo (Información complementaria), el número de GCF y GCC, respectivamente, y contienen al menos un miembro intacto de BGC en el 44% y el 86% de los casos.
A nivel del CCG, encontramos una amplia variedad de RiPP predichos y otros productos naturales (Fig. 2a).Entre ellos, por ejemplo, los arilpolienos, carotenoides, ectoínas y sideróforos pertenecen a GCC con una amplia distribución filogenética y una gran abundancia en metagenomas oceánicos, lo que puede indicar una amplia adaptación de los microorganismos al medio marino, incluida la resistencia a especies reactivas de oxígeno. Estrés oxidativo y osmótico..o absorción de hierro (más información).Esta diversidad funcional contrasta con un análisis reciente de aproximadamente 1,2 millones de BGC entre aproximadamente 190.000 genomas almacenados en la base de datos NCBI RefSeq (BiG-FAM/RefSeq, en lo sucesivo denominado RefSeq)29, que mostró que los péptidos sintetasa no ribosomal (NRPS) y la policétido sintasa (PKS) BGC (Información complementaria).También encontramos 44 (29%) GCC relacionados lejanamente con cualquier RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Fig. 2a y métodos) y 53 (35%) GCC solo en MAG, destacando el potencial para detectar sustancias químicas no descritas previamente en OMD.Dado que cada uno de estos GCC probablemente represente funciones biosintéticas muy diversas, analizamos más a fondo los datos a nivel de GCF en un esfuerzo por proporcionar una agrupación más detallada de BGC que se predice que codificarán productos naturales similares29.Un total de 3861 (56%) GCF identificados no se superpusieron con RefSeq, y> 97% de los GCF no estaban presentes en MIBiG, una de las bases de datos más grandes de BGC validados experimentalmente (Figura 2b).Si bien no es sorprendente descubrir muchas vías novedosas potenciales en entornos que no están bien representados por el genoma de referencia, nuestro método para eliminar la replicación de BGC en GCF antes de la evaluación comparativa difiere de informes anteriores 16 y nos permite proporcionar una evaluación imparcial de la novedad.La mayor parte de la nueva diversidad (3012 GCF o 78%) corresponde a terpenos predichos, RiPP u otros productos naturales, y la mayor parte (1815 GCF o 47%) está codificada en tipos desconocidos debido a su potencial biosintético.A diferencia de los grupos PKS y NRPS, es menos probable que estos BGC compactos se fragmenten durante el ensamblaje metagenómico 31 y permiten una caracterización funcional de sus productos que requiere más tiempo y recursos.
Un total de 39.055 BGC se agruparon en 6.907 GCF y 151 GCC.a, representación de datos (interna externa).Agrupación jerárquica de distancias BGC basada en GCC, 53 de las cuales están fijadas únicamente por MAG.El GCC contiene BGC de diferentes taxones (frecuencia de puerta transformada en ln) y diferentes clases de BGC (el tamaño del círculo corresponde a su frecuencia).Para cada GCC, la capa exterior representa el número de BGC, la prevalencia (porcentaje de muestras) y la distancia (distancia mínima del coseno de BGC (min (dMIBiG))) desde BiG-FAM a BGC.Los GCC con BGC estrechamente relacionados con BGC verificados experimentalmente (MIBiG) se resaltan con flechas.b Al comparar el GCF con los BGC previstos (BiG-FAM) y validados experimentalmente (MIBiG), se encontraron 3861 nuevos (d–>0,2) GCF.La mayoría (78%) de estos codifican RiPP, terpenos y otros supuestos productos naturales.c, todos los genomas del OMD encontrados en 1038 metagenomas marinos se colocaron en el árbol base GTDB para mostrar la cobertura filogenética del OMD.Los clados sin ningún genoma en el OMD se muestran en gris.El número de BGC corresponde al mayor número de BGC previstos por genoma en un clado determinado.Para mayor claridad, el último 15 % de los nodos están colapsados.Las flechas indican clados ricos en BGC (>15 BGC), con la excepción de Mycobacterium, Gordonia (solo superado por Rhodococcus) y Crocosphaera (solo superado por Synechococcus).d, Desconocido c.Eremiobacterota mostró la mayor diversidad biosintética (índice de Shannon basado en el tipo de producto natural).Cada banda representa el genoma con más BGC de la especie.T1PKS, PKS tipo I, T2/3PKS, PKS tipo II y tipo III.
Además de la riqueza y la novedad, exploramos la estructura biogeográfica del potencial biosintético del microbioma marino.La agrupación de muestras por distribución metagenómica promedio del número de copias de GCF (Métodos) mostró que las comunidades de baja latitud, superficiales, ricas en procarióticos y pobres en virus, en su mayoría de aguas superficiales o de aguas más profundas iluminadas por el sol, eran ricas en terpenos RiPP y BGC.Por el contrario, las comunidades polares, de aguas profundas, ricas en virus y partículas se asociaron con mayores abundancias de NRPS y PKS BGC (datos ampliados, Fig. 4 e información adicional).Finalmente, descubrimos que las comunidades tropicales y pelágicas bien estudiadas son las fuentes más prometedoras de nuevos terpenos (Figura de datos aumentada).Mayor potencial para PKS, RiPP y otros productos naturales (Figura 5a con datos ampliados).
Para complementar nuestro estudio del potencial biosintético de los microbiomas marinos, nuestro objetivo fue mapear su distribución filogenética e identificar nuevos clados enriquecidos con BGC.Con este fin, colocamos los genomas de microbios marinos en un árbol filogenético bacteriano y arqueal GTDB13 normalizado y superpusimos las supuestas vías biosintéticas que codifican (Fig. 2c).Hemos detectado fácilmente varios clados enriquecidos con BGC (representados por más de 15 BGC) en muestras de agua de mar (métodos) conocidos por su potencial biosintético, como las cianobacterias (Synechococcus) y las bacterias Proteus, como Tistrella32,33, o recientemente atrajeron la atención por su productos naturales .como Myxococcota (Sandaracinaceae), Rhodococcus y Planctomycetota34,35,36.Curiosamente, encontramos varios linajes previamente inexplorados en estos clados.Por ejemplo, aquellas especies con el potencial biosintético más rico en los filos Planctomycetota y Myxococcota pertenecían a órdenes y géneros candidatos no caracterizados, respectivamente (Tabla complementaria 3).En conjunto, esto sugiere que el OMD proporciona acceso a información filogenética previamente desconocida, incluidos microorganismos, que pueden representar nuevos objetivos para el descubrimiento de enzimas y productos naturales.
A continuación, caracterizamos el clado enriquecido con BGC no solo contando el número máximo de BGC codificados por sus miembros, sino también evaluando la diversidad de estos BGC, lo que explica la frecuencia de diferentes tipos de productos candidatos naturales (Fig. 2c y métodos). )..Descubrimos que en este estudio las especies con mayor diversidad biosintética estaban representadas por MAG bacterianos especialmente diseñados.Estas bacterias pertenecen al filo Candidatus Eremiobacterota no cultivado, que permanece en gran medida inexplorado, salvo algunos estudios genómicos37,38.Es de destacar que “ca.El género Eremiobacterota solo se ha analizado en un ambiente terrestre39 y no se sabe que incluya miembros enriquecidos en BGC.Aquí hemos reconstruido ocho MAG de la misma especie (identidad de nucleótidos > 99%) 23. Por lo tanto, proponemos el nombre de especie “Candidatus Eudoremicrobium malaspinii”, que lleva el nombre de la nereida (ninfa marina), un hermoso regalo de la mitología y las expediciones griegas.'Ka.Según la anotación filogenética 13, E. malaspinii no tiene parientes conocidos previamente por debajo del nivel de secuencia y, por lo tanto, pertenece a una nueva familia bacteriana que proponemos “Ca.E. malaspinii” como especie tipo y “Ca.Eudormicrobiaceae” como nombre oficial (Información complementaria).Breve reconstrucción metagenómica de 'Ca.El proyecto del genoma de E. malaspinii fue validado mediante una secuenciación metagenómica de lectura larga y muy baja entrada y un ensamblaje dirigido de una sola muestra (Métodos) como un único cromosoma lineal de 9,63 Mb con una duplicación de 75 kb.como la única ambigüedad restante.
Para establecer el contexto filogenético de esta especie, buscamos 40 especies estrechamente relacionadas en muestras metagenómicas adicionales enriquecidas con eucariotas de la expedición Tara Ocean mediante la reconstrucción específica del genoma.Brevemente, hemos vinculado lecturas metagenómicas con fragmentos genómicos asociados con “Ca.E. malaspinii” y planteó la hipótesis de que una mayor tasa de reclutamiento en esta muestra indica la presencia de otros parientes (métodos).Como resultado, encontramos 10 MAG, una combinación de 19 MAG que representan cinco especies en tres géneros dentro de una familia recientemente definida (es decir, "Ca. Eudormicrobiaceae").Después de la inspección manual y el control de calidad (datos ampliados, Fig. 6 e información adicional), encontramos que “Ca.Las especies de Eudormicrobiaceae presentan genomas más grandes (8 Mb) y un potencial biosintético más rico (14 a 22 BGC por especie) que otros miembros de "Ca".Clado Eremiobacterota (hasta 7 BGC) (Fig. 3a-c).
a, Posiciones filogenéticas de los cinco 'Ca.Las especies de Eudormicrobiaceae mostraron riqueza en BGC específica de las líneas marinas identificadas en este estudio.El árbol filogenético incluye todo el 'Ca.MAG Eremiobacterota y miembros de otros filos (números de genoma entre paréntesis) proporcionados en GTDB (versión 89) se utilizaron como antecedentes evolutivos (Métodos).Las capas más externas representan clasificaciones a nivel de familia (“Ca. Eudormicrobiaceae” y “Ca. Xenobiaceae”) y a nivel de clase (“Ca. Eremiobacteria”).Las cinco especies descritas en este estudio están representadas por códigos alfanuméricos y nombres binomiales propuestos (Información complementaria).B, está bien.Las especies de Eudormicrobiaceae comparten siete núcleos BGC comunes.La ausencia de BGC en el clado A2 se debió a que el MAG representativo estaba incompleto (Tabla complementaria 3).Los BGC son específicos de “Ca.Amphithomicrobium” y “Ca.Amphithomicrobium” (clados A y B) no se muestran.c, Todos los BGC codificados como “Ca.Se descubrió que Eudoremicrobium taraoceanii se expresa en 623 metatranscriptomas extraídos de los océanos de Tara.Los círculos sólidos indican transcripción activa.Los círculos naranjas denotan cambios de pliegue transformados en log2 por debajo y por encima de la tasa de expresión del gen de mantenimiento (métodos).d, curvas de abundancia relativa (métodos) que muestran 'Ca.Las especies de Eudormicrobiaceae están muy extendidas en la mayoría de las cuencas oceánicas y en toda la columna de agua (desde la superficie hasta una profundidad de al menos 4000 m).Con base en estas estimaciones, encontramos que 'Ca.E. malaspinii' representa hasta el 6% de las células procarióticas en las comunidades pelágicas asociadas a cereales de aguas profundas.Consideramos que una especie estaba presente en un sitio si se encontraba en cualquier fracción del tamaño de una capa profunda determinada.IO – Océano Índico, NAO – Atlántico Norte, NPO – Pacífico Norte, RS – Mar Rojo, SAO – Atlántico Sur, SO – Océano Austral, SPO – Pacífico Sur.
Estudiando la abundancia y distribución de Ca.Eudormicrobiaceae, que, como encontramos, predomina en la mayoría de las cuencas oceánicas, así como en toda la columna de agua (Fig. 3d).A nivel local, constituyen el 6% de la comunidad microbiana marina, lo que los convierte en una parte importante del microbioma marino mundial.Además, encontramos el contenido relativo de Ca.Las especies de Eudormicrobiaceae y sus niveles de expresión de BGC fueron más altos en la fracción enriquecida en eucariotas (Fig. 3c y datos ampliados, Fig. 7), lo que indica una posible interacción con partículas, incluido el plancton.Esta observación guarda cierta semejanza con 'Ca.Los BGC de Eudoremicrobium que producen productos naturales citotóxicos a través de vías conocidas pueden exhibir un comportamiento depredador (Información complementaria y datos ampliados, Figura 8), similar a otros depredadores que producen específicamente metabolitos como Myxococcus41.Descubrimiento de Ca.Eudormicrobiaceae en muestras menos disponibles (océano profundo) o eucariotas en lugar de procariotas puede explicar por qué estas bacterias y su inesperada diversidad de BGC siguen sin estar claras en el contexto de la investigación de alimentos naturales.
En última instancia, buscamos validar experimentalmente la promesa de nuestro trabajo basado en microbiomas para descubrir nuevas vías, enzimas y productos naturales.Entre las diferentes clases de BGC, se sabe que la vía RiPP codifica una rica diversidad química y funcional debido a diversas modificaciones postraduccionales del péptido central por enzimas maduras42.Entonces elegimos dos 'Ca.Los BGC RiPP de Eudoremicrobium (Figuras 3b y 4a-e) se basan en lo mismo que cualquier BGC conocido (\(\bar{d}\)MIBiG y \(\bar{d}\)RefSeq superior a 0,2).
a – c, Expresión heteróloga in vitro y ensayos enzimáticos in vitro de un nuevo grupo (\(\bar{d}\)RefSeq = 0,29) de biosíntesis de RiPP específico para especies de Ca de aguas profundas.E. malaspinii' condujo a la producción de productos difosforilados.c, modificaciones identificadas mediante MS/MS de alta resolución (HR) (fragmentación indicada por iones byy en la estructura química) y RMN (datos ampliados, Fig. 9).d, este péptido fosforilado exhibe una baja inhibición micromolar de la elastasa de neutrófilos de mamíferos, que no se encuentra en el péptido de control ni en el péptido deshidratante (deshidratación inducida por eliminación química).El experimento fué repetido tres veces con resultados similares.Por ejemplo, la expresión heteróloga de un segundo grupo novedoso \(\bar{d}\)RefSeq = 0,33) de biosíntesis de proteínas aclara la función de cuatro enzimas maduras que modifican el péptido central de 46 aminoácidos.Los residuos se tiñen según el sitio de modificación previsto por HR-MS/MS, marcaje de isótopos y análisis de RMN (información complementaria).La coloración discontinua indica que la modificación se produce en cualquiera de los dos residuos.La figura es una recopilación de numerosas construcciones heterólogas para mostrar la actividad de todas las enzimas maduras en el mismo núcleo.h, Ilustración de datos de RMN para la N-metilación de la amida principal.Los resultados completos se muestran en la fig.10 con datos ampliados.i, la posición filogenética de la enzima del grupo de proteínas FkbM madura entre todos los dominios FkbM que se encuentran en la base de datos MIBiG 2.0 revela una enzima de esta familia con actividad N-metiltransferasa (Información complementaria).Se muestran diagramas esquemáticos de BGC (a, e), estructuras peptídicas precursoras (b, f) y supuestas estructuras químicas de productos naturales (c, g).
La primera vía RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) se encontró sólo en especies de aguas profundas “Ca.E. malaspinii” y codifica el precursor del péptido (Fig. 4a, b).En esta enzima madura, hemos identificado un único dominio funcional homólogo al dominio de deshidratación de la lantipéptido sintasa que normalmente cataliza la fosforilación y la posterior eliminación de 43 (Información complementaria).Por lo tanto, predecimos que la modificación del péptido precursor implica una deshidratación en dos pasos.Sin embargo, utilizando espectrometría de masas en tándem (MS / MS) y espectroscopia de resonancia magnética nuclear (NMR), identificamos un péptido lineal polifosforilado (Fig. 4c).Aunque inesperado, encontramos varias líneas de evidencia que respaldan que es el producto final: dos huéspedes heterólogos diferentes y sin deshidratación en ensayos in vitro, identificación de residuos clave mutados en el sitio de deshidratación catalítica de la enzima madura.todo reconstruido por “Ca”.El genoma de E. malaspinii (datos ampliados, Fig. 9 e información adicional) y, finalmente, la actividad biológica del producto fosforilado, pero no de la forma deshidratada sintetizada químicamente (Fig. 4d).De hecho, encontramos que exhibe una baja actividad inhibidora de proteasa micromolar contra la elastasa de neutrófilos, comparable a otros productos naturales relacionados en el rango de concentración (IC50 = 14,3 μM) 44, a pesar de que el papel ecológico aún está por dilucidar.Con base en estos resultados, proponemos denominar la vía "fosfeptina".
El segundo caso es una vía RiPP compleja específica de 'Ca.Se predijo que el género Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) codificaría productos proteicos naturales (Fig. 4e).Estas vías son de particular interés biotecnológico debido a la densidad esperada y la variedad de modificaciones químicas inusuales establecidas por las enzimas codificadas por las BGC relativamente cortas45.Encontramos que esta proteína se diferencia de las proteínas caracterizadas previamente en que carece tanto del motivo principal NX5N de las policeramidas como del bucle de lantionina de las landornamidas 46 .Para superar las limitaciones de los patrones de expresión heterólogos comunes, los utilizamos junto con un sistema personalizado de Microvirgula aerodenitrificans para caracterizar cuatro enzimas de la vía madura (métodos).Utilizando una combinación de MS/MS, marcaje de isótopos y RMN, detectamos estas enzimas maduras en el núcleo de 46 aminoácidos del péptido (Fig. 4f, g, datos ampliados, Figs. 10-12 e información adicional).Entre las enzimas maduras, caracterizamos la primera aparición de un miembro de la familia FkbM O-metiltransferasa 47 en la vía RiPP y encontramos inesperadamente que esta enzima madura introduce N-metilación de la cadena principal (Fig. 4h, i e información adicional).Aunque esta modificación se conoce en productos naturales NRP48, la N-metilación enzimática de enlaces amida es una reacción compleja pero biotecnológicamente significativa49 que hasta ahora ha sido de interés para la familia de borosinas RiPP.Especificidad 50,51.La identificación de esta actividad en otras familias de enzimas y RiPP puede abrir nuevas aplicaciones y ampliar la diversidad funcional de las proteínas 52 y su diversidad química.Con base en las modificaciones identificadas y la longitud inusual de la estructura del producto propuesta, proponemos un nombre de vía "pitonamida".
El descubrimiento de una enzimología inesperada en una familia de enzimas caracterizada funcionalmente ilustra la promesa de la genómica ambiental para nuevos descubrimientos, y también ilustra la capacidad limitada para la inferencia funcional basada únicamente en la homología de secuencia.Por lo tanto, junto con los informes de RiPP polifosforilados bioactivos no canónicos, nuestros resultados demuestran un valor crítico pero que requiere muchos recursos para los esfuerzos de la biología sintética para descubrir completamente la riqueza funcional, la diversidad y las estructuras inusuales de los compuestos bioquímicos.
Aquí demostramos el rango de potencial biosintético codificado por microbios y su contexto genómico en el microbioma marino global, facilitando investigaciones futuras al poner el recurso resultante a disposición de la comunidad científica (https://microbiomics.io/ocean/).Descubrimos que gran parte de su novedad filogenética y funcional solo se puede obtener mediante la reconstrucción de MAG y SAG, especialmente en comunidades microbianas subutilizadas que podrían guiar futuros esfuerzos de bioprospección.Aunque aquí nos centraremos en 'Ca.Eudormicrobiaceae” como un linaje especialmente “talentoso” biosintéticamente, muchos de los BGC predichos en la microbiota no descubierta probablemente codifican enzimologías no descritas previamente que producen compuestos con acciones ambiental y/o biotecnológicamente significativas.
Se incluyeron conjuntos de datos metagenómicos de importantes estudios oceanográficos y de series temporales con suficiente profundidad de secuenciación para maximizar la cobertura de las comunidades microbianas marinas globales en cuencas oceánicas, capas profundas y a lo largo del tiempo.Estos conjuntos de datos (Tabla complementaria 1 y Figura 1) incluyen metagenómica de muestras recolectadas en los océanos de Tara (enriquecidas con virus, n = 190; enriquecidas con procariotas, n = 180) 12, 22 y la expedición BioGEOTRACES (n = 480).Serie temporal oceánica hawaiana (HOT, n = 68), Serie temporal Bermuda-Atlántico (BATS, n = 62)21 y Expedición Malaspina (n = 58)23.Las lecturas de secuenciación de todos los fragmentos metagenómicos se filtraron por calidad usando BBMap (v.38.71) eliminando los adaptadores de secuenciación de las lecturas, eliminando las lecturas asignadas a secuencias de control de calidad (genomas PhiX) y usando trimq = 14, maq = 20 descarta la mala calidad de lectura. maxns = 0 y minlength = 45. Los análisis posteriores se ejecutaron o fusionaron con lecturas de control de calidad si se especificaban (bbmerge.sh minoverlap=16).Las lecturas de control de calidad se normalizaron (objetivo de bbnorm.sh = 40, profundidad mental = 0) antes de la compilación utilizando metaSPAdes (v.3.11.1 o v.3.12 si es necesario)53.Los contigs de andamio resultantes (en lo sucesivo denominados andamios) finalmente se filtraron por longitud (≥1 kb).
Las 1038 muestras metagenómicas se dividieron en grupos, y para cada grupo de muestras, las lecturas de control de calidad metagenómica de todas las muestras se compararon con los corchetes de cada muestra por separado, lo que dio como resultado el siguiente número de lecturas de grupos entre corchetes por pares: Virus marinos de Tara: enriquecidos (190×190 ), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT y BATS (610×610) y Malaspina (58×58).El mapeo se realizó utilizando Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, que permite hacer coincidir las lecturas con sitios secundarios (usando el indicador -a).Las alineaciones se filtraron para que tuvieran al menos 45 bases de largo, tuvieran ≥97% de identidad y abarcaran ≥80% de lecturas.Los archivos BAM resultantes se procesaron utilizando el script jgi_summarize_bam_contig_ Depths para MetaBAT2 (v.2.12.1)55 para proporcionar cobertura intra e intermuestras para cada grupo.Finalmente, los brackets se agruparon para aumentar la sensibilidad ejecutando MetaBAT2 individualmente en todas las muestras con –minContig 2000 y –maxEdges 500. Usamos MetaBAT2 en lugar de un boxeador conjunto porque se ha demostrado en pruebas independientes que es el boxeador individual más efectivo.y de 10 a 50 veces más rápido que otros boxeadores de uso común57.Para probar el efecto de las correlaciones de abundancia, una submuestra de metagenómica seleccionada al azar (10 para cada uno de los dos conjuntos de datos de Tara Ocean, 10 para BioGEOTRACES, 5 para cada serie temporal y 5 para Malaspina) utilizó adicionalmente solo muestras.Las muestras internas se agrupan para obtener información de cobertura.(Información adicional).
En el análisis posterior se incluyeron genomas adicionales (externos), a saber, 830 MAG seleccionados manualmente de un subconjunto del conjunto de datos Tara Oceans26, 5287 SAG del conjunto de datos GORG20 y datos de la base de datos MAR (MarDB v. 4) de 1707 REF aislados y 682 SAG) 27. Para el conjunto de datos MarDB, los genomas se seleccionan en función de los metadatos disponibles si el tipo de muestra coincide con la siguiente expresión regular: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] aislado'.
La calidad de cada contenedor metagenómico y genomas externos se evaluó utilizando CheckM (v.1.0.13) y Lineage Workflow de Anvi'o (v.5.5.0)58,59.Si CheckM o Anvi'o informa ≥50% de integridad/integridad y ≤10% de contaminación/redundancia, guarde las células metagenómicas y los genomas externos para su posterior análisis.Luego, estas puntuaciones se combinaron en integridad media (mcpl) y contaminación media (mctn) para clasificar la calidad del genoma según los criterios comunitarios60 de la siguiente manera: alta calidad: mcpl ≥ 90% y mctn ≤ 5%;buena calidad: mcpl ≥ 70%, mctn ≤ 10%, calidad media: mcpl ≥ 50% y mctn ≤ 10%, calidad regular: mcpl ≤ 90% o mctn ≥ 10%.Luego, los genomas filtrados se correlacionaron con puntuaciones de calidad (Q y Q') de la siguiente manera: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilidad de la cepa)/100 + 0,5 x log[N50].(implementado en dRep61).
Para permitir el análisis comparativo entre diferentes fuentes de datos y tipos de genomas (MAG, SAG y REF), se eliminaron las referencias de 34.799 genomas en función de la identidad de nucleótidos promedio (ANI) de todo el genoma utilizando dRep (v.2.5.4).Repeticiones)61 ​​con umbrales de ANI del 95%28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) y genes marcadores de copia única que utilizan SpecI63 que proporciona agrupamiento del genoma a nivel de especie.Se seleccionó un genoma representativo para cada grupo dRep de acuerdo con el puntaje de calidad máximo (Q') definido anteriormente, que se consideró representativo de la especie.
Para evaluar la velocidad del mapeo, se utilizó BWA (v.0.7.17-r1188, -a) para mapear los 1038 conjuntos de lecturas metagenómicas con 34,799 genomas contenidos en el OMD.Las lecturas con control de calidad se mapearon en modo de extremo único y las alineaciones resultantes se filtraron para retener solo alineaciones de ≥45 pb de longitud.e identidad ≥95%.La proporción de visualización para cada muestra es el porcentaje de lecturas restantes después de la filtración dividido por el número total de lecturas de control de calidad.Utilizando el mismo enfoque, cada uno de los 1038 metagenomas se redujo a 5 millones de inserciones (datos ampliados, Fig. 1c) y se comparó con GORG SAG en OMD y en todo GEM16.La cantidad de MAG recuperados del agua de mar en el catálogo GEM16 se determinó mediante consultas de palabras clave de fuentes metagenómicas, seleccionando muestras de agua de mar (por ejemplo, a diferencia de sedimentos marinos).Específicamente, seleccionamos “acuático” como “categoría_ecosistema”, “marino” como “tipo_ecosistema” y filtramos “hábitat” como “océano profundo”, “marino”, “marítimo oceánico”, “marino pelágico”, “agua marina”, “Océano”, “Agua de Mar”, “Agua de Mar Superficial”, “Agua de Mar Superficial”.Esto resultó en 5903 MAG (734 de alta calidad) distribuidos en 1823 OTU (ver aquí).
Los genomas procarióticos se anotaron taxonómicamente utilizando GTDB-Tk (v.1.0.2)64 con parámetros predeterminados dirigidos a GTDB r89 versión 13. Se utilizó Anvi'o para identificar genomas eucariotas basándose en la predicción de dominio y recuperación ≥50% y redundancia ≤ 10%.La anotación taxonómica de una especie se define como uno de sus genomas representativos.Con la excepción de los eucariotas (148 MAG), cada genoma fue anotado funcionalmente primero usando prokka (v.1.14.5)65, nombrando genes completos, definiendo parámetros de "arqueas" o "bacterias" según sea necesario, lo que también se informa para los no eucariotas. genes codificantes.y regiones CRISPR, entre otras características genómicas.Anote los genes predichos identificando genes marcadores universales de copia única (uscMG) usando fetchMG (v.1.2)66, asigne grupos de ortólogos y consulte usando emapper (v.2.0.1)67 basado en eggNOG (v.5.0)68.Base de datos KEGG (publicada el 10 de febrero de 2020) 69. El último paso se realizó comparando proteínas con la base de datos KEGG utilizando DIAMOND (v.0.9.30)70 con una consulta y una cobertura temática de ≥70 %.Los resultados se filtraron aún más de acuerdo con NCBI Prokaryotic Genome Annotation Pipeline71 en función de una tasa de bits ≥ 50 % de la tasa de bits máxima esperada (enlace mismo).Las secuencias de genes también se utilizaron como entrada para identificar BGC en el genoma usando antiSMASH (v.5.1.0)72 con parámetros predeterminados y diferentes explosiones de grupos.Todos los genomas y anotaciones se han compilado en OMD junto con los metadatos contextuales disponibles en la web (https://microbiomics.io/ocean/).
De manera similar a los métodos descritos previamente12,22, utilizamos CD-HIT (v.4.8.1) para agrupar >56,6 millones de genes codificadores de proteínas de genomas bacterianos y arqueales de OMD en un 95% de identidad y genes más cortos (90% de cobertura)73 hasta >17,7 millones de grupos de genes.La secuencia más larga se eligió como gen representativo de cada grupo de genes.Luego, los 1038 metagenomas se compararon con> 17,7 millones de miembros del grupo BWA (-a) y los archivos BAM resultantes se filtraron para retener solo las alineaciones con ≥95% por ciento de identidad y ≥45 alineaciones de bases.La abundancia de genes con longitud normalizada se calculó contando primero las inserciones de la mejor alineación única y luego, para las inserciones con mapas difusos, agregando recuentos fraccionarios a los genes diana correspondientes proporcionales a su número de inserciones únicas.
Los genomas del OMD ampliado (con MAG adicionales de "Ca. Eudormicrobiaceae", ver más abajo) se agregaron a la base de datos de la herramienta de análisis metagenómico mOTUs74 (v.2.5.1) para crear una base de datos de referencia mOTU extendida.Sólo seis genomas de copia única (23.528 genomas) sobrevivieron de diez uscMG.La ampliación de la base de datos dio como resultado 4.494 grupos adicionales a nivel de especie.Se analizaron 1038 metagenomas utilizando parámetros mOTU predeterminados (v.2).El perfil mOTU no detectó un total de 989 genomas contenidos en 644 grupos mOTU (95% REF, 5% SAG y 99,9% pertenecientes a MarDB).Esto refleja varias fuentes adicionales de aislamiento marino de los genomas de MarDB (la mayoría de los genomas no detectados están asociados con organismos aislados de sedimentos, huéspedes marinos, etc.).Para continuar centrándonos en el entorno de mar abierto en este estudio, los excluimos del análisis aguas abajo a menos que fueran detectados o incluidos en la base de datos mOTU ampliada creada en este estudio.
Todos los BGC de MAG, SAG y REF en OMD (ver arriba) se combinaron con BGC identificados en todos los andamios metagenómicos (antiSMASH v.5.0, parámetros predeterminados) y se caracterizaron usando BiG-SLICE (v.1.1) (dominio PFAM)75.Con base en estas características, calculamos todas las distancias de cosenos entre BGC y las agrupamos (enlaces medios) en GCF y GCC utilizando umbrales de distancia de 0,2 y 0,8 respectivamente.Estos umbrales son una adaptación de los umbrales utilizados anteriormente utilizando la distancia euclidiana75 junto con la distancia del coseno, lo que alivia parte del error en la estrategia de agrupación original de BiG-SLICE (Información complementaria).
Luego, los BGC se filtraron para retener solo ≥5 kb codificados en estructuras para reducir el riesgo de fragmentación como se describió anteriormente y para excluir los REF y SAG de MarDB que no se encuentran en 1038 metagenomas (ver arriba).Esto dio como resultado un total de 39.055 BGC codificados por el genoma OMD, con 14.106 adicionales identificados en fragmentos metagenómicos (es decir, no combinados en MAG).Estos BGC "metagenómicos" se utilizaron para estimar la proporción del potencial de biosíntesis del microbioma marino no capturado en la base de datos (Información complementaria).Cada BGC se caracterizó funcionalmente de acuerdo con los tipos de productos predictivos definidos por anti-SMASH o categorías de productos más generales definidas en BiG-SCAPE76.Para evitar sesgos de muestreo en la cuantificación (composición taxonómica y funcional de GCC/GCF, distancia de GCF y GCC a las bases de datos de referencia, y abundancia metagenómica de GCF), al mantener solo el BGC más largo por GCF para cada especie, se deduplicaron aún más 39,055 BGC. resultando en un total de 17,689 BGC.
La novedad de GCC y GCF se evaluó en función de la distancia entre la base de datos calculada (base de datos RefSeq en BiG-FAM)29 y el BGC verificado experimentalmente (MIBIG 2.0)30.Para cada uno de los 17.689 BGC representativos, elegimos la distancia de coseno más pequeña a la base de datos respectiva.Estas distancias mínimas luego se promedian (media) según GCF o GCC, según corresponda.Un GCF se considera nuevo si la distancia a la base de datos es mayor que 0,2, lo que corresponde a una separación ideal entre el GCF (promedio) y la referencia.Para GCC, elegimos 0,4, que es el doble del umbral definido por GCF, para fijar una relación a largo plazo con los enlaces.
La abundancia metagenómica de BGC se estimó como la abundancia promedio de sus genes biosintéticos (determinados por anti-SMASH) disponibles a partir de perfiles a nivel genético.Luego se calculó la abundancia metagenómica de cada GCF o GCC como la suma de BGC representativos (de 17,689).Posteriormente, estos mapas de abundancia se normalizaron para la composición celular utilizando el recuento de mOTU por muestra, que también representó los esfuerzos de secuenciación (datos ampliados, Fig. 1d).La prevalencia de GCF o GCC se calculó como el porcentaje de muestras con una abundancia> 0.
La distancia euclidiana entre muestras se calculó a partir del perfil GCF normalizado.Estas distancias se redujeron de tamaño usando UMAP77 y las incrustaciones resultantes se usaron para agrupaciones basadas en densidad no supervisadas usando HDBSCAN78.El número mínimo óptimo de puntos para un grupo (y, por tanto, el número de grupos) utilizados por HDBSCAN se determina maximizando la probabilidad acumulada de pertenencia al grupo.Los grupos identificados (y una submuestra aleatoria equilibrada de estos grupos para tener en cuenta el sesgo en el análisis de varianza multivariado permutacional (PERMANOVA)) se probaron para determinar su significancia frente a distancias euclidianas no reducidas utilizando PERMANOVA.El tamaño promedio del genoma de las muestras se calculó en función de la abundancia relativa de mOTU y el tamaño estimado del genoma de los miembros de los genomas.En particular, el tamaño promedio del genoma de cada mOTU se estimó como el promedio de los tamaños del genoma de sus miembros corregidos para completar (después del filtrado) (por ejemplo, un genoma completo al 75% con una longitud de 3 Mb tiene un tamaño ajustado de 4 Megabyte).para genomas medianos con integridad ≥70%.Luego se calculó el tamaño promedio del genoma para cada muestra como la suma de los tamaños del genoma mOTU ponderados por la abundancia relativa.
Un conjunto filtrado de BGC codificados por genoma en OMD se muestra en árboles GTDB bacterianos y arqueales (en estructuras de ≥5 kb, excluyendo REF y SAG MarDB que no se encuentran en 1038 metagenomas, ver arriba) y sus categorías de productos predichas basadas en la filogenética. posición del genoma (ver arriba).Primero redujimos los datos por especie, utilizando como representativo el genoma con más BGC en esa especie.Para la visualización, los representantes se dividieron en grupos de árboles y nuevamente, para cada clado celular, se seleccionó como representante el genoma que contenía la mayor cantidad de BGC.Las especies enriquecidas con BGC (al menos un genoma con >15 BGC) se analizaron más a fondo calculando el índice de diversidad de Shannon para los tipos de productos codificados en esos BGC.Si todos los tipos de productos previstos son iguales, se considera que los híbridos químicos y otros BGC complejos (según lo predicho por anti-SMAH) pertenecen al mismo tipo de producto, independientemente de su orden en el grupo (por ejemplo, fusión proteína-bacteriocina y bacteriocina-proteoproteína). cuerpo).híbrido).
ADN restante (estimado en 6 ng) de la muestra MP1648 de Malaspina, correspondiente a la muestra biológica SAMN05421555 y coincidente con el conjunto de lectura metagenómica Illumina SRR3962772 para lectura corta, procesado de acuerdo con el protocolo de secuenciación PacBio con entrada ultrabaja para usar el kit PacBio SMRTbell de amplificación de muestras de ADNg (100-980-000) y kit de preparación de plantillas SMRTbell Express 2.0 (100-938-900).Brevemente, el ADN restante se cortó, reparó y purificó (perlas ProNex) usando Covaris (g-TUBE, 52104).Luego, el ADN purificado se somete a preparación de biblioteca, amplificación, purificación (perlas ProNex) y selección de tamaño (>6 kb, Blue Pippin) antes de un paso de purificación final (perlas ProNex) y secuenciación en la plataforma Sequel II.
Reconstrucción de los dos primeros ca.Para MAG Eremiobacterota, identificamos seis ANI adicionales> 99% (estos se incluyen en la Figura 3), que inicialmente se filtraron en función de las puntuaciones de contaminación (luego identificados como duplicaciones de genes, ver más abajo).También encontramos una bandeja con la etiqueta “Ca”.Eremiobacterota” de varios estudios23 y los usamos junto con ocho MAG de nuestro estudio como referencia para lecturas metagenómicas de 633 muestras eucariotas enriquecidas (>0,8 µm) usando BWA (v.0.7.17) Ref -r1188, – una bandera) para muestreo reducido mapeo (5 millones de lecturas).Con base en mapas específicos de enriquecimiento (filtrados por 95% de identidad de alineación y 80% de cobertura de lectura), se seleccionaron 10 metagenomas (cobertura esperada ≥5×) para el ensamblaje y 49 metagenomas adicionales (cobertura esperada ≥1×) para la correlación de contenido.Utilizando los mismos parámetros anteriores, estas muestras se agruparon y se agregaron 10 'Ca' adicionales.MAG Eremiobacterota ha sido restaurado.Estos 16 MAG (sin contar los dos que ya están en la base de datos) elevan el número total de genomas en el OMD ampliado a 34.815.A los MAG se les asignan rangos taxonómicos en función de su similitud genómica y posición en la GTDB.Se eliminaron 18 MAG utilizando dRep en 5 especies (IAN intraespecífico >99%) y 3 géneros (IAN intragenérico 85% a 94%) dentro de la misma familia79.Los representantes de las especies se seleccionaron manualmente en función de su integridad, contaminación y N50.La nomenclatura sugerida se proporciona en la Información complementaria.
Evaluar la integridad y contaminación de 'Ca.MAG Eremiobacterota, evaluamos la presencia de uscMG, así como conjuntos de genes marcadores de copia única específicos de linaje y dominio utilizados por CheckM y Anvi'o.La identificación de 2 duplicados de 40 uscMG se confirmó mediante reconstrucción filogenética (ver más abajo) para descartar cualquier contaminación potencial (esto corresponde al 5% según estos 40 genes marcadores).Un estudio adicional de cinco MAG representativos 'Ca.El bajo nivel de contaminantes en estos genomas reconstruidos se confirmó para las especies de Eremiobacterota utilizando la interfaz interactiva Anvi'o basada en correlaciones de abundancia y composición de secuencias (Información complementaria)59.
Para el análisis filogenómico, seleccionamos cinco MAG representativos "Ca".Eudormicrobiaceae”, todas las especies “Ca.El genoma de Eremiobacterota y miembros de otros filos (incluidos UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria y Planctomycetota) está disponible en GTDB (r89)13.Todos estos genomas se anotaron como se describió anteriormente para la extracción del gen marcador de copia única y la anotación BGC.Los genomas de GTDB se conservaron de acuerdo con los criterios de integridad y contaminación anteriores.El análisis filogenético se realizó utilizando el flujo de trabajo Anvi'o Phylogenetics59.El árbol se construyó utilizando IQTREE (v.2.0.3) (opciones predeterminadas y -bb 1000)80 en una alineación de 39 proteínas ribosómicas en tándem identificadas por Anvi'o (MUSCLE, v.3.8.1551)81.Sus posiciones fueron reducidas.para cubrir al menos el 50% del genoma82 y se utilizó Planctomycecota como un grupo externo basado en la topología del árbol GTDB.Se construyó un árbol de 40 uscMG utilizando las mismas herramientas y parámetros.
Utilizamos Traitar (v.1.1.2) con parámetros predeterminados (fenotipo, a partir de nucleótidos)83 para predecir rasgos microbianos comunes.Exploramos un posible estilo de vida depredador basado en un índice depredador desarrollado previamente84 que depende del contenido de un gen codificador de proteínas en el genoma.Específicamente, usamos DIAMOND para comparar proteínas en el genoma con la base de datos OrthoMCL (v.4)85 usando las opciones –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 Y contamos los genes correspondientes a los genes marcadores para depredadores y no depredadores.El índice es la diferencia entre el número de marcas depredadoras y no depredadoras.Como control adicional, también analizamos el genoma de “Ca”.El factor Entotheonella TSY118 se basa en su asociación con Ca.Eudoremicrobium (gran tamaño del genoma y potencial biosintético).A continuación, probamos vínculos potenciales entre genes marcadores depredadores y no depredadores y el potencial biosintético del Ca.Eudormicrobiaceae” y encontró que no más de un gen (de cualquier tipo de gen marcador, es decir, gen depredador/no depredador) se superpone con BGC, lo que sugiere que BGC no confunde las señales de depredación.Se realizó una anotación genómica adicional de replicones codificados utilizando TXSSCAN (v.1.0.2) para examinar específicamente el sistema de secreción, los pili y los flagelos86.
Se mapearon cinco 'Ca' representativos mediante el mapeo de 623 metatranscriptomas de las fracciones de enriquecimiento procariotas y eucariotas de los océanos Tara22,40,87 (usando BWA, v.0.7.17-r1188, -a flag).Genoma de Eudormicrobiaceae.Los archivos BAM se procesaron con FeatureCounts (v.2.0.1)88 después de una cobertura de lectura del 80 % y un filtrado de identidad del 95 % (con opciones featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Cuenta el Número de inserciones por gen.Los mapas generados se normalizaron para la longitud del gen y la abundancia del gen marcador mOTU (recuento de inserción promedio de longitud normalizada para genes con recuento de inserción >0) y se transformaron logarítmicamente a 22,74 para obtener la expresión relativa por célula de cada nivel de gen, lo que también explica la variabilidad de una muestra a otra durante la secuenciación.Tales proporciones permiten realizar análisis comparativos, lo que mitiga los problemas de composición cuando se utilizan datos de abundancia relativa.Solo se consideraron muestras con> 5 de los 10 genes marcadores mOTU para análisis adicionales para permitir que se detecte una porción suficientemente grande del genoma.
El perfil transcriptoma normalizado de 'Ca.E. taraoceanii se sometió a reducción de dimensionalidad usando UMAP y la representación resultante se usó para agrupación no supervisada usando HDBSCAN (ver arriba) para determinar el estado de expresión.PERMANOVA prueba la importancia de las diferencias entre los grupos identificados en el espacio de distancia original (no reducido).Se probó la expresión diferencial entre estas condiciones en todo el genoma (ver arriba) y se identificaron 201 vías KEGG en 6 grupos funcionales, a saber: BGC, sistema de secreción y genes flagelares de TXSSCAN, enzimas de degradación (proteasa y peptidasas) y depredadoras y no genes depredadores.Marcadores de índice depredador.Para cada muestra, calculamos la expresión normalizada mediana para cada clase (tenga en cuenta que la expresión de BGC en sí se calcula como la expresión mediana de genes biosintéticos para ese BGC) y probamos su importancia en todos los estados (prueba de Kruskal-Wallis ajustada para FDR).
Los genes sintéticos se adquirieron de GenScript y los cebadores de PCR se adquirieron de Microsynth.Para la amplificación del ADN se utilizó la polimerasa Phusion de Thermo Fisher Scientific.Para la purificación del ADN se utilizaron plásmidos NucleoSpin, gel NucleoSpin y kit de purificación por PCR de Macherey-Nagel.Las enzimas de restricción y la ADN ligasa T4 se adquirieron de New England Biolabs.Se adquirieron productos químicos distintos del isopropil-β-d-1-tiogalactopiranósido (IPTG) (Biosynth) y 1,4-ditiotreitol (DTT, AppliChem) de Sigma-Aldrich y se utilizaron sin purificación adicional.Los antibióticos cloranfenicol (Cm), diclorhidrato de espectinomicina (Sm), ampicilina (Amp), gentamicina (Gt) y carbenicilina (Cbn) se adquirieron en AppliChem.Los componentes de los medios Bacto Triptona y Bacto Yeast Extract se adquirieron de BD Biosciences.La tripsina para la secuenciación se adquirió en Promega.
Las secuencias genéticas se extrajeron del BGC 75.1 predicho anti-SMASH.E. malaspinii (Información complementaria).
Los genes embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) y embAM (incluidas las regiones intergénicas) se secuenciaron como construcciones sintéticas en pUC57 (AmpR) con y sin codones optimizados para la expresión en E. cuando.El gen embA se subclonó en el primer sitio de clonación múltiple (MCS1) de pACYCDuet-1(CmR) y pCDFDuet-1(SmR) con sitios de escisión BamHI y HindIII.Los genes embM y embMopt (codón optimizado) se subclonaron en MCS1 pCDFDuet-1(SmR) con BamHI y HindIII y se colocaron en el segundo sitio de clonación múltiple de pCDFDuet-1(SmR) y pRSFDuet-1(KanR) (MCS2) con NdeI/ChoI.El casete embAM se subclonó en pCDFDuet1(SmR) con sitios de escisión BamHI y HindIII.El gen orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) se construyó mediante PCR de extensión superpuesta usando los cebadores EmbI_OE_F_NdeI y EmbI_OE_R_XhoI, se digirió con NdeI/XhoI y se ligó en pCDFDuet-1-EmbM (MCS1) usando las mismas enzimas de restricción (suplementario). mesa).6).La digestión y ligación con enzimas de restricción se realizaron según el protocolo del fabricante (New England Biolabs).

 


Hora de publicación: 14-mar-2023