Jul 22, 2023
Блуждающие метилтрансферазы создают мозаичный эпигенетический ландшафт и влияют на эволюцию группы Bacteroides fragilis.
Nature Communications, том 14, Номер статьи: 4082 (2023) Ссылаться на эту статью 3810 Доступов 41 Подробности Altmetric Metrics У бактерий были обнаружены три типа метильных модификаций ДНК.
Nature Communications, том 14, номер статьи: 4082 (2023) Цитировать эту статью
3810 Доступов
41 Альтметрика
Подробности о метриках
В бактериальных геномах были обнаружены три типа модификаций метила ДНК, а механистические исследования продемонстрировали роль метилирования ДНК в физиологических функциях, начиная от защиты от фагов и заканчивая транскрипционным контролем вирулентности и взаимодействиями хозяин-патоген. Несмотря на повсеместное распространение метилтрансфераз и огромное разнообразие возможных моделей метилирования, эпигеномное разнообразие для большинства видов бактерий остается неизученным. Члены группы Bacteroides fragilis (BFG) обитают в желудочно-кишечном тракте человека в качестве ключевых игроков в симбиотических сообществах, но также могут вызывать анаэробные инфекции, которые становятся все более устойчивыми к множеству лекарств. В этой работе мы используем технологии длительного секвенирования для проведения пангеномного (n = 383) и панэпигеномного (n = 268) анализа клинических изолятов BFG, выращенных в результате инфекций, наблюдавшихся в Клиническом центре NIH в течение четырех десятилетий. Наш анализ показывает, что отдельные виды BFG содержат сотни мотивов метилирования ДНК, причем большинство индивидуальных комбинаций мотивов встречаются уникально в отдельных изолятах, что подразумевает огромное разнообразие метилирования без выборки в эпигеномах BFG. Анализ геномов BFG выявил более 6000 генов метилтрансфераз, примерно 1000 из которых были связаны с интактными профагами. Сетевой анализ выявил существенный поток генов среди разрозненных фаговых геномов, что подразумевает роль генетического обмена между фагами BFG как одного из основных источников, способствующих разнообразию эпигенома BFG.
Метилирование геномной ДНК обнаружено во всех трех областях клеточной жизни, а также у вирусов1,2,3. Геномы эукариот демонстрируют динамическое метилирование цитозина в положении C5 (5mC) в определенных контекстах CpG (5'-CG-3'), и регуляция этого метилирования CpG в определенных сайтах влияет на транскрипцию4, динамику восстановления генома и уплотнение генома5. Напротив, бактерии демонстрируют метилирование ДНК, специфичное для мотива (например, 5'-CC-6mA-TGG-3'), при этом почти все случаи данного мотива могут быть метилированы6. Подобно геномам эукариот, часто встречаются модификации 5mC; однако бактериальные геномы обнаруживают дополнительное метилирование в положении N4 цитозинов (4mC) и, чаще всего, в положении N6 аденинов (6mA)6. Метилирование бактериальной ДНК осуществляется ДНК-метилтрансферазами, некоторые из которых, по-видимому, присутствуют и активны во всех штаммах данного вида (например, Dam, который модифицирует GATC в Escherichia coli), тогда как другие ДНК-метилтрансферазы и гены, которые их кодируют, временно активны. приобретаемые и утрачиваемые с течением времени и не имеющие существенного значения для жизнеспособности культуры7. Классически метилирование бактериальной ДНК понималось прежде всего как побочный продукт антифаговой защиты, основанной на системах рестрикции-модификации8. Однако теперь стали ясны и другие физиологические последствия сохранения метилированной ДНК, часто в тысячах локусов. Исследования продемонстрировали роль метилирования бактериальной ДНК в регуляции транскрипционной активности, контролирующей фенотипы вирулентности9,10,11 и другие физиологические программы12,13, стабильность генома14,15 и влияющую на частоту мутаций в метилированных мотивах16,17, аналогично наблюдениям в эукариотических системах.
Бактерии группы Bacteroides fragilis (BFG) представляют более десятка видов родов Bacteroides, Parabacteroides и недавно интродуцированных родов Phocaeicola18. Эти многочисленные симбиоты легко обнаруживаются в анаэробных условиях в желудочно-кишечном тракте человека и участвуют во многих важных метаболических и иммунных функциях19,20,21. Они также являются одними из наиболее часто выздоравливающих бактерий при внекишечных анаэробных инфекциях и становятся все более устойчивыми ко многим антибиотикам, включая цефалоспорины и карбапенемы22,23. Их широкий фенотипический потенциал частично обеспечивается фазовой изменчивостью, набором локусов утилизации полисахаридов и использованием обратимых промоторов24,25.
5 kb each) could be detected in assemblies (Supplementary Fig. 1C). The numbers of identified rRNA operons per circular chromosome corresponded to the expected values for the species in almost all cases based on data derived from the Ribosomal RNA Database27./p>20,000 sampled genes within the dataset, implying that an immense number of additional gene families await discovery within the BFG. This pangenome openness is largely consistent with gut-derived Bacteroides metagenome assembled genomes32./p>3 kb in length encoding only accessory genes, Supplementary Data 3) were extracted from 414 genomes representing 13 species for which three or more genomes were available (378 genomes from this study and 36 genomes from NCBI)33. Comparison of each accessory region sequence with all others in this set demonstrated that >10% of such regions were shared between species, suggesting horizontal transfer (Fig. 2c). Each accessory region was probed for a variety of features, and it was found that phage, phage defense systems, DNA methyltransferases, conjugative machinery, episomes/plasmids, and antimicrobial resistance (AMR) genes were all more common in accessory regions detected in three or more species (Fig. 2c). For instance, accessory regions encoding the tetracycline resistance gene tet(Q) and/or a cassette with genes tet(X)1, tet(X)2, and the aminoglycoside modifying enzyme aadS were detected in 12 of 13 species analyzed (Fig. 2 and Supplementary Fig. 4), likely confirming a history of selective pressure from tetracycline and aminoglycoside compounds./p>95% average nucleotide identity (see Methods) (Supplementary Fig. 5A). The majority of circular contigs (550 out 575; 95.7%) had recognizable plasmid genes such as replicases or relaxases (see Methods), and a proportion of the remainder may represent replicative intermediates of transposons, but this was not analyzed further. Despite the ubiquity of both plasmids/episomes and AMR genes in the sequencing data, we found that most of these AMR genes were not located on plasmids/episomes (53 out of 1911 AMR genes were located within circular plasmid/episome contigs) among BFG species. The overwhelming majority (>97.2%) of AMR genes appeared to be located within chromosomes, and many were associated with integrative elements23. Many of the AMR genes encoded by plasmids/episomes also appeared associated with integration of integrative elements into plasmid backbones, consistent with possible shuttling of AMR genes between chromosomes and plasmids/episomes (Supplementary Fig. 5B)./p>90% of genomes in a species, ‘Shell’ was defined as presence in >10% and ≤90% genomes in a species, and ‘Cloud’ was defined as presence in <10% of genomes in a species./p>90% amino acid identity to previously identified DNA methyltransferases. Interestingly, in the course of our analysis, we observed that within each species, there is a positive correlation between genome size and number of putative DNA methyltransferases (Supplementary Fig. 6). BFG-632 is the longest genome in the entire collection, consistent with the greatest number of methyltransferases./p> = 95 and AF > = 85 were counted. Note that accessory region sequences can often consist of multiple mobile genetic elements or genomic islands in tandem, and no attempt was made to separate individual elements within these regions with the exception of bacteriophages./p>50 copies per chromosome), and in some cases these high copy number plasmids/episomes were represented in lower copy number in companion libraries sequenced on the same flow cell. We assessed that this was likely library cross-contamination and to reduce the likelihood of artifactual assignment of plasmids/episomes to the incorrect library, we excluded circular contigs with coverage that was either 80% of the coverage value of the bacterial chromosome or less or if the coverage was less than 30-fold on average across the sequence. This may have resulted in an underestimate of the true number of plasmids/episomes. Furthermore, the Flye assembler occasionally artifactually assembles sequences as concatemers of two or more tandem copies. Each circular sequence was aligned to itself with BLASTN, and, if the total length of the alignment was greater than 140% of the total length of the sequence, the episome was trimmed down to one unit length to eliminate potential artifactual tandem duplications. To determine if the filtered sequences had plasmid-associated genes, each sequence was run through MOBsuite75 followed by RPS-BLAST against the CDD database76 with flags “ -evalue 1e-2 -seg yes”. Hits were then cross-checked against a list of models related to plasmid replicases, relaxases, conjugative machinery, integrases, and transposes (Supplementary Data 14). Also, Abricate was run as described above on each sequence. Plasmids/episomes were clustered into approximate operational taxonomic units (OTUs) using anicalc and aniclust from CheckV with flags “--min_ani 95 --min_tcov 85” (minimum ANI = 95%, minimum AF = 85%). The network graph was visualized in Cytoscape77./p>10 Tb). Requests for materials associated this work require a standard NIH Material Transfer Agreement with the NIH and U.S. Government. Requests for materials should be addressed to John Dekker at [email protected]./p>