banner

ニュース

Jul 30, 2023

ホスト性が高い

Nature Communications volume 14、記事番号: 2676 (2023) この記事を引用

1390 アクセス

4 オルトメトリック

メトリクスの詳細

建築環境(BE)内のウイルスは公衆衛生上の懸念を引き起こしますが、一般に細菌ほど研究されていません。 BE におけるウイルス動態をより深く理解するために、この研究では、占有率が低いものから高いものまで、4 種類の BE にわたる 11 の生息地からのウイルスを評価しました。 ウイロームの多様性、組成、代謝機能、ライフスタイルは生息地に依存することがわかっています。 カウドヴィリテス種は BE の地表生息地に遍在しており、その一部は他の環境に存在するものとは異なります。 抗菌剤耐性遺伝子は、居住者が頻繁に触れる表面に生息するウイルスと、居住者の皮膚に生息するウイルスで同定されています。 多様な CRISPR/Cas 免疫システムと抗 CRISPR タンパク質がそれぞれ細菌宿主とウイルスに見られ、ウイルスと宿主の強く結合した関係と一致しています。 特定の生息環境で宿主の適応を潜在的に支援するウイルスの証拠は、独自の遺伝子挿入によって特定されます。 この研究は、ウイルスと宿主の相互作用が BE で頻繁に発生し、ウイルスが BE マイクロバイオームの不可欠なメンバーであることを示しています。

ウイルスは人間の健康に潜在的に有害な影響を与える 1 だけでなく、多くの生態系で重要な役割も果たしている 2、3、4 ため、私たちが注意を払う必要があります。 人々が通常、人生のほとんどを過ごす建築環境(BE)には、多種多様な微生物が生息しています5。しかし、BEに関するほとんどの研究は主に細菌と真菌に焦点を当てており、ウイルスは無視されています6、7。 BE 内のウイルスの総濃度は、約 105 粒子/立方メートルと推定されています8。 ほとんどの BE の環境条件は貧栄養であり、微生物の生活にはあまり適していないと考えられていますが 9、流行に関連したウイルス (例: SARS-CoV-210 や黄熱ウイルス 11) を含む、顕著に多様なウイルスが空気中の微生物群集で発見されています。 BE の表面上でも同様です。 公共の建物(保育園やトイレなど)におけるウイルスに関するいくつかの研究は、主に小さな空間スケールと限られたサンプルタイプに焦点を当てており、ウイルスの細菌宿主については調査されていません12、13、14。 ウイルス濃縮を行わずにバルクメタゲノムシーケンスを適用した最近の世界規模の研究では、ウイルスが BE の公共の表面に遍在しているという証拠が得られました 15。

ウイルスと宿主の相互作用は、多様な生態系におけるマイクロバイオームの生態と進化の中心です4,16,17。 最近のバイオインフォマティクスツールの進歩により、メタゲノム由来のウイルスとその潜在的な細菌宿主との関連性を正確に予測できるようになりました。これには、分子シグナル(つまり、クラスター化され、規則的に間隔をあけられた短い回文反復配列 [CRISPR] スペーサー、統合されたゲノム、および tRNA)の正確な一致や一貫性が含まれます。 k-mer周波数18. ファージは、生殖のために宿主の細胞機構を利用するために、温帯性と溶解性の生活環の切り替え、形質導入、宿主遺伝子の破壊など、多様なライフスタイルと伝達戦略を進化させてきました19。 ほとんどの海洋および土壌環境では、ファージは非常に多様で豊富であることが多く、そのため微生物宿主のかなりの部分に日常的に感染し、宿主ゲノム内でのウイルスにコードされた代謝補助遺伝子(AMG)の発現と合わせて重要な役割を果たしています。地球規模の栄養循環における4,20,21。 生態学的観点から見ると、微生物群集内のファージは、「勝者を殺す」モデルや「勝者に便乗する」モデルなど、いくつかの十分に確立された生態学的モデルを通じて溶解感染を確立することにより、細菌種間の競争を仲介することができます22。

ファージは細菌の遺伝的および表現型の急速な変化を引き起こす可能性がありますが、細菌の宿主は、新規突然変異やその他の分子機構を通じてファージの攻撃に対抗する防御機構を容易に進化させることもできます23。 最近、細菌におけるさまざまな機能的な CRISPR/CRISPR 関連 (Cas) システムが、全身にわたるヒトのメタゲノム研究で同定されました 24。 しかし、宿主免疫系に拮抗するために、ファージは感染中に細菌性 Cas ヌクレアーゼを不活性化する抗 CRISPR (Acr) タンパク質を進化させました 25。 阻害剤ファージによる CRISPR/Cas の長期不活化により、一部の細菌系統では CRISPR/Cas が消失したり、さらには欠如したりする可能性があります 26。

CRISPR/Cas システムは、世界中の都市環境の表面マイクロバイオームで報告されています 15。 しかし、BEで起こる感染の免疫機構やウイルスと宿主の相互作用(例、ウイルスと宿主の関係の範囲、蔓延するウイルスの生活環、Acrタンパク質の新規性など)はほとんど理解されていない。 この知識のギャップを埋め、BE におけるウイルスの多様性と生態系機能を調査するために、この研究では、香港 (HK) のさまざまな BE にわたる多様な生息地からの 738 個のバルク メタゲノムが調査されました。 この研究で特定された高度に結合したウイルスと宿主の相互作用は、ウイルスが細菌宿主の BE の特定の環境条件への適応を助けるという概念と、BE 内のほとんどの細菌集団の存在量がその常在ウイルスと強く相関しているという概念を裏付けています。 この研究は、ウイルスが BE マイクロバイオームの不可欠なメンバーであるという証拠を提供します。

桟橋、公共施設、住宅、地下鉄を含む香港の農村部および都市部の BE から収集された 738 個のバルク メタゲノムから (図 S1a、補足データ 1)、MetaWRAP を使用して約 450 万個の組み立てられたコンティグが生成されました (「方法」を参照)。ほとんどが1〜3 kbの長さのものが得られました(図S1b)。 ウイルスコンティグは、Visorter227 および DeepVirFinder28 を使用して同定されました。 後者は、より短いコンティグ(1〜3 kb;図S1c)でより良いパフォーマンスを示しました。 合計で、長さが 1 kb 以上のユニークなウイルス コンティグ 594,851 個がすべてのサンプルから回収されました (図 1a)。 品質フィルタリングの後、完全性が50%以上の1174個のウイルスゲノム(98個の完全なゲノム、346個の高品質ゲノム、および730個の中品質ゲノム)が特定されました(図S1d、補足データ2)。 これらのゲノムは 4 種類の BE によく存在し (図 1b)、それらの 66% が住宅の表面で検出されました (図 1c)。 バルクメタゲノムを分析したにもかかわらず、プロウイルス組み込み部位の評価に基づいて宿主組み込みの証拠を示したウイルスゲノムはわずか28%でした(つまり、宿主領域はウイルスゲノムの両端にあると予測されました)(図1c)。 特定された471のウイルス操作分類単位(vOTU)のうち、355が少なくとも2つのサンプルで見つかりました(図S2a)。 BE のタイプの中で、住宅で最も多くの vOTU が見つかりました。 より高い分類学的ランキングでは、ウイルス ゲノムは、それぞれ 332 の属レベルおよび 220 の科レベルの vOTU にクラスター化されました。 vOTUの希薄化曲線はプラトーに達しておらず、都市内のBEのバイローム多様性を捕捉するには追加のサンプルが必要であることを示唆しています(図S2a)。

a Virsorter2 (Vs2) および DeepVirFinder (DVF) によって決定され、CheckV によって評価された、1 kb を超える予測ウイルスおよび非ウイルスコンティグのコンティグ長の箱ひげ図。 コンティグの数 (n) が表示されます。 箱ひげ図は、中央値、第 1 四分位数、および第 3 四分位数を、1.5 の四分位範囲値内に描画されたひげで表します。 ひげの外側の点は外れ値です。 b 桟橋、公共施設、住宅、地下鉄のデータセットを組み合わせたウイルスゲノムの蓄積曲線。 c 50% を超える完全性を備えた 1174 ウイルス ゲノムのメタデータと分類。 d すべてのサンプルのブレイ・カーティス非類似度行列の主座標分析。 シンボルの色と形状は、それぞれ建築環境と表面素材を示します。

サンプルが発生源 (つまり、空気と地表) および材料 (つまり、コンクリート、金属、木材) の点で異なる生息地から収集されたことを考慮して、バイロームの生息地に依存する特徴をさらに調査しました。 ウイルスゲノムは、居住者の皮膚(全サンプルの21%)とドアノブ(15%)から最も頻繁に回収され、空気(2%)からは最も頻繁に回収されませんでした(図S2b)。 バイローム組成は生息地間でほとんど異なり(類似性の分析 R = 0.355、p < 0.001)、順列多変量分散分析により、生息地が変動の主な要因であることが確認されました(R2 = 0.148、p < 0.001)(図1d)。 空気中のバイロームは、地表に浮遊するバイロームとは異なり、主座標分析におけるブレイ・カーティスの非類似性距離および多変量分散の均一性に従って低い生息地内分散を示しました(多変量分散の順列分析 F = 53.29、p < 0.001) (図 1d、S2c)。 さらに、手すり、ポール、および切符売り場の vOTU は、居住者の皮膚や頻繁に触れる屋内表面 (ドアノブなど) の vOTU よりも有意に低いリッチネスおよびシャノン多様性指数を示しました (分散分析 [ANOVA]、p < 0.05;図 S2d、補足データ 3)。 種の均一性は生息地間で大きく異なりましたが(ANOVA、p < 0.05)、すべての生息地の平均均一性値は> 0.85であり(図S2d)、優勢なvOTUを持たない生息地がないことを示唆しています。

次に、統合微生物ゲノムおよびウイルス (IMG/VR) データベースからの既知のウイルス配列との比較に基づいて、vOTU を分類学的ランクに割り当てました29。 vOTU のほとんど (92.4%) は、他の生態系から収集されたウイルスの新規性の報告と同様に、既知のウイルスの属または科に分類学的に分類できず 2,30 、カウドビリセテス綱の未分類のメンバーとしてのみ解決できました。 (図1c)。 注釈付きのvOTUのうち、1.7%、1.7%、1.3%、0.6%は、それぞれdsDNAウイルス属パヘキサウイルス、ssRNA-RTウイルス科メタウイルス科、ssDNAウイルス科ジェノモウイルス科、およびssDNAウイルス科イノウイルス科に属していました(図S3)。 具体的には、広範に研究された毒性ファージのファミリーであるオートグラフィウイルス科のメンバー 31 が、地下鉄の空気中で濃縮され優勢でした(図 S3、補足データ 4)。 対照的に、パヘキサウイルス属のメンバーはドアノブや皮膚表面に豊富にありました(図S3、補足データ4)。これらは皮膚細菌(プロピオニバクテリウムなど)に感染することが示されているため、これは驚くべきことではありません。 さらに、ビロファージとして知られる新興ウイルス群であるオルトポリントウイルス目のメンバーもヒトの皮膚関連表面に豊富に存在していました(図S3)。 特に、パピローマウイルス科のヒト関連パピローマウイルスは、皮膚接触を介して直接的または間接的に感染する可能性があり34、主に頻繁に触れる生息地(ドアノブ、切符売り場、公共施設の手すりなど)で見られました(図S3a)。

カウドビリセテスは、らせん状の尾部と正二十面体キャプシド(尾部バクテリオファージ)を持つウイルスの一種であり、多様な生態系で蔓延しています 2,30。 BEの生息地全体に存在したカウドビリセテスのメンバーが共通の進化的起源を持っているかどうかを調べるために、77の参照タンパク質コードマーカー遺伝子を使用して、87の種レベルのvOTUを含む系統樹を構築しました(図2a)。 このツリーは、さまざまな BE 生息地に広く分布していたが、IMG / VR データベースでは分類できなかった Caudoviricetes vOTU がベンディゴウイルス属に属しているのに対し、1 つの未知の vOTU を含む別個のクレードがオオシマウイルス属に属していることを示しました(図 2a)。 。

a BE から派生した 87 種レベルの vOTU の最尤系統樹。 オオシマウイルスとベンディゴウイルスの 2 つのクラスターの枝は、それぞれ薄緑色とオレンジ色で示されています。 灰色と白の円は、新規のカウドビリテス ウイルスを示します。 b BE およびその他のデータセット (SMGC、GOV、および MetaSUB) から派生した 599 種レベルの vOTU の最尤系統樹。 新しい Caudoviricetes vOTU の分岐は赤色で示されています。 分岐長が 0.5 kb 未満の系統はクレードに折りたたまれており、外側のリングに白色で示されています。

香港 BE のカウドビリテス属メンバーの系統発生は、他の 3 つのウイルスデータセット、すなわち主に北米の被験者からの皮膚メタゲノム (皮膚微生物ゲノムコレクション [SMGC] データセット)35、全球海洋ウイルス [GOV] データセット 36 に対してさらに分析されました。 、および地下鉄と都市バイオームのメタゲノミクスとメタデザイン [MetaSUB] データセット15。 予想どおり、HK BE に由来するウイルスゲノムは、この研究からのシーケンスリードの 18.9% をリクルートしました。これは、SMGC および GOV データセットからそれぞれリクルートされた 0.3% および 0% よりも大幅に高かった (図 S4a)。 GOV データセットの結果 (0%) は、海洋環境のウイルスが強い人為的影響下にある BE のウイルスとは異なる系統に由来していることを示しています (図 S4a)。 4 つのデータセットからの 599 種レベルの vOTU を使用して系統樹がさらに構築されました。 それは、HK BE からの vOTU が、GOV データセットのものよりも SMGC および MetaSUB データセットのものに系統発生的に近いことを示しました (図 2b)。 枝の長さに基づいて、香港のBEと海水からのvOTUは比較的高い系統的多様性を持っていました(図S4b)。 それにもかかわらず、香港の BE からの vOTU の一部は一緒にクラスター化されており (図 2b)、BE の生息地が特定の vOTU に対して選択的であることを示唆しています。

香港の BE マイクロバイオームにおいてウイロームが果たす潜在的な機能的役割を調査するために、複数のデータベースを使用して、ウイローム全体で同定された 99,084 個のタンパク質コード遺伝子に注釈が付けられました。 その結果、タンパク質をコードする遺伝子の38%には有意なデータベース一致がなく、約2%には生物学的機能が割り当てられていなかったことが示されました(図3a、b)。これは、BEに見られるウイルスロームの潜在的な機能についてはほとんどわかっていないことを示唆しています。 ウイローム間の共有機能をさらに特定するために、すべてのタンパク質コード遺伝子を24,145個のde novoタンパク質コード遺伝子クラスターにクラスター化し、これらのクラスターの43.1%が少なくとも2つの遺伝子を持っていました(図3c)。 タンパク質をコードする遺伝子クラスターの蓄積曲線は不飽和であり、収集されたサンプルが非常に多様な機能を示すことを示しています(図3d)。 50を超える遺伝子を含む最大のタンパク質コード遺伝子クラスターは、そのほとんどが、膜輸送(すなわち、ABCトランスポーター)および遺伝子発現、ゲノム複製、および他の宿主細胞への伝達を制御するための直接的/間接的転写調節(すなわち、応答制御因子)における機能を有するタンパク質をコードしていた) (図3e)。 パッケージング、集合、溶解などの他の一般的なウイルス機能も最大のクラスターで見つかりました(図3e)。

a 5 つのデータベース間で特定され共有された、タンパク質をコードするウイルス遺伝子のパーセンテージと数。 b データベースに一致した、または一致しなかった遺伝子のパーセンテージ。 c データベースに一致した、または一致しなかったタンパク質コード遺伝子クラスターの割合、および遺伝子数に基づくタンパク質コード遺伝子クラスターのサイズ分布。 d タンパク質をコードする遺伝子クラスターの累積曲線。 e 50 を超える遺伝子を含むタンパク質コード遺伝子クラスターの機能的アノテーション。 ベータラクタマーゼをコードするタンパク質コード遺伝子クラスターは赤色で強調表示されます。 f Pfam および京都遺伝子およびゲノム百科事典 (KEGG) データベースに基づく、推定上のベータ-ラクタマーゼ ドメインを持つウイルス遺伝子の数。 g 耐性遺伝子識別子 (RGI) および Resfams データベースに基づく、β-ラクタマーゼをコードする抗菌薬耐性遺伝子 (ARG) の数。 ベン図は 2 つのデータベースで特定された ARG の数を要約し、棒グラフは BE 生息地全体の ARG の分布を示します。

腸内ウイルスに関する研究では、ファージが ARG をコードすることはほとんどないことが示されています 30、37 が、この特徴が BE のウイルスにも共通するかどうかは不明です。 Pfam38 および京都遺伝子・ゲノム百科事典 (KEGG) データベース 39 に対する隠れマルコフ モデル検索に基づいて、推定上のベータ-ラクタマーゼをコードする遺伝子を含む 53 のユニークなタンパク質をコードする遺伝子クラスターが同定され (図 3f)、ARG のほとんどが人間の皮膚に生息するウイルスから抽出されました。 最大のタンパク質コード遺伝子クラスターには、メタロ-ベータ-ラクタマーゼスーパーファミリー(PF00753)をコードする55の遺伝子と、転写調節因子のLysRファミリー(K17850)をコードする遺伝子が含まれていました(図3e)。 BE ウイルスの抗生物質耐性能力をさらに検証するために、Resfams40、NCBI AMRFinderPlus41、および耐性遺伝子識別子 (RGI)42 を使用して、厳選された ARG データベースに対する相同性検索を実行しました。 63個のベータラクタマーゼコード遺伝子クラスターが同定され、そのうち45個はResfamsから、19個はRGIからのものであったが、AMRFinderからはゼロであり、これらのクラスターは主に車止め、ドアノブ、および皮膚表面に分布していた(図3g)。 Resfams に対する検索では、それぞれエリスロマイシン 43、バンコマイシン 44、テトラサイクリン 45 に対する耐性を与える ermAC、vanABCDHRXZ、tetADEHY などの他の潜在的な ARG も特定されました (図 S5)。

ウイルスの細胞宿主を予測することは、ウイルスと宿主の相互作用のダイナミクスと潜在的な共進化メカニズムを理解するために重要です。 したがって、宿主の割り当てを最大化するために、現場宿主と現場外宿主の両方が特定されました21。 取得された ex situ ウイルス - ホスト リンクは 122 vOTU をカバーし、ゲノムの 31% を占めました (補足データ 5、図 S6a)。 ゲノムとスペーサーの一致に基づいて生息地外の宿主を予測する際には、細菌のみが考慮されました。 優勢な宿主は、放線菌綱のメンバーである細菌属のコリネバクテリウム属、バリエントシイモナス属、ミクロコッカス属、およびコクリア属であった(図S6b)。 ウイルスとその in situ 宿主間の相互作用を体系的に解明するために、同じデータセットから微生物ゲノムの大規模なアセンブリが実行されました。その結果、ウイルス ゲノムの 58% が 860 個の代表的なメタゲノム構築ゲノム (rMAG) のセットにリンクされました。 (補足データ6、図S6a)。 他の2つの方法(WIsH46およびtRNAマッチ)もrMAGとウイルスの間の関係を特定するために使用され、その結果、ウイルスゲノムのさらに17%がin situ宿主と一致しました(図S6a)。 合計すると、in situ 宿主は 349 vOTU、またはウイルス ゲノムの 81% について予測されました (補足データ 7)。これは、ex situ 宿主が予測された vOTU の数またはウイルス ゲノムの割合よりも約 3 倍高く、 BE 内のウイルスの宿主範囲は狭いということです。 科レベルでの in situ ウイルス - 宿主リンクのネットワークがさらに構築され、最も頻繁に予測された宿主はマイコバクテリア科に属し、次いで皮膚糸状菌科、ミクロコッカス科に属しました (図 4a)。

a ウイルスとその予測される細菌宿主をファミリーレベルで示すネットワーク図。 円とひし形はそれぞれ予測された細菌宿主とウイルスを示し、エッジは予測方法に従って色付けされています。 生息地内で発生するウイルスと宿主のリンクの頻度を右側に示します。 b BE からの 614 バルク メタゲノムの読み取りマッピングに基づく、宿主とウイルスの相対存在量 (予測される宿主分類法によってグループ化) (左パネル)。 分類は、すべての生息地にわたる平均宿主範囲によって順序付けされます。 各サンプルにおける相対的なウイルスと宿主の存在量のペアのピアソン相関 (中央のパネル)。 有意に相関した相対存在量 (p < 0.05) は、ピアソン係数に従って色分けされます (中央のパネル)。 614 個のサンプルにわたるウイルスと宿主の平均存在比が示され (黄色の円)、溶解タンパク質を含むウイルスと含まないウイルスの割合 (棒グラフ) が示されます (右パネル)。 正確な p 値は補足データ 8 に示されています。

BEの微生物生態に対するウイルスの潜在的な影響をさらに調査するために、生息地全体にわたる特定の宿主系統のウイルス感染動態を、宿主の家族レベルでの系統固有のウイルスと宿主の存在比に基づいて評価しました(図4b)。 さまざまな系統の中で、ウイルスと宿主の存在量比の範囲が観察され、細菌科の Pervularculaceae を除いて、ウイルスの相対存在量は宿主の相対存在量よりも低いことがよくありました(図 4b)。 ほとんどの系統特異的なウイルスと宿主の存在量の関係 (42 個中 31 個) は生息地間で大きく異なりました (補足データ 8)。 たとえば、高いピアソン係数(≧0.75)との有意な相関関係が、住宅の表面上の細菌科カウロバクター科、ダーマバクテラ科、およびダーマトフィラ科、および橋脚表面上のクロオコクシディオプシダ科のウイルスと宿主の存在量の間に見つかりました(図4b、補足データ8)。 。 ただし、宿主とウイルスの分類学的分布は、桟橋の生息地間で大きく異なりました(ANOVA、p < 0.01)が、住宅の生息地間では比較的均一でした(図4b)。 興味深いことに、溶解サイクル関連タンパク質は、ウイルスと宿主の存在比が高いウイルスでより蔓延しており(図4b)、これは溶解ウイルス感染の潜在的な増加が宿主の増殖と存在量を減少させることを示唆しています。 逆に、溶原性サイクルを持つより多くのウイルスが、ほとんどの生息地で優勢な宿主(例、ミクロコッカス科や皮膚フィラリア科)に関連しており(補足データ 2、補足データ 7)、勝者便乗仮説を裏付けています 22。 注目すべきことに、地下鉄の空気や桟橋の床や手すりなど、過酷な環境条件を経験した生息地の多くでは、溶原性サイクルを伴うウイルスの割合が少ないことが観察されました(図S7)。

高度に結合したウイルスと宿主のリンクは、原核生物において CRISPR-Acr 相互作用を引き起こす可能性があります 47。 これらの相互作用を調査するために、2,478 個の CRISPR スペーサーが rMAG の 25% から抽出され、細菌科 Micrococcacea、Mycobacteriaceae、Deinococcaceae のメンバーに蔓延していることが判明しました (補足データ 7)。 ただし、同じデータセット内のウイルス ゲノムにリンクされたスペーサーはわずか 2% でした。 特に、プロウイルスが組み込まれたrMAGでは完全なCRISPR / Casシステムが同定され(図5a)、これは、CRISPR / Cas防御をかわすためにAcrタンパク質がウイルス中に蔓延していることを示唆しています。 これを検証するために、すべての rMAG の Cas をコードする遺伝子が最初に特定されました。34 個の rMAG は、Cas1、Cas2、および Cas10 システムに関連する I 型および III 型 CRISPR を保有しており、I 型が優勢な CRISPR タイプでした(補足データ 9)。 。 次に、PaCRISPR48 を使用して、見つかった 99,084 個のウイルスタンパク質と 6,283 個の推定タンパク質から Acr タンパク質を予測しました。 隣接するヘリックス-ターン-ヘリックス (HTH) ドメインを含むタンパク質と、タンパク質データ バンクおよび保存ドメイン データベースとのアライメントに基づいて Acr タンパク質をフィルタリングした後 49、162 のタンパク質ファミリーが潜在的な Acr タンパク質として同定され、そのほとんどが見つかりました。カウドヴィリテスウイルスによって運ばれる(補足データ10)。 全体として、いくつかの候補Acrタイプ(すなわち、AcrIB、AcrIF、およびAcrIIA)が同定され、I型Acrタンパク質は、異なる生息地(空気を除く)全体に蔓延しているため、最大のAcrクラスターを形成しました(図S8)。 AcrIA クラスターは、MAG で見つかった主要な I 型 Cas クラスターとも一致しました (補足データ 9)。

a 2 つのプロウイルスで同定された完全な CRISPR/Cas システム。 CRISPR 遺伝子座は赤色で強調表示されます。 b スペーサー マッチングを使用してホストにリンクされる可能性のある、ウイルス内で見つかった潜在的な Acr メカニズムが、赤い破線のボックスで強調表示されています。 Acr タンパク質は星印で示され、CRISPR 遺伝子座は赤色で強調表示されます。 c この研究で同定された 162 個の Acr タンパク質と、厳選された PaCRISPR データベースから得られた 339 個の Acr タンパク質の最尤系統樹 48。 9 つの新規予測 Acr タンパク質の分岐を赤色で示します。 外側のリングの赤い星は、AlphaFold2 ツールに基づいて信頼性の高い構造 (plDDT > 80) を持つ予測された Acr タンパク質を示します。 d 4 つの新規予測 Acr タンパク質の信頼度の高い構造 (plDDT > 80) とそれらに最も近い参照との比較。

スペーサーが一致するウイルスと宿主の関係に基づいて、I 型 CRISPR/Cas システム阻害に I 型 Acr タンパク質が関与している証拠を発見しました。 占有者の手のひらから得られたシフォウイルス科ウイルス (SL336563_c_18_full) は、Acr0001 をコードする遺伝子 (図 5b) を保有していることが判明しました。これは、Acr が厳選したデータベース 48 と系統樹 (図 5c) に対する相同性検索によれば、 I型CRISPR/Cas免疫を回避するために使用されます。 この結果は、同じ住居のドアノブを媒介とする宿主に見られるタイプ I-E CRISPR/Cas システムと一致しています。 CRISPR 耐性の進化は、特に CRISPR/Cas システムがスペーサーの多様性が高い場合に、ファージの急速な消滅を引き起こす可能性があります 25。 興味深いことに、rMAG (SL336752_bin.1_c_05) では、組み込まれたファージは見つかりませんでした。rMAG (SL336752_bin.1_c_05) では、86 個の固有の CRISPR スペーサーを持つ 4 つの CRISPR 遺伝子座を 1 つのコンティグのみが保有していました。

162 個の予測 Acr タンパク質のうち 9 個は新規であると考えられました。つまり、BLAST ベースのヒット E 値 < 0.001 の既知の参照と一致しませんでした (補足データ 10)。 予測されたすべての Acr タンパク質の独自性をさらに決定するために系統樹を構築しました。これらのタンパク質は、さまざまなサブタイプに広く分布していることがわかりました (図 5c)。 予測されたすべての Acr タンパク質の計算モデリングにより、多様な構造が明らかになりました (48 個は信頼性が高いと考えられました [plDDT > 80]) (図 S9)。 4つの新規予測Acrタンパク質の信頼度の高い構造をそれらに最も近い参考文献と比較すると、機能の変動の原因となる可能性のある差異が明らかになりました(図5d)。 いくつかの予測されたAcrタンパク質は、未知のファミリーの完全な環状vOTU(溶原性および溶解サイクルを持つ)に位置しており(図S10a-b)、これらのタンパク質が十分に特徴付けられていないカウドビリテスウイルスの進化において役割を果たしていることが示唆されています。 一部の Acr タンパク質は、溶原性サイクルを行うウイルスのインテグラーゼとターミナーゼのサブユニットの間に位置し(図 S10a)、その他のタンパク質は溶原性サイクルを行うウイルスのターミナーゼ サブユニットの近くにありました(図 S10b)。これは、Acr をコードする遺伝子がリステリアファージで以前に実証されたように、最初の侵入時および溶原性中だけでなく、溶解サイクルへの移行時にも発現され、CRISPR/Cas システムによる子孫ファージゲノムの切断を防ぎます。 さらに、エンドリシン、Rz溶解タンパク質、ホリン、およびホリン-アンチホリンをコードするものを含む一連の溶解遺伝子は、溶原性サイクルを持つ特定の完全環状vOTUによって運ばれました(図S10a)。 逆に、溶解サイクルを形成する 1 つの完全な環状 vOTU (SL336690_c_82__full) には依然としてインテグラーゼが存在しており (図 S10b)、環境条件が変化するとこのウイルスが溶原性サイクルから溶解サイクルへの移行を受けることを示唆しています 51。

研究では、多くの生態系のウイルスが環境への適応を促進するために宿主の代謝に関与するAMGを保有していることが報告されています3、4。BEウイルス内のAMGが調査され、未知の機能を持つ86を含む468の推定AMGが回収されました(補足データ) 11)。 AMG のほとんどは、補因子とビタミンの代謝 (24%)、炭水化物代謝 (22%)、およびアミノ酸代謝 (18%) において推定上の役割を果たしていることが判明しました。 注目すべきことに、屋内生息地でウイルスによって運ばれるAMGは、屋外生息地のものとは明らかに異なっていた(図6a)。 dTTP/dUTP の細胞レベルの調節に関与し、DNA 修復と組換えの忠実度に重要な必須酵素 dUTPase が、BE の一部のウイルスにコードされていることが判明しました(図 6a、図 S10a、b)。 。 しかし、なぜウイルスが真核生物と原核生物に普及している酵素をコードしているのかは不明です52。

a BE 生息地における各 AMG の平均存在量のヒートマップ。 平均存在量は、各生息地における対応する AMG を保有するウイルスの平均存在量に基づいて計算されました。 b 宿主ゲノムを破壊するウイルスによる遺伝子の挿入を示す概略図。 近縁株との比較ゲノム解析に基づいて欠落した宿主の遺伝子領域は、灰色の点線のボックスで強調表示されます。 c ウイルスによる宿主への硫酸塩還元の特定のステップを制御する 2 つの AMG の挿入を示す概略図。 プロウイルス領域は灰色の破線ボックスで強調表示され、AMG は赤色の破線ボックスで強調表示されます。 宿主遺伝子 (黒い破線のボックス) と硫黄代謝に関与する経路が示されています。 d ウイルスによるpreQ0生合成経路全体をコードする5つのAMGの宿主への挿入を示す概略図。 AMG は赤い破線のボックスで強調表示されます。

一部のウイルスは、細胞感染時にゲノムを宿主染色体に組み込み、宿主遺伝子を破壊します19。 具体的には、プロウイルス (SL336669_c_04) は、ウイルス挿入領域を除き、ゲノムが参照パラコッカス マルクシ (CP041041.1) と非常に類似している (83.5% ± 5.7%) 宿主内で見つかりました。 プロウイルスによって挿入された遺伝子は、コールドショックタンパク質、糖と炭水化物のABCトランスポーター、およびヒ素耐性とエネルギー変換で機能するタンパク質をコードしています53(図6b)。 ウイルスの挿入により、細胞分裂タンパク質をコードするftsAWZ遺伝子と、宿主ゲノムでのDNA合成と修復にデオキシリボヌクレオチドを提供するリボヌクレオチドレダクターゼをコードするnrdEFHI遺伝子も破壊されていた。 ここで同定されたプロウイルスと既知の P. marcusii ファージ 54 とのゲノムを比較したところ、類似性は示されませんでした。

ゲノム挿入に加えて、2 つの宿主のゲノムへのウイルスによる AMG の挿入の証拠があり、これが宿主の代謝を変化させ、生息地への適応性を高めた可能性があります。 桟橋のボラードの表面で、プロウイルス(SL345587_c_14)が酢酸菌科に属する宿主(SL345587_bin.2)のゲノムに2つのAMG(cysHおよびubiE)を導入していることが判明した(図6c)。 CysH は、硫黄代謝における硫化水素生合成経路の一部である硫酸塩の変換によって亜硫酸塩を生成する 3'-ホスホ-アデニリル硫酸還元酵素をコードします 55。 3'-ホスホアデノシン-5'-ホスホ硫酸(PAPS)形成の制御に関与するcysNCDH、同化性硫酸還元経路で亜硫酸レダクターゼをコードするcysJI、硫黄代謝を生成するcysQなど、硫黄代謝に関与する他の遺伝子もrMAGで同定された。 PAPS由来のアデノシン5'-ホスホ硫酸レダクターゼ、および硫黄酸化システムに関与する他のsoxABZY遺伝子(図6c)。 亜硫酸塩の合成に加えて、cysH は、蓄積すると有毒となる細胞 PAPS のプールも制御できます 56。 マイコバクテリア科に属する別の屋内ドアノブ媒介宿主 (SL345927_bin.2) は、右手のひら由来のウイルス ゲノム (SL345921_c_18_full) にリンクされていました。 7-シアノ-7-デアザグアニン(preQ0)生合成経路全体に関与する酵素をコードするAMG(queCDEFおよびfolE)が宿主ゲノムに組み込まれていることが判明した(図6d)。 preQ0 生合成をコードする遺伝子は、入手可能なマイコバクテリア科ゲノムには見つかりませんでした (NCBI より: txid1762)。 総合すると、これらの発見は、BE の宿主の代謝がウイルス感染の影響を受ける可能性があり、それによって特定の生息地への適応性が変化する可能性があることを示唆しています。

ウイルスは、BEs8 では細菌と同じくらい数が多いにもかかわらず、文献ではあまり研究の注目を集めてきませんでした。 都市環境における表面マイクロバイオームに関する最近の世界的な研究では、BE からのバルクメタゲノムサンプルから多様なウイルスを回収することが可能であることが示されました 15。 この研究では、香港の 4 種類の BE にわたる 11 の生息地に由来するウイルスムを詳細に分析しました。

各 BE 生息地でいくつかの vOTU が確認されましたが、その多様性は、以前に世界の海水で確認された vOTU の多様性よりも大幅に低かった 36。 特定の表面の材質と種類は、バイロームの多様性の主な要因である可能性が高く、我々の調査結果が示すように、コンクリート、木材、皮膚の表面は金属やプラスチックの表面よりも高い多様性を保持しています。 同じ金属でできた表面であっても、頻繁に触れる屋内のドアノブは、あまり触れない屋外の手すりよりも高いバイローム多様性を示すことからわかるように、接触頻度はバイローム多様性の制御に大きな役割を果たします。 資源が豊富な海洋環境とは異なり20、BE のほとんどの生息地は栄養供給が乏しく、強烈な紫外線や温度と湿度の変動からなる制御されていない過酷な環境条件にあります。 これらの不利な条件は、表面材料の特性と相まって、細菌マイクロバイオームの分類学的変動や機能的変化を引き起こす可能性があります9。 生態学的証拠はまた、環境フィルタリングが屋内環境の細菌の多様性を制御できることを裏付けており 57、それがひいては宿主範囲が狭いファージの多様性に影響を与える可能性がある 58。 空気中と表面上の細菌群集間の多様性と構造の違いと一致して 59、本研究における空気感染ウイルスと表面感染ウイルスは異なっていました。 高度な換気と濾過システムの使用は、自然換気を使用する会場からの空気よりも地下鉄の空気のバイローム多様性が低いことを説明できる可能性があります12。 カウドビリセテス綱に属するウイルスは、その多くが科レベルまたは属レベルで未分類のままであるが、香港 BE の空気を除くほとんどの生息地で遍在し優勢であり、他の生態系の調査結果と一致している 30。

蓄積されている証拠は、ウイルスが過酷な環境でも生存し、細菌宿主の生存を助けることができることを示唆しています60。 HK BE では、ファージと細菌宿主の間の高度に共役した相互作用が観察され、宿主結合ウイルスの割合は、どちらも豊富な栄養供給を持つ土壌 17 やヒトの腸 30 よりも 2 倍以上高かった。 宿主に侵入した後、ファージはさまざまな戦略を適用して宿主の適応を促進することができます18。 メカニズムの 1 つは、溶原性サイクルを持つファージによる細菌染色体の高度に保存された挿入部位への大きな DNA 断片の挿入です 61。これは宿主の適応度に悪影響を及ぼしますが、宿主の新しい環境への適応を助けるための進化革新のための遺伝的変異も生成する可能性があります。 別のメカニズムは、宿主ゲノムへの挿入後のファージにコードされた AMG の発現です 3。 挿入された AMG は宿主がさらされる環境条件に応じて変化し 21、この現象はさまざまな BE 生息地でも観察されました。 頻繁に触れる屋内の表面では、dUTPase をコードする AMG が蔓延しており、おそらくウイルスの複製を助けてウイルスが宿主内で効果的に存続できるようになっています 62。 海水の飛沫が頻繁にかかる桟橋のポール上で、硫黄代謝に関与するAMG cysHが、溶原性サイクルを有するファージによって宿主に組み込まれた。 興味深いことに、この遺伝子は、酸素欠乏水柱 63 および深層淡水湖 64 から得られたウイルス配列でも同定されています。 CysH は、代謝経路の特定のステップを調節することにより、宿主が硫黄代謝における反応ボトルネックを克服するのを潜在的に支援します。 単一の AMG の挿入とは対照的に、抗生物質、抗腫瘍活性、または抗ウイルス活性を持つ多様なクラスのヌクレオシド類似体の形成のための preQ0 生合成経路全体の調節に関与する遺伝子 65 が、ヒトの皮膚上の細菌宿主で発見され、チケットキオスク。 このホスト内で合成された化合物は、頻繁に接触する表面へのホストの適応を助ける可能性があります。 機能不明のいくつかの AMG も BE で見つかりました。これらは、ウイルスと宿主の相互作用における役割を決定するために実験的にさらに調査される必要があります。

溶原性サイクルと溶解性サイクルを切り替えるウイルスの生命戦略は、ウイルスと宿主の進化の重要な推進力です51。 一般に、溶原性サイクルを伴うウイルスの存在量は環境条件によって異なり、細菌密度と栄養レベルが低い条件下では存在量が高くなります66。 BE の屋内と屋外の両方の生息地では溶原性サイクルを持つウイルスが好むと予想されますが、屋外の生息地ではこれらのウイルスの割合が比較的低いことが観察されました。 一般に、屋外の生息地は内部の生息地よりも外部ストレスに対してより脆弱であり、その結果、ストレス条件下(つまり、DNA損傷)で溶解遺伝子が発現し、溶原性サイクルから溶解性サイクルに移行します51。 海洋環境と同様に 3、ウイルス溶解を介した有機物の放出は、貧栄養性 BE の微生物群集のメンバーの栄養と資源の循環に役割を果たしている可能性があります。 ただし、ウイルスが BE に定着するために使用する生態モデルを決定するには、今後の研究が必要です。

ファージ関連 ARG は、宿主のゲノム複製機構をハイジャックすることによって広範囲に蔓延する可能性があるため、懸念されています 67。 細菌関連 ARG と比較して、ファージ関連 ARG は、その伝播経路の追跡と予測が難しいため、より深刻な脅威となります67。 ファージ媒介ARG形質導入はまれであり、ARGは機能的ではない可能性があるが 37,68 、機能的なβ-ラクタマーゼをコードする遺伝子によって付与される抗生物質耐性が淡水ウイルスで同定され、実験的に検証されている 69。 私たちの研究における BE では、推定上の ARG のほとんどが、人間の皮膚に生息するウイルスや、頻繁に接触する屋内表面に存在しました。 これらの ARG 保有ウイルスは細菌宿主に感染する可能性があり、その後、推定上の ARG が細菌種間で水平移動する可能性があります 70。 ベータラクタム系抗生物質に対する耐性を与える ARG に加えて、マクロライド、バンコマイシン、およびテトラサイクリンに対する耐性を与えるいくつかの AGR も BE 由来のウイルスで同定されました。 したがって、細菌、特に BE の頻繁に接触する表面に存在する細菌の抗生物質耐性の発達においてウイルスが果たす役割は極めて重要であり、さらなる研究が必要である。

細菌とファージの間の頻繁な生存競争により、多くの細菌の防御システムが進化しました19。 特に、CRISPR/Cas システムは現在までに原核生物で確認されている唯一の適応免疫システムであるため、ファージがどのようにして Acr タンパク質を介して細菌の CRISPR/Cas システムを不活化するかがますます注目を集めています 50。 この研究では、BE で見つかったファージでいくつかの Acr タンパク質が予測されました。 対抗防御における機能を考えると、ファージにコードされた Acr タンパク質は急速に進化し、実験的に特徴付けられた Acr タンパク質との限られた配列類似性を示すため 71、Acr タンパク質の種類の推論が困難になります。 したがって、この研究で同定された Acr タンパク質のほとんどは、細菌宿主の CRISPR/Cas システムの標的ではありません。 しかし、Acr タンパク質は、CRISPR システム耐性も急速に進化し、特に CRISPR/Cas システムが多様性に富んだスペーサーを開発し、ファージがこれを克服するのが難しい場合には、ファージの急速な絶滅を引き起こす可能性があるため、かつて信じられていたほど効果的ではない可能性があります。点突然変異25. この現象は、86 個のスペーサーを持つ 4 つの CRISPR 遺伝子座を含む rMAG ではプロウイルスが見つからなかったという我々の結果と一致しています。

この研究は BE 内のウイルスに光を当てましたが、いくつかの制限があります。 まず、バイローム分析ワークフローで潜在的なバイアスが発生する可能性があります。 BE サンプルのバイオマスが低いこと、および DNA 抽出および精製方法に関連する潜在的なバイアスにより、ウイルスとその宿主の多様性が過小評価される可能性があります。 さらに、バイオインフォマティクスツールのデータベースに適切な参照が欠如していると、配列の特徴が不十分になる可能性があります 72。 第二に、メタゲノム配列決定から得られた結果では、同定されたウイルスとその関連遺伝子(ARG や Acr タンパク質など)が機能的であるか欠陥があるかが区別されませんでした。 新規の Acr タンパク質の機能を特定するには、今後の実験的研究が必要となるでしょう。 第三に、RNA ウイルスは考慮されていません。 したがって、BE の完全なバイローム多様性を調べることはできませんでした。 第 4 に、適用されたコンティグベースのツール 27、28、30 により、これまで培養されていなかった多くの新規ウイルスを発見することができましたが、他のアルゴリズムを使用したアセンブリでは他のウイルスが明らかになる可能性があり、ウイルス ビニング手法は断片化されたマルチコンティグ ウイルス アセンブリに適切に対処して、より多くのウイルスを検出できる可能性があります。ウイルスと細菌の両方の集団を正確にクラスタリングし、ウイルスと宿主の相互作用を直接調査します73。 最後に、病院や病棟 74 など、選択性が高く、頻繁に清掃され、リソースが限られている他の環境と将来的に比較することで、表面の物理的および化学的特性がウイルスの存在量およびウイルスと宿主の相互作用に及ぼす影響をさらに文脈化できる可能性があります。

要約すると、我々は、この研究が BE の多様な生息地にわたるウイルスムの多様性、分類、代謝機能、およびライフスタイルを示した最初のものであると信じています。 この研究は、BEにおけるウイルスと細菌宿主間の密接な共役に焦点を当て、貧栄養性BEにおける宿主適応とウイルス生存のための、さまざまなウイルス-宿主相互作用メカニズムを介したそれらの共進化の重要性を例示する。 Caudoviricetes クラスの新規ウイルスや Acr タンパク質も多数同定されており、これらのウイルスの多くが BE でまだ発見されていないことが示唆されています。 全体として、ウイルスは BE 微生物群集の重要なメンバーであり、ウイルスの生物学をより深く理解することで、最終的には都市のより良い設計と公衆衛生の保護を促進することができます。

メタゲノム データセットは、香港の 4 種類の BE (桟橋、公共施設、住宅、地下鉄) にわたる 11 の生息地から収集された 738 のサンプルで構成されています。 占有率の低い 9 つの桟橋から、車止め (n = 40)、床 (n = 45)、手すり (n = 45)、および柱 (n = 45) の 4 種類の生息地の表面から 175 個のサンプル 9 が収集されました。 占有率が中程度の 8 つの公共施設 (つまり、4 つの公園と 4 つの地下鉄出口) から、公園の手すり (n = 69) と地下鉄の出口の手すり (n = 65) という 2 種類の生息地の表面から 134 個のサンプル 75 が収集されました。 それぞれ 1 人の居住者がいる 4 つの住宅から、ドアノブ (n = 66)、ヘッドボード (n = 68)、および居住者の皮膚 (つまり、左右の手のひらと前腕、左右の手のひらと前腕) の 3 種類の生息地の表面から 268 個のサンプル 75 が収集されました。 n = 134)。 皮膚サンプルを収集するための書面によるインフォームドコンセントが居住者から得られ、この研究は香港城市大学被験者倫理小委員会によって承認されました(参照番号: H001553)。 乗車率の高い 84 の地下鉄駅から、切符売り場の表面 (n = 81) とプラットフォーム上の空中 (n = 80) の 2 種類の生息地から 161 個のサンプル 76 が収集されました。 同じサンプリング方法を使用して、すべての surface75 サンプルと air76 サンプルを収集しました。 表面の材質は金属、プラスチック、コンクリートのいずれかです。 サンプルに関する詳細情報は補足データ 1 に示されています。

すべての地表および空気サンプルのゲノム DNA は、対応する方法を使用して抽出されました 75,76。 簡単に言うと、メーカーの指示に従って、ZymoBIOMICS 96 MagBead DNA キット (Zymo Research、カリフォルニア州、米国) を使用して、サンプル表面から収集したスワブからゲノム DNA を抽出しました。 細胞は、化学溶液と機械的ビーズ叩解技術を使用して溶解されました。 ゲノム DNA は、カスタマイズされたプロトコルを使用して空気サンプリング フィルターから抽出されました。 NucliSENS Lysis Buffer (BioMérieux、Marcy-l'Étoile、France) および多酵素カクテル (MetaPolyzyme、Sigma-Aldrich、MO、USA) を使用して細胞溶解を実行し、続いて機械的ビーズビーティングを行いました。 ZymoBIOMICS 合成微生物群集標準 (Zymo Research Corporation、カリフォルニア州、米国) を抽出プロセスの陽性対照として使用し、表面および空気サンプルと並行して配列決定しました。 すべてのゲノム DNA サンプルの配列決定は、HudsonAlpha Genome Center (アラバマ州ハンツビル) の Illumina HiSeq X Ten System (Illumina Inc.、カリフォルニア州サンディエゴ) で実行されました。 品質管理とリードのコンティグへの組み立ては、前述のように実行されました9。 簡単に言うと、アダプターは、AdapterRemoval (v.2.2.2)77 を使用して生の配列から削除されました。 品質のフィルタリングとトリミングは、デフォルトのパラメーターとヒト配列を削除するための参照としてのヒトゲノム hg38 を備えた KneadData (v.0.7.6) を使用して実行されました。 ポジティブコントロールでは、期待どおりのシーケンス結果が得られました。 ネガティブ コントロールのコンティグにマッピングできるサンプル内のリードは、社内スクリプトを使用して削除され、ペアになっていないリードは、fastq-pair (v.1.0; https:// github.com/linsalrob/fastq-pair)。 デフォルトのしきい値に基づいて decontam (v.1.12; https://github.com/benjjneb/decontam) によって特定された汚染種はすべて削除されました。 品質管理の後、サンプルあたり約 500 万のペアエンドクリーンリードが保持され、MetaWRAP (v.1.2.1) を使用して約 450 万のコンティグに組み立てられました。

2 つのウイルス検出ツールのパフォーマンスは、まず、RefSeq ウイルス データベース (v.209) からランダムに選択された正規ウイルスの 2000 個のゲノム断片 (1、3、5、10、および 20 kb) を含む模擬データセットで評価されました。 異なる長さのゲノム断片の平均ウイルスリコールは、デフォルトのカットオフを使用した VirSorter227 (v.2.2.4、すべてのカテゴリ) と、異なるカットオフ (0.5、0.7、0.8、および0.9)(図S1c)。 モックデータセットの結果に基づいて、デフォルトのカットオフ(すべてのカテゴリ)を持つ VirSorter2 と、各フラグメント長で最高のウイルス再現率をもたらす述語スコア ≥0.5 および p 値 < 0.05 を持つ DeepVirFinder を並行して使用して処理しました。 738のメタゲノムサンプルから集められた450万のコンティグ(図S1b)。 合計 594,851 個の固有の推定ウイルス コンティグが 2 つのツールから得られました。 CheckV (v.0.8.1; データベース v.1.0)79 を使用して、推定ウイルス コンティグの品質を評価し、完全、高品質 (>90% 完全性)、および中品質 (50%) を含む 1,174 個のウイルス コンティグを評価しました。 –90% の完全性)ゲノムが保持されました 30(補足データ 2)。 予測されたプロウイルスを含むゲノムについては、プロウイルス領域のみが保持されました。 PHASTER) (https://phaster.ca/)80 および VIBRANT (v.1.2.1)81 は、以前に提案されているように、次の 2 つの基準に従ってプロウイルス配列を同定するために個別に適用されました 21: (i) ウイルスコンティグはコンティグからのものでした非ウイルス(宿主)フランキング配列を伴う、または(ii)溶原性マーカータンパク質(すなわち、インテグラーゼおよびセリンリコンビナーゼ)を含むウイルスコンティグ。 合計 332 個の固有のプロウイルスが前述の 2 つのツールと CheckV を使用して同定され、細菌ゲノムに組み込まれたプロウイルス (127 個) のみが高い信頼性を持って (PHASTER でのプロファージ領域の合計スコアが >90 でした)、下流のプロウイルスに含まれました。分析。

>50% を超える完全性を持つすべてのウイルス ゲノムは、重心ベースのクラスタリングに基づく短い配列と比較した 95% の平均ヌクレオチド同一性 (ANI)、>85% のアラインメント率に基づいて、種レベルの vOTU にクラスター化されました。 属および科レベルの vOTU は、前述のようにマルコフ クラスタリング 82 に基づく遺伝子共有とアミノ酸同一性 (AAI) の組み合わせを使用して生成されました 30。 簡単に説明すると、AAI が 20% 未満または遺伝子共有が 10% 未満でインフレ率が 1.2 のウイルス ゲノムは家族レベルの vOTU にクラスター化され、AAI が 50% 未満または遺伝子共有が 20% 未満でインフレ率が 2.0 のウイルス ゲノムはクラスター化されました。属レベルの vOTU に変換します。

471 vOTU のオープン リーディング フレーム (ORF) は、パラメータ「-p meta」を使用して Prodigal (v.2.6.3)83 によって予測されました。 471 個の vOTU のタンパク質をコードする遺伝子配列には、前述の多数決アプローチを使用して家族レベルの分類法が割り当てられました 30。 具体的には、最上位の IMG/VR (v4) データベース 29 の国際ウイルス分類委員会 (ICTV) に基づく分類法が、DIAMOND (v.0.9.32; オプション: –query-cover 50 –subject-cover 50 –E) を使用してヒットしました。 -value 1e−5 –max-target-seqs 1000) を各タンパク質に転写しました。 上位ヒットの分類が欠落している場合、そのビットスコアが上位ヒットの 25% 以内であれば、次のヒットが採用されました。 次に、各 vOTU は、注釈付きタンパク質の >70% の最も低い分類ランクに割り当てられました。 科および属のランクでは、ゲノムには、IMG/VR データベースの参照ゲノムとアラインメントされた、平均 AAI が 30% を超えるアノテーション付きタンパク質が少なくとも 2 つ、または平均 AAI が 40% を超えるアノテーション付きタンパク質が 3 つそれぞれ必要です。

738 個のメタゲノムすべてからのクリーン リードは、Bowtie2 (v.2.4.4) をデフォルトのパラメーターで使用してウイルス ゲノムにマッピングされました。 BamM (v.1.7.3; http://ecogenomics.github.io/BamM/) の「フィルター」機能を使用して、ゲノムにマッピングされたリードをスクリーニングして、低品質のマッピングを削除し、アラインメントされたリードを除去しました。 ANI 95% 以上で長さの 90% 以上が保持されました。 Read2RefMapper (v.1.1.0) の Python スクリプトを使用して、長さの 70% 以上がリードでカバーされるウイルス ゲノムを選択し、BamM を使用して各サンプルの各コンティグの塩基対ごとの平均カバレッジを生成しました。 「parse」関数にパラメータ「tpmean」を指定して、最高および最低 10% のカバレッジ領域を削除します。 マッピング分析に基づいて、614 個のメタゲノムからウイルス ゲノムが検出されました。 614 のメタゲノムにわたる 1,174 のウイルス ゲノムの平均相対存在量は、ウイルス ゲノムの平均カバー率をすべてのサンプルにわたるクリーン リードの総数で割り、614 のメタゲノムにわたるすべてのクリーン リードの平均数を乗算して計算されました。各サンプルの読み取り総数を平均値まで増減します17。

3 つの公的に利用可能なバイローム データセット、すなわち主に北米の被験者からの皮膚メタゲノム (SMGC データセット)35、温帯および熱帯の表遠洋および中遠洋の海洋メタゲノム (GOV データセット)36、および香港を除く国際都市の地下鉄駅からの表面メタゲノム ( MetaSUB データセット)15 は、この研究で生成されたバイローム データセットと一緒に分析されました。 公共データベースから取得したウイルスゲノムは CheckV を使用して評価され、中品質および高品質のウイルスのみが保持されました (図 S6a)。 データセットと公開されている 3 つのバイローム データセットへのリードのマッピングは、「bowtie2-build」関数を使用して実行され、最初にすべてのバイローム データセットから種レベルの vOTU のみを使用して 4 つのインデックスを作成しました。 次に、オプション「-very-sensitive -k 20」を指定した Bowtie2 を使用してクリーンリードを各ゲノムインデックスにアライメントし、マッピング ANI < 95% のアライメントは破棄しました。

アルファ多様性指数、つまり豊かさ、シャノンの H、ピルーの均一性は、R パッケージ vegan (v.2.5.7) を使用して計算されました84。 シングルトン vOTU を持つ 70 のメタゲノムが分析から除外されました。 マン・ホイットニー U 検定は 2 つのグループ間の差異の統計的有意性を検定するために実行され、分散分析は 2 つ以上のグループ間の差異を決定するために適用されました。 ベータ多様性分析では、R パッケージ vegan の「vegdist」関数を使用して、Bray-Curtis 相違度行列に基づく主座標分析を実行しました。 類似性のペアワイズ分析と順列多変量分散分析を、R パッケージ vegan の「anosim」機能と「adonis」機能をそれぞれ使用して、グループ間の非類似性の有意性をテストするために実行しました。

この研究からのカウドビリテス vOTU と 3 つの公的に利用可能なバイローム データセット (SMGC、GOV、および MetaSUB) で構成される最尤系統樹が、以前に記載されているように構築されました 30,85。 簡単に言うと、プロファイル隠れマルコフ モデル (HMM) を使用して、77 の厳選されたカウドビリセテス マーカーを vOTU のタンパク質コード遺伝子配列に対して検索しました。 この研究のデータセットには、長さが 5 kb 以上の 444 の vOTU と 37,775 のタンパク質をコードする遺伝子配列が含まれていましたが、3 つの公開データセットには、長さが 5 kb 以上の 2,389 の vOTU と 168,256 のウイルスタンパク質をコードする遺伝子配列が含まれていました。 上位の HMM ヒットは、以前に推奨されたように、「hmmsearch」機能を使用して 77 マーカーのプロファイル HMM と個別に位置合わせされ、この研究と 4 つのデータセットの組み合わせからそれぞれ 40 個と 58 個のマーカーが保持されました。 次に、trimAl (v.1.4)86 を使用して個々のマーカーの配置をトリミングして、ギャップが 50% 未満の位置を保持し、必要に応じて社内の Python スクリプトを使用してギャップを埋めました。 全長のアラインメント長において 5% を超えるアミノ酸表現を持つゲノムのみが保持されました。 連結されたタンパク質系統樹は、FastTreeMP (v.2.1.11) と自動モデルを使用して複数の配列アラインメントから推定されました87。 ツリーは中間点ルート化され、iToL (v.6; https://itol.embl.de/) を使用して視覚化されました。

ウイルス ゲノム内の ORF は、KEGG39、Pfam38、TIGRFAM88、VOGDB (http://vogdb.org)、および地球の Virome データベース 89 を含むいくつかのタンパク質ファミリー データベースに対して、hmmsearch ユーティリティを使用して実行されるプロファイル HMM 検索メソッドを使用してアノテーションが付けられました。 HMMER (v.3.1b2) とデフォルトのパラメータ。 データベース間の最高スコアのアラインメント (ビットスコア ≥ 60 および E 値 ≤ 1e−5) の注釈が各 ORF に割り当てられました。

ウイルスゲノム内の ARG には、オプション「–low_quality」を指定した耐性遺伝子識別ツール (v.5.2.0)42 を使用してアノテーションが付けられ、CARD データベース (v.5.2.0) の参照配列に 60% を超える最良の同一性が適用されました。 3.0.9)90 を使用し、NCBI AMRFinderPlus (v.3.8.4) ツール 41 を使用し、Resfams データベース (v.1.2) 40 の参照配列に対してカバレッジ 60% および同一性 80% のデフォルト オプションを設定します。 検索は、HMMER ツール (v.3.1b2) の hmmsearch ユーティリティを使用して、E 値 ≤ 1e−5 および収集しきい値スコア ≥ 40 で実行されました。 ARG がデータベースから異なるアノテーションを受け取った場合、最高のスコアを持つ Resfams アノテーションが採用されました。

AMG には、VirSorter2 によって生成された出力を使用する DRAM (v.1.4.0)91 のウイルス モードに基づいてアノテーションが付けられました。 識別された 1174 個のウイルス コンティグは、VirSorter2 (--prep-for-dramv) によって再処理されて「VIRSorter affi-contigs.tab」ファイルが生成され、DRAM 内のデフォルト データベースで注釈が付けられました。 このプロセスにより、VirSorter2 によるウイルス スコアの低い 573 個のウイルス ゲノムが除去されました。 残りの 601 個のウイルス ゲノム内の推定 AMG は、1 または 2 という高い補助スコアに基づいて同定されました。採用された遺伝子の説明は、デフォルト パラメーターを使用して抽出された DRAM-v のアノテーションに基づいていました。 DRAM からの AMG アノテーションを補足するために、デフォルトのパラメーターを持つ VIBRANT を使用してウイルス ゲノムにもアノテーションが付けられ、DRAM に見つからないアノテーションが保持されました。

候補 Acr タンパク質は、デフォルトのカットオフ閾値を持つ PaCRISPR48 を使用して最初に予測され、候補 Acr タンパク質のさらなるフィルタリングは、上流または下流の 5 つの遺伝子内に位置する必要がある HTH ドメイン含有タンパク質に基づいて前述のように実行されました 92。 続いて、フィルターされた候補 Acr タンパク質を、パラメーター「--min-seq-id 0.5 -c 0.7 --cov-mode 2 --cluster-mode 0」を指定した MMseq2 (v.13.45111)93 を使用してクラスター化しました。 どのタンパク質データバンクおよび保存ドメインデータベース配列に対しても、HHpred 確率 ≥0.9 でヒットを生成しなかった代表的な Acr タンパク質は、予測された Acr タンパク質とみなされ、下流の分析のために保持されました 49。 予測される代表的な Acr タンパク質の種類は、Acr が厳選したデータベース PaCRISPR48 に対してデフォルトのパラメーターを使用した PSI-BLAST 検索を使用して推定されました。 予測された Acr タンパク質と、厳選された PaCRISPR データベースから得られた 339 個の参照 Acr タンパク質間の多重配列アライメントは、FAMSA (v.1.5.12)94 を使用して生成され、trimAl (v.1.4)86 を使用してトリミングされ、ギャップが <50% の位置を保持しました。 。 最尤系統樹は、FastTreeMP (v.2.1.11) と自動モデルを使用して整列された配列で構築され、iTOL を使用して視覚化されました。 Acr タンパク質の構造は、AlphaFold2 ツールをデフォルト設定で使用して予測されました 95,96。

MAG (補足データ 5) は、以前に説明したように、サンプリングされたすべてのメタゲノムから再構成されました 9。 簡単に説明すると、各サンプルのクリーンリードがコンティグにアセンブルされ、長さが 1000 bp を超えるリードが MetaWRAP (v.1.2.1) を使用して MAG にビン化されました 78。 結果として得られた MAG は、MetaWRAP78 の「bin_refinement」機能を使用してさらに洗練され、dRep (v.3.2.2)97 の「dRep dereplicate」機能を使用して複製解除されました。 合計で、汚染度 10% 以下、完全性 50% 以上の細菌 rMAG が 860 個生成されました。 rMAG のコンティグ内の ORF は Prokka (v.1.14.6)98 を使用して予測され、機能は EggNOG-mapper (v.2.0.1)99 を使用して注釈が付けられました。

すべてのサンプルにおける各 rMAG の相対存在量を計算するために、BamM の「make」関数を使用して、各メタゲノムからのクリーン リードを各ゲノムにマッピングしました。 低品質のリードマッピング (各リードのアラインメント長が 75% 未満、ANI が 95% 未満) は、BamM の「フィルター」機能と、アラインメントされたリード数の平均として表される各ゲノムのカバレッジを使用して除去されました。最高および最低 10% のカバレージ領域を除去した後のコンティグ内の各位置は、BamM の「解析」機能を「tpmean」モードで使用して計算されました。 次に、各 rMAG の相対存在量を、塩基対の長さによって各コンティグを重み付けし、そのすべてのコンティグの被覆率の平均として計算しました。

ウイルスゲノムの in situ 宿主と ex situ 宿主の両方が、以前に記載されているように同定されました 21。 2 つの宿主データベースを使用してウイルスと宿主のリンクを確立しました。このデータベースでは、RefSeq (2021 年 11 月に NCBI データベースからダウンロード) からの 146,464 の原核生物種を表す 203,065 の完全な細菌および古細菌のゲノムが生息域外の宿主を特定するために使用されました。 GTDB-Tk (v.1.5.1)100 を使用して分類学的に注釈が付けられ、in situ 宿主を識別するために使用されました。 CRISPR スペーサーはカスタム Python スクリプトを使用して 2 つのホスト データベースから抽出され、CRISPR 関連タンパク質 (Cas) をコードする遺伝子は CRISPRCasFinder (v.4.2.20) を使用して検出されました101。

1174 個のウイルス ゲノムに対する微生物宿主は、(i) 宿主 CRISPR スペーサー、(ii) 宿主ゲノムに組み込まれたウイルス断片、(iii) 宿主 tRNA 遺伝子、 (iv) ホスト k-mer 署名。 方法 (i) と (ii) は、生息地外宿主の予測にのみ使用されました。 方法 (i) では、blast+ (v.2.9.0)102 の BLASTn を使用して CRISPR スペーサー配列とウイルスゲノムを比較し、ミスマッチ 1 個以下および E 値 1e-5 以下のマッチが保持されました。 ウイルスゲノム内で一致する CRISPR スペーサーについては、同じ組み立てられた CRISPR 領域の反復配列が、BLASTn を介してすべての細菌および古細菌のゲノムと比較されました (E 値 ≤ 1e-5、100% ヌクレオチド同一性、および 95% のカバー率) ) その CRISPR 領域 (およびその CRISPR 領域にスペーサーを持つウイルス) を宿主にリンクします。 方法 (ii) では、BLASTn を介して共有ゲノム領域を特定するために、E 値 ≤ 1e-5 および 96% 以上の ANI を持つビットスコア閾値 50 が使用され、これらの基準として 1000 bp 以上のヒットのみが考慮されました。最も信頼性の高いホスト予測が得られることが示されています30。 方法 (iii) では、ウイルスと宿主の tRNA 遺伝子は、それぞれ一般モデルと細菌/古細菌モデルを使用して tRNA-scan SE-2.0 によって予測され、予測されたウイルスと細菌の tRNA 遺伝子間で BLASTn 比較が実行されました。 次に、データセット内のウイルスと宿主間の tRNA の一致は、完全一致のスコアが 1 塩基違いの宿主 tRNA (中間スコア) や 2 塩基違いの宿主 tRNA よりも高くなる (高スコア) ようにスコア付けされました (スコアが低い)。 方法 (iv) では、ウイルス ゲノム上の tRNA 配列をマスキングしてパフォーマンスを向上させた後、WISH (v.1.1)46 を宿主予測に使用しました。 続いて、宿主が無脊椎動物である 3,024 個のウイルス ゲノム (2022 年 1 月に NCBI ウイルス ポータルからダウンロード) が、予測対象の宿主属に感染することが知られているウイルスを保守的に除外した後、おとりデータベースとして使用されました。 各ウイルスゲノムについて、最低の p 値 (≤1e−5) を持つ WIH 予測宿主は、ファミリーレベルの宿主割り当てで保守的になるように維持されました。 CRISPR スペーサーとゲノムの一致は両方とも in situ 宿主割り当てのために保持され、WISH および tRNA の結果よりも高い優先順位が与えられました。 系統特異的なウイルスと宿主の平均カバー率は、rMAG の相対存在量をウイルスゲノムの相対存在量で割ることによって計算されました。 ウイルスとホストのリンクのネットワークは Cytoscape (v.3.9.0)103 を使用して視覚化され、ネットワークを構築する前にサブサンプリングを実行して、BE 生息地全体でサンプリングされたメタゲノムの数が不均等であることによる潜在的なバイアスを排除しました。

この研究で使用された生の DNA 配列データは、BioProject アクセッション番号 PRJNA671748、PRJNA722771、PRJNA561080、および PRJNA881785 で NCBI Sequence Read Archive に寄託されています。 各サンプルの SRA アクセッション番号は補足データ 1 に示されています。この研究で使用された公的に利用可能なデータベースは、Resfams (http://www.dantaslab.org/resfams)、CARD (https://card.mcmaster.ca/) でした。 、Pfam (https://www.ebi.ac.uk/interpro/download/Pfam/)、IMG/VR (https://genome.jgi.doe.gov/portal/IMG_VR/)、VOG (http:/) /vogdb.org)、TIGRFAM (https://www.ncbi.nlm.nih.gov/genome/annotation_prok/tigrfams/)、KEGG (https://www.genome.jp/kegg/)、および NCBI ウイルス/細菌/refseq (https://www.ncbi.nlm.nih.gov/refseq/)。 分析されたデータセットには、地球の Virome (http://portal.nersc.gov/dna/chemical/prokpubs/EarthVirome_DP/)、SMGC (https://www.ncbi.nlm.nih.gov/sra/?term=SRP002480) が含まれます。 )、GOV (https://bitbucket.org/MAVERICLab/)、および MetaSUB (https://github.com/dscdorothy/HK_BE_viromic) はオンラインで入手できます。 予測される Acr タンパク質の信頼度の高い構造は、https://github.com/dscdorothy/HK_BE_viromic で提供されます。

サポート コードは https://github.com/dscdorothy/HK_BE_viromic で提供されます。

Manrique, P.、Dills, M. & Young, MJ ヒトの腸内ファージコミュニティとその健康と病気への影響。 ウイルス 9、141 (2017)。

記事 PubMed PubMed Central Google Scholar

リー、Zら。 冷たい湧出に関連する深海の堆積物は、ウイルスの多様性の地下貯蔵庫です。 ISME J. 15、2366–2378 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

コウチーニョ、FH 他メタゲノミクスによって発見された海洋ウイルスは、海洋全体のウイルス戦略に光を当てます。 ナット。 共通。 8、15955 (2017)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Trubl, G. et al. 北極の泥炭土壌における氷点下温度でのウイルスと宿主の活発な相互作用。 マイクロバイオーム 9、208 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

ギルバート、JA & スティーブンス、B. 建築環境の微生物学。 ナット。 Rev.Microbiol. 16、661–670 (2018)。

論文 CAS PubMed Google Scholar

Lax、S.ら。 人間と室内環境との間の微生物の相互作用の長期的分析。 サイエンス 345、1048–1052 (2014)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Fouquier, J.、Schwartz, T. & Kelley, S. 公衆トイレの床における多様な環境真菌群集の急速な集合。 Indoor Air 26、869–879 (2016)。

論文 CAS PubMed Google Scholar

Prussin、AJ、Garcia、EB & Marr、LC 屋内および屋外の空気中のウイルスと細菌の総濃度。 環境。 科学。 テクノロジー。 レット。 2、84–88 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

Tong, X. et al. 沿岸都市の不活性で貧栄養な屋外桟橋表面の微生物群集に関するメタゲノム的洞察。 マイクロバイオーム 9、213 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Cantú、VJ et al. 学校環境における実際的な表面SARS-CoV-2監視の実施。 mSystems 7、e00103–e00122 (2022)。

PubMed PubMed Central Google Scholar

サケット、L.ら。 近隣の危険:2017年から2018年にブラジルで黄熱病が発生した際、ミナスジェライス州の都市部および都市部と農村部の移行地域で発生した黄熱病ウイルスの流行。 PLOS ネグル。 トロップ。 ディス。 14、e0008658 (2020)。

記事 PubMed PubMed Central Google Scholar

Prussin、AJ et al. 保育園における DNA および RNA ウイルスのバイオエアロゾル コミュニティの季節動態。 マイクロバイオーム 7、53 (2019)。

記事 PubMed PubMed Central Google Scholar

ギボンズ、SM et al. トイレ表面における人間関連微生物叢の生態学的継承と生存率。 応用環境。 微生物。 81、765–773 (2015)。

論文 ADS PubMed PubMed Central Google Scholar

誰、TW et al. 地表近くの大気中の浮遊ウイルス DNA 多様性のメタゲノム特性評価。 J.Virol. 86、8221–8231 (2012)。

論文 CAS PubMed PubMed Central Google Scholar

ダンコ、D.ら。 都市マイクロバイオームと抗菌剤耐性の世界的なメタゲノム マップ。 セル 184、3376 ~ 3393 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

He, T.、Li, H. & Zhang, X. 深海の熱水噴出孔ウイルスは、ウイルスと宿主の相互作用における微生物の代謝を補います。 MBio 8、e00893–17 (2017)。

記事 PubMed PubMed Central Google Scholar

エマーソン、JB et al. 永久凍土の解凍勾配に沿った宿主関連土壌ウイルス生態学。 ナット。 微生物。 3、870–880 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

Coclet, C. & Roux, S. 未培養ファージの宿主予測法の全体的な概要と主要な課題。 カー。 意見。 ヴィロル。 49、117–126 (2021)。

論文 CAS PubMed Google Scholar

Desfarges, S. & Ciuffi, A. 著『Viruses: Essential Agents of Life』 (Witzany, G. 編) 147–175 (Springer Netherlands、2012)。

カリフォルニア州サトル 海中のウイルス。 Nature 437、356–361 (2005)。

論文 ADS CAS PubMed Google Scholar

Jian, H. et al. 地球上で最も深い海に生息するウイルスの多様性と分布。 ISME J. 15、3094–3110 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Brown、TL、慈善団体、OJ & Adriaenssens、EM 海洋、陸上、人間の腸という対照的な環境におけるバクテリオファージの生態学的および機能的役割。 カー。 意見。 微生物。 70、102229 (2022)。

論文 CAS PubMed Google Scholar

ドロン、S.ら。 微生物のパンゲノムにおけるアンチファージ防御システムの体系的な発見。 サイエンス 359、eaar4120 (2018)。

論文 ADS PubMed PubMed Central Google Scholar

Münch, PC、Franzosa, EA、Stecher, B.、McHardy, AC & Huttenhower, C. ヒトのマイクロバイオームにおける天然の CRISPR システムと標的の同定。 細胞宿主微生物 29、94–106.e4 (2021)。

論文 PubMed Google Scholar

Landsberger、M. et al. 抗 CRISPR ファージは協力して CRISPR-Cas 免疫を克服します。 セル 174、908–916 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

バースタイン、D. et al. 主要な細菌系統には、本質的に CRISPR-Cas ウイルス防御システムがありません。 ナット。 共通。 7、10613 (2016)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Guo、J.ら。 VirSorter2: 多様な DNA および RNA ウイルスを検出するための、専門家ガイドによるマルチ分類器のアプローチ。 マイクロバイオーム 9、37 (2021)。

記事 PubMed PubMed Central Google Scholar

レン、J.ら。 深層学習を使用してメタゲノム データからウイルスを識別します。 量的。 バイオル。 8、64–77 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

カマルゴ、AP 他。 IMG/VR v4: 広範な機能的、分類学的、生態学的メタデータの枠組み内の未培養ウイルス ゲノムの拡張データベース。 核酸研究所 51、D733–D743 (2023)。

論文 PubMed Google Scholar

Nayfach, S. et al. ヒトの腸内微生物叢に由来する 189,680 個の DNA ウイルスのメタゲノム大要録。 ナット。 微生物。 6、960–970 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Boeckman、J. et al. オオカミの皮をかぶった羊: 温帯の T7 様バクテリオファージとオートグラフィウイルス科の起源。 ウイルス学 568、86–100 (2022)。

論文 CAS PubMed Google Scholar

Sherier, AJ、Woerner, AE & Budowl, B. ライトの固定指数と機械学習を使用して選択された母集団情報マーカーにより、皮膚マイクロバイオームを使用した人間の識別が向上します。 応用環境。 微生物。 87、e01208–e01221 (2021)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Duponchel, S. & Fischer, MG ビバ・ラビダウイルス! 巨大DNAウイルスに寄生するビロファージの5つの特徴。 PLoS 病巣。 15、e1007592 (2019)。

記事 PubMed PubMed Central Google Scholar

リンドック EJ およびマイヤーズ C. ヒトパピローマウイルスの非性感染のリスクはありますか? 専門家。 アンティ牧師。 感染する。 それで。 12、1165–1170 (2014)。

論文 CAS PubMed Google Scholar

サヘブ・カシャフ、S. 他培養とメタゲノミクスを統合して、皮膚マイクロバイオームの多様性と機能を多界的に把握します。 ナット。 微生物。 7、169–179 (2022)。

論文 CAS PubMed Google Scholar

グレゴリー、AC et al. 極地から極地までの海洋 DNA ウイルスのマクロおよびミクロの多様性。 セル 177、1109–1123.e14 (2019)。

論文 CAS PubMed PubMed Central Google Scholar

Enault, F. et al. ファージが抗生物質耐性遺伝子をコードすることはほとんどありません。これはバイローム分析に対する警告です。 ISME J. 11、237–247 (2017)。

論文 CAS PubMed Google Scholar

El-Gebali, S. et al. 2019 年の Pfam タンパク質ファミリー データベース。Nucleic Acids Res. 47、D427–D432 (2019)。

論文 CAS PubMed Google Scholar

金久 M. & 後藤 S. KEGG: 京都の遺伝子とゲノムの百科事典。 核酸研究所 28、27–30 (2020)。

記事 Google Scholar

Gibson, MK、Forsberg, KJ & Dantas, G. 抗生物質耐性決定因子の注釈の改良により、微生物のレジスタームが生態ごとにクラスター化されていることが明らかになりました。 ISME J. 9、207–216 (2015)。

論文 CAS PubMed Google Scholar

フェルドガーデン、M.ら。 AMRFinderPlus と Reference Gene Catalog は、抗菌薬耐性、ストレス応答、毒性の間のゲノム関連性の検査を容易にします。 科学。 議員 11、12728 (2021)。

論文 ADS CAS PubMed PubMed Central Google Scholar

フェルドガーデン、M.ら。 分離株のコレクションにおける抗菌薬耐性遺伝子型と表現型の相関関係を使用して、AMRFinder ツールと耐性遺伝子データベースを検証します。 抗菌。 エージェント・ケマザー。 63、e00483–19 (2019)。 (2019年)。

論文 CAS PubMed PubMed Central Google Scholar

Lim、KT、Hanifah、YA & Yusof、MYM ermA、ermC、tetM、tetK は、マレーシアの三次病院から分離されたメチシリン耐性黄色ブドウ球菌株のエリスロマイシン耐性とテトラサイクリン耐性に必須です。 インドの J. Med. 微生物。 30、203–207 (2012)。

論文 CAS PubMed Google Scholar

マサチューセッツ州スハウテンら。 ヨーロッパにおけるバンコマイシン耐性腸球菌の蔓延。 ユーロ。 J.クリン. 微生物。 感染する。 ディス。 19、816–822 (2000)。

論文 CAS PubMed Google Scholar

Roberts, MC 獲得され​​たテトラサイクリン耐性遺伝子に関する最新情報。 FEMS 微生物。 レット。 245、195–203 (2005)。

論文 CAS PubMed Google Scholar

Galiez, C.、Siebert, M.、Enault, F.、Vincent, J. & Söding, J. WISH: 主催者は誰ですか? メタゲノムファージコンティグからの原核生物宿主の予測。 バイオインフォマティクス 33、3113–3114 (2017)。

論文 CAS PubMed PubMed Central Google Scholar

Taxiarchi, C. et al. 遺伝的にコードされた抗 CRISPR タンパク質は、遺伝子ドライブの拡散を抑制し、個体数の抑制を防ぎます。 ナット。 共通。 12、3977 (2021)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Wang、J.ら。 PaCRISPR: 抗 CRISPR タンパク質を予測および視覚化するためのサーバー。 核酸研究所 48、W348–W357 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Lu、S.ら。 CDD/SPARCLE: 2020 年の保存ドメイン データベース。Nucleic Acids Res. 48、D265–D268 (2020)。

論文 CAS PubMed Google Scholar

オスナ、BA et al. 二機能性 Cas9 阻害剤による重大な抗 CRISPR 遺伝子座抑制。 細胞宿主微生物 28、23–30 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Young、R. ファージ溶解: 3 つのステップ、3 つの選択肢、1 つの結果。 J.Microbiol. 52、243–258 (2014)。

論文 CAS PubMed PubMed Central Google Scholar

パーリンカス、HLら。 CRISPR/Cas9 を介したマウスの dUTPase のノックアウトは、初期胎児致死を引き起こします。 生体分子 9、136 (2019)。

記事 PubMed PubMed Central Google Scholar

Torrents、E. リボヌクレオチド レダクターゼ: 細菌の生存に必須の酵素。 フロント。 細胞。 感染する。 微生物。 4, 52 (2014)。

記事 PubMed PubMed Central Google Scholar

Xu, Y.、Zhang, R.、Jiao, N. 南シナ海から単離された Paracoccus marcusii ファージ vB_PmaS-R3 の完全なゲノム配列。 スタンドジェノム。 科学。 10、94 (2015)。

記事 Google Scholar

ニューメキシコ州クレディッチ システインの生合成。 EcoSal Plus 3、https://doi.org/10.1128/ecosalplus.3.6.1.11 (2008)。

Neuwald、AF et al. cysQ、大腸菌 K-12 の好気性増殖中にのみシステイン合成に必要な遺伝子。 J.Bacteriol. 174、415–425 (1992)。

論文 CAS PubMed PubMed Central Google Scholar

アダムス、RI、ベイトマン、AC、ビック、HM & メドウ、JF 屋内環境の微生物叢: メタ分析。 マイクロバイオーム 3、49 (2015)。

記事 PubMed PubMed Central Google Scholar

ロペス・リール、G. 他何千もの原核生物ゲノムのマイニングにより、厳密に狭い宿主範囲を持つプロファージが豊富に存在することが明らかになります。 mSystems 7、e00326–22 (2022)。

記事 PubMed PubMed Central Google Scholar

ゴーリ、J.ら。 地下鉄のマイクロバイオーム: 季節の動態と、空気と表面の細菌群集の直接比較。 マイクロバイオーム 7、160 (2019)。

記事 PubMed PubMed Central Google Scholar

Vignuzzi, M. & López, CB 欠陥のあるウイルスゲノムは、ウイルスと宿主の相互作用の重要な要因です。 ナット。 微生物。 4、1075–1087 (2009)。

記事 Google Scholar

Bobay, LM、Rocha, EP & Touchon, M. 温帯性バクテリオファージの宿主ゲノムへの適応。 モル。 バイオル。 進化。 30、737–751 (2013)。

論文 CAS PubMed Google Scholar

Chen, R.、Wang, H. & Mansky, LM ウイルス複製におけるウラシル DNA グリコシラーゼと dUTPase の役割。 J. ヴィロル将軍。 83、2339–2345 (2002)。

論文 CAS PubMed Google Scholar

マラ、P. et al. 永続的に層状になったカリアコ盆地レドックスクラインに沿った微生物プロセスに対するウイルス要素とその潜在的な影響。 ISME J. 14、3079–3092 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

岡崎裕、西村裕、吉田拓、緒方博、中野SI ゲノム解析されたウイルスおよび細胞のメタゲノムにより、深層淡水湖における潜在的な重要なウイルスと宿主の相互作用が明らかになった。 環境。 微生物。 21、4740–4754 (2019)。

論文 CAS PubMed Google Scholar

McCarty, RM、Somogyi, A.、Lin, G.、Jacobsen, NE & Bandarian, V. デアザプリン生合成経路により、4 段階のグアノシン 5'-三リン酸からの PreQ(0) の in vitro 酵素合成が明らかになりました。 生化学 48、3847–3852 (2009)。

論文 CAS PubMed Google Scholar

Middelboe, M. 細菌の増殖速度と海洋ウイルスと宿主の動態。 微生物。 エコル。 40、114–124 (2000)。

論文 CAS PubMed Google Scholar

Calero-Cáceres, W. & Muniesa, M. 廃水の細菌およびバクテリオファージ画分に自然発生する抗生物質耐性遺伝子の持続。 水耐性 95、11–18 (2016)。

論文 PubMed Google Scholar

Pfeifer, E.、Bonnin, RA & Rocha, EPC ファージプラスミドは、感染と溶原性変換を通じて抗生物質耐性遺伝子を広めます。 mBio 13、e01851–22 (2022)。

記事 PubMed PubMed Central Google Scholar

Moon, K. 他淡水ウイルスのメタゲノムにより、新規かつ機能的なファージ媒介抗生物質耐性遺伝子が明らかになりました。 マイクロバイオーム 8、75 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Shen, J.、Zhou, J.、Xu, Y. & Xiu, Z. プロファージは、肺炎桿菌のゲノム可塑性に寄与しており、CG258 における ARG の染色体統合に関与している可能性があります。 ゲノミクス 112、998–1010 (2020)。

論文 CAS PubMed Google Scholar

ハインズ、AP 他。 毒性の連鎖球菌ファージからの抗 CRISPR は化膿連鎖球菌 Cas9 を阻害します。 ナット。 微生物。 2、1374–1380 (2017)。

論文 CAS PubMed Google Scholar

キャラナン、J.ら。 ヒト糞便中のバクテリオファージゲノムのウイルスメタゲノミクスに基づく検出、カタログ化および定量化におけるバイアス、レビュー。 微生物 9, 524 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

ヨハンセン、J.ら。 バルクメタゲノミクスデータからのウイルス実体のゲノムビニング。 ナット。 共通。 13、965 (2022)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Chng、KRら。 三次病院環境における日和見病原体と抗生物質耐性遺伝子の地図作成。 ナット。 医学。 26、941–951 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

ウィルキンス、D. et al. ヒトの皮膚マイクロバイオームの日内変動は、法医学的マイクロバイオーム照合の精度に影響します。 マイクロバイオーム 9、129 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Leung、MHY 他公共交通機関の空気マイクロバイオームとレジストームの特徴付けにより、地理的特異性が明らかになります。 マイクロバイオーム 9、112 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Schubert, M.、Lindgreen, S. & Orlando, L. AdaptorRemoval v2: アダプターの迅速なトリミング、識別、読み取りマージ。 BMC 解像度注記 9、88 (2016)。

記事 PubMed PubMed Central Google Scholar

Uritskiy, GV、DiRuggiero, J. & Taylor, J. MetaWRAP - ゲノム分解メタゲノム データ分析のための柔軟なパイプライン。 マイクロバイオーム 6、158 (2018)。

記事 PubMed PubMed Central Google Scholar

Nayfach, S. et al. CheckV は、メタゲノムで構築されたウイルス ゲノムの品質と完全性を評価します。 ナット。 バイオテクノロジー。 39、578–585 (2021)。

論文 CAS PubMed Google Scholar

Arndt、D. et al. PHASTER: PHAST ファージ検索ツールのより優れた高速バージョン。 核酸研究所 44、W16–W21 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

Kieft, K.、Zhou, Z. & Anantharaman, K. VIBRANT: 微生物ウイルスの自動回復、アノテーションおよびキュレーション、およびゲノム配列からのウイルスコミュニティ機能の評価。 マイクロバイオーム 8、90 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Enright, AJ、Van Dongen, S.、Ouzonis, CA タンパク質ファミリーの大規模検出のための効率的なアルゴリズム。 核酸研究 30、1575–1584 (2002)。

論文 CAS PubMed PubMed Central Google Scholar

ハイアット、D. et al. Prodigal: 原核生物の遺伝子認識と翻訳開始部位の同定。 BMCバイオインフォーム。 11、1–11 (2010)。

記事 Google Scholar

Dixon, P. VEGAN、群集生態学のための R 機能のパッケージ。 J. Veg. 科学。 14、927–930 (2003)。

記事 Google Scholar

Low, SJ、Džunková, M.、Chaumeil, PA、Parks, DH & Hugenholtz, P. カドウイルス目に属する尾部二本鎖 DNA ウイルスの分類のための連結タンパク質系統学の評価。 ナット。 微生物。 4、1306–1315 (2019)。

論文 CAS PubMed Google Scholar

Capella-Gutierrez, S.、Silla-Martinez, JM および Gabaldon, T. trimAl: 大規模な系統解析における自動アライメント トリミングのためのツール。 バイオインフォマティクス 25、1972–1973 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

Price、MN、Dehal、PS & Arkin、AP FastTree: 距離行列の代わりにプロファイルを使用して大きな最小進化ツリーを計算します。 モル。 バイオル。 進化。 26、1641–1650 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

Haft, DH タンパク質ファミリーの TIGRFAM データベース。 核酸研究所 31、371–373 (2003)。

論文 CAS PubMed PubMed Central Google Scholar

Paez-Espino、D. et al. 地球のバイロームを解明する。 自然 536、425–430。

論文 ADS CAS PubMed Google Scholar

Alcock、BP et al. CARD 2020: 包括的な抗生物質耐性データベースを使用した抗生物質レジストーム監視。 核酸研究所 48、D517–D255 (2019)。

PubMed Central Google Scholar

シェーファー、M.ら。 微生物の代謝を抽出してマイクロバイオーム機能の管理を自動化するための DRAM。 核酸研究所 48、8883–8900 (2020)。

Benler, S. et al. 何千ものこれまで知られていなかったファージが、ヒトの腸内メタゲノム全体で発見されました。 マイクロバイオーム 9、78 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Hauser, M.、Steinegger, M. & Soding, J. MMseqs ソフトウェア スイートは、大規模なタンパク質配列セットを高速かつ詳細にクラスタリングおよび検索します。 バイオインフォマティクス 32、1323–1330 (2016)。

論文 CAS PubMed Google Scholar

Deorowicz, S.、Debudaj-Grabysz, A. & Gudyś, A. FAMSA: 巨大なタンパク質ファミリーの高速かつ正確な複数配列アライメント。 科学。 議員6、1–13 (2016)。

記事 Google Scholar

ジャンパー、J. et al. AlphaFold による高精度なタンパク質構造予測。 Nature 596, 583–589 (2021)。

論文 ADS CAS PubMed PubMed Central Google Scholar

ミルディタ、M.ら。 ColabFold: タンパク質のフォールディングを誰でも利用できるようにします。 ナット。 方法 19、679–682 (2022)。

論文 CAS PubMed PubMed Central Google Scholar

Olm, MR、Brown, CT、Brooks, B. & Banfield, JF dRep: 複製解除を通じてメタゲノムからのゲノム回復を向上させる、高速かつ正確なゲノム比較のためのツール。 ISME J. 11、2864–2868 (2017)。

論文 CAS PubMed PubMed Central Google Scholar

Seemann, T. Prokka: 原核生物ゲノムの迅速な注釈付け。 バイオインフォマティクス 30、2068–2069 (2014)。

論文 CAS PubMed Google Scholar

Huerta-Cepas、J. et al. EggNOG 5.0: 5090 の生物と 2502 のウイルスに基づいた、階層的で機能的および系統発生的に注釈が付けられたオルソロジー リソース。 核酸研究所 47、D309–D314 (2019)。

論文 CAS PubMed Google Scholar

Chaumeil, PA、Mussig, AJ、Hugenholtz, P. & Parks, DH GTDB-Tk: ゲノム分類データベースを使用してゲノムを分類するためのツールキット。 バイオインフォマティクス 36、1925–1927 (2020)。

CAS Google スカラー

Couvin, D. et al. CRISPRCasFinder は CRISRFinder のアップデートであり、ポータブル バージョンが含まれており、パフォーマンスが強化され、Cas タンパク質の検索が統合されています。 核酸研究所 46、W246–W251 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

カマチョ、C.ら。 BLAST+: アーキテクチャとアプリケーション。 BMCバイオインフォーム。 10、421 (2009)。

記事 Google Scholar

シャノン、P. et al. Cytoscape: 生体分子相互作用ネットワークの統合モデルのためのソフトウェア環境。 ゲノム研究所 13、2498–2504 (2003)。

論文 CAS PubMed PubMed Central Google Scholar

リファレンスをダウンロードする

この研究は、ACKL、CKC、PKHL に対する香港研究助成評議会の研究インパクト基金 (R1016-20F) と PKHL に対する一般研究基金 (11214721) によって支援されました。国立衛生研究所 (NIH) の助成金 R01AI151059 からも支援を受けています。および U01DA053941 から CEM へ

香港城市大学エネルギー環境学部、香港特別行政区、中国

[ PubMed ] Shicong Du、Xinzhao Tong、Alvin CK Lai、Chak K. Chan、Patrick KH Lee

中国蘇州、西安交通リバプール大学理学部生物科学科

シンジャオ・トン

米国ニューヨーク州ニューヨーク州ワイルコーネル医学生理学・生物物理学科

クリストファー・E・メイソン

アルワリード・ビン・タラル・ビン・アブドゥルアジズ・アルサウド王子殿下、ワイル・コーネル医学、米国ニューヨーク州ニューヨーク州計算生物医学研究所

クリストファー・E・メイソン

The WorldQuant Initiative for Quantitative Prediction、Weill Cornell Medicine、ニューヨーク、ニューヨーク州、米国

クリストファー・E・メイソン

Feil Family Brain and Mind Research Institute、Weill Cornell Medicine、ニューヨーク、ニューヨーク州、米国

クリストファー・E・メイソン

中国、香港特別行政区、香港城市大学海洋汚染国家重点研究所

パトリック・K・H・リー

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

SD はデータ分析、データ解釈を実行し、原稿を執筆しました。 XT と CEM はデータ分析を実行しました。 ACKL と CKC はデータの解釈についてアドバイスを提供しました。 PKHL はこの研究を発案し、研究を監督しました。 著者全員が最終原稿を読んで承認しました。

パトリック・K・H・リーへの通信。

著者らは競合する利害関係を宣言していません。

Nature Communications は、この研究の査読に貢献してくれた Oliver Charity、Eugene Koonin、およびその他の匿名の査読者に感謝します。 査読ファイルが利用可能です。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Du、S.、Tong、X.、Lai、ACK 他。 構築された環境における高度に宿主結合性のウイルスは、生息地に依存した多様性と、潜在的なウイルスと宿主の共進化のための機能を備えています。 Nat Commun 14、2676 (2023)。 https://doi.org/10.1038/s41467-023-38400-0

引用をダウンロード

受信日: 2022 年 11 月 2 日

受理日: 2023 年 4 月 27 日

公開日: 2023 年 5 月 9 日

DOI: https://doi.org/10.1038/s41467-023-38400-0

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。

共有