【要約】The first complex cells had genes from a complex mix of species [Ars_Technica] | Summary by TechDistill
> Source: Ars_Technica
Execute Primary Source
// Problem
従来の進化モデルでは、真核生物の起源をアルカエとバクテリアの単純な融合として捉えていた。しかし、ゲノム解析が進むにつれ、既存のモデルでは説明できない遺伝子の存在が浮上した。研究者は以下の課題に直面した。
- ・系統樹におけるサンプルの偏り(動物や特定の環境種への過剰な集中)。
- ・低複雑性タンパク質による解析データのノイズ。
- ・遺伝子重複による、類似した遺伝子情報の重複。
- ・真核生物の共通祖先のゲノム定義における曖昧さ。
// Approach
バルセロナの研究チームは、ゲノム解析の精度を高めるため、データのノイズを排除する厳格な手法を採用した。彼らは以下のステップで解析を行った。
- ・系統樹全体で均等な分布となるよう、解析対象の種を厳選した。
- ・低複雑性タンパク質を生成する遺伝子をすべて除去した。
- ・重複した遺伝子群から、代表的な1つの遺伝子のみを保持した。
- ・異なる選択基準を用いた3つの「簡略化されたゲノム(OGs)」を作成し、結果の妥当性を検証した。
// Result
研究チームは、真核生物の起源が単一の融合ではなく、多段階の遺伝子伝播によるものであることを突き止めた。解析の結果、以下の事実が判明した。
- ・Asgard archaea、Alphaproteobacteriaに加え、Planctomycetota、Myxococcotaからの寄与を確認した。
- ・ウイルス群からの遺伝子寄与が、単一の細菌群よりも大きいことを特定した。
- ・初期の真核生物は、酸素環境下で代謝を行い、細胞内輸送や消化機能を有していた。
- ・細胞分裂の制御メカニズムは、初期段階では未発達であった可能性がある。
Senior Engineer Insight
> 複雑なシステムの起源を解明する際、単一のイベント(モノリスな融合)ではなく、継続的なモジュールの統合と、外部からの非連続的な注入(水平伝播)が重要であることを示唆している。また、解析におけるサンプリングの偏りやノイズの排除は、大規模データ解析における基本かつ最重要事項である。データの不完全性を認めつつ、手法の妥当性を検証する姿勢は、システム設計の検証プロセスにおいても極めて重要である。