看不見的DNA潛伏在環境中到处——我們正處在解碼它的秘密的邊緣上

标签:
it杂谈 |
看不見的DNA潛伏在環境中到处——我們正處在解碼它的秘密的邊緣上
環境被撒有棲息它们的生物的DNA。分析它可以提供我们的地球多正在變化的一个實時观望。
When you purchase through links on our site, we may earn an
affiliate commission.

在過去的幾十年裡,来測序脫落在環境中的DNA的能力已经巨大的進步。現在挑戰是弄清楚這一切意味的。
在伊利湖中央漂浮著一個水療中心。它有一個桑拿浴室、一個蒸汽浴室,甚至還有一個裝滿雪的小隔間。有豪華休息室、一個巨大的圖書館、一个由著名藝術家的精選藝術收藏品以及一个帶落地窗的全景演講廳。乘客們在侍酒師的簇擁下,在高級餐廳忙着用餐。
在下面的一層甲板上,有一個原始的、最先進的實驗室,裡面裝滿了高科技設備,兩艘價值數百萬美元的潛水器能將乘客帶到 1000 英尺(300 米)深處。一組科學家正在篩選水樣並实时分析它們,觀察浮遊生物随它漂浮过水的基因指紋。
維京人奥斯坦提斯 (Viking Octantis )游輪上的研究人員正在研究環境 DNA (eDNA),即漂浮在水中、漂浮过空氣或在土壤中徘徊的基因物質片段。每次一个生物穿過一个環境時它脫落它的微小的基因物質。
幾十年前科學家們首次注意到這種基因物質的痕跡,但多虧強大的測序技術,他們現在正開始分析 eDNA 来特征化食物網,揭示失蹤已久瀕危物種的位置,並顯示是否捕食者正潛伏在人類和野生動物衝突的地區中。
但這項技術有一個問題:它產生如此多的數據以至於研究人員挣扎来分析所有的它。現在,科學家們正工作在用尖端測序結合人工智能来快速識別一个給定生態系統中生物類型和數量中的變化上。最終,這些信息可以提供一个地球如何運作的實時观望,並允许我們来更快適應生態變化。
美國國家海洋和大氣管理局 (NOAA) 太平洋海洋環境實驗室海洋分子生態學專案的研究負責人格尔德(Zachary Gold )告訴生活科学杂志 ,“人工智能將能夠以一种我們的其他技術刚好没有能力的方式提取 [信息],更迅速、更好、更快的數據允许我們来做我們以前做夢都想不到的事情”。

維京人奥斯坦提斯号遠征南極洲的照片。船上實驗室被設計来處理COVID-19大流行期間測試的空間已被重新用於分析環境DNA。(Image credit: Viking)
環境數據的寶庫
“環境DNA”或“eDNA”一詞被在1980年代的一項描述一種從土壤樣本中獲取DNA的技術研究中捏造。但直到 2000 年代快速準確的 DNA 測序儀變得廣泛可用且买得起使 eDNA 分析實用为止不用这个词。
下一代測序 (NGS) 現在允许科學家来难以置信快分析DNA——現在只需一天整個人類基因組能被測序。對eDNA,下一代測序意味着可以從一个單個水樣能识别數千個物種。測序技術是高度先進的,但分析並從中得出有意義結論的能力需要大量的計算能力,並且可能要科學家用數年的時間。
物理樣本能从要用幾天到一個月任何时间来測序,然後一旦序列返回就必須下載並「清理」數 GB 的數據,被用計算機檢查錯誤、重複或格式問題。只有那时經過驗證的數據集能被分析。
這是人工智能可以是變革的下一步。
格尔德說,“研究人員能花費數月時間流覽过這些數據試圖理解和識別出自這些數據最有趣、最强大的故事并评估,但人工智能可以在幾秒鐘內完成”。

在奥斯坦提斯号上的一个實驗室工作的研究員。维京與 NOAA 合作随輪船經過不同水域做浮遊植物的实时分析,提供一个它们的生態系統的实时快照。(Image credit: Viking)
一支浮動實驗室的大軍
维京研究eDNA的部分原因是大流行。該公司最初被要求對 COVID-19用聚合酶鏈反應 (PCR) 檢測,但一旦該要求被逐步淘汰,在它的船上的設備被重新用於允许實時檢測水樣。這家郵輪公司於 2020 年與 NOAA 合作,科學家於 2022 年加入了維京人的五大湖探險隊。
現在,這艘 673 英尺長(205 米)的游輪上的科學家們分析它們所經過的水域中的浮遊植物,每次船訪問同一地區都提供一个生態系統的快照。該團隊说,與昂貴且不定期的傳統科學考察相比,旅遊船節省時間和金錢——無論如何,游輪都會進行這些航行——而且食物要好得多。

浮游植物的顯微鏡圖像。浮遊植物形成許多海洋食物網的基礎,併產生地球上一半的氧氣。浮遊植物豐度或多樣性中的變化能揭示海洋健康中的變化。((Image credit: NOAA National Ocean Service)
在他們的漂浮實驗室中,與维京合作的研究人員現在測序浮遊植物。加州大學聖地牙哥分校斯克里普斯海洋研究所(Scripps Institution of Oceanography)的研究員艾莉森·庫西克(Allison Cusick)說,“它們对地球上的生命是關鍵” ,他在維京人的一個船舶實驗室工作来研究在南極洲等偏遠地區中的eDNA。浮游植物是大多數海洋食物網的基礎,它們通過光合作用產生地球上大約一半的氧氣,它是大多數海洋食物網的基礎,它們经由光合作用產生地球上大約一半的氧氣。庫西克說,浮遊植物物種之間的差異是冲击思维的——兩種類型之間的多樣性能比人類和真菌之間的多樣性更大。
水中浮遊生物類型的變化是生物多樣性和海洋健康的關鍵指標——變化能在食物網上反彈起来,有潛在的毀滅性後果。
法國國家海洋科學與技術研究所(IFREMER)的超級計算機工程師 莫林(Benoit Morin )說,用 eDNA 分析來揭示物種之間的進化關係以及它們採取的不同進化路徑——例如當一個物種出現時和当特定基因被引入時——可以帮助科學家預測氣候變化將如何影響不同的物種。
莫林告訴生活科学杂志,“通過观察過去,我們能嘗試了解未來”。
对 eDNA一个“谜题”项目
要真正強大,像维京-NOAA 合作這樣的项目需要将人工智能集成进eDNA 分析。
人工智能已經被用於從相機陷阱和自動監控系統的大型數據集发现潛在的新物種。它還被用來重新發現失落的物種,包括極度瀕危的德溫頓金鼴鼠 (Cryptochloris wintoni),在使用 eDNA 追蹤之前,它已經 80 多年沒有被發現。
但要這些努力到达它们的潛力,将需要人工智能技術被精练和集成到 eDNA 分析中。
一旦科學家已经收集到一个 eDNA 樣本,他們经由條碼分析它,條碼能要么尋找一个單個物種要么生物體,要么一次識別多個物種。條碼是一小系列獨特的 DNA 序列,被用於通过在線參考資料庫比較它來識別一个生物體。
法國高級研究實用學院(École Pratique des Hautes Études)的數學工程師拉姆颇提(Letizia Lamperti )正在開發一種機器學習系統来用這種條形碼基于一个樣本中生物體的類型和數量揭示一个給定環境的健康。反過來,這些信息可能指向潜在的修復方法。
库西科說,例如如果在水樣中有一个產生毒素的浮遊植物的增加,来定下吃食的浮遊植物的農業徑流的這些變化是有可能的,。
2023年,拉姆颇提和她的同事發表了一項表明神經網路——模仿人腦過濾和處理信息方式的多層機器學習演算法研究,比其他基于它们的eDNA密切相關的生物體分組的統計方法做得更好。但就像面部識別技術一樣,人工智能可能更擅長檢測豐富的物種,為此有很多“訓練”數據,但在發現罕见生物方面效果較差。

一位科學家在奥斯坦提斯實驗室處理
一个eDNA
樣品。
最近的其他幾項研究指出了人工智能在 eDNA 研究中的承诺潛力。例如,一項研究發現人工智能能識別一个樣本中 90% 的未知物種,甚至当沒有來自密切相關生物體的相似序列可用於比較时。
如果人工智能能完成它的潛力,在我們如何理解環境中的变化將是巨大的。库西科將其比作阿兰图灵(Alan Turing )在二戰期間解密德國人的密码机(Enigma) 密碼。她告訴生活科学杂志,“這將是變革性的”
很多東西並不難,它只是要用現有在那里的工具。我們只需要指明正確方向中的自行車"
Zachary Gold
人工智能可以以無與倫比的規模識別新發現的物種。進化關係可以在眨眼之間被確定。對環境變化的監測和規劃可能被变换。例如,通過快速分析 eDNA 樣本,人工智能可以即時提醒游泳者水道中存在食腦變形蟲或鯊魚,或者在有害藻華威脅公共衛生之前預測它們等事件——類似於我們現在在手機上收到天氣警報的方式。
因此,從理論上講資源可被快速重定向在它们变成問題問題之前解決問題。
格尔德說,這個目標是可以實現的,但需要多長時間將取決於為此開發人工智能所投入的資源。
物種詞典
目前,人工智能缺少一些重要的東西:組織大量用於發現關鍵模式的優質數據。這些數據需要放在一個作為一个基於它们的DNA的參考資料庫或物種詞典的地方,拉姆颇提告訴生活科学杂志,“我們需要參考資料庫來執行物種識別,問題是我們沒有它”。。
為識別物種,人工智能需要通過訓練在大量數據上來學習密切相關物種的單個關鍵签名和或條碼。但生物多樣性數據集不在公開可用的存儲庫中,它們也不是經過精心策劃能被饋送到經過訓練的定製人工智能系統中的標準化格式,格尔德說, “eDNA 還沒有為人工智能做好準備”。
格尔德估計,僅在過去十年中,在美國就已经收集了大約 40000 個 eDNA 樣本,但其中很多樣本無法獲得。他說,它可能“在某人的閣樓上或某人的科學論文的補充方法中”。
為得出有用的結論來幫助我們保護和管理環境,人工智能需要從捕獲我們感興趣的環境中的生物多樣性的基線資料庫中學習。這是一項艱巨的努力。格尔德說,“這是數百萬美元;這是大量的人們的時間 “。
莫林目前正工作在執行這項任務上,但這是一個緩慢且資源密集型過程。他和他的同事們正在通過 ATLASea 項目構建一個基因“詞典”,該项目目标是對 4500 個海洋物種的基因組測序。這些信息將存放在科學界的一个開放訪問資料庫中。法國國家海洋科學與技術研究所現在正在與數據基礎設施公司 NetApp 合作,分類大量被收集的信息。
RELATED STORIES
—Crocodile 'fingerprints' may reveal Australia's deadly, hidden predators
—World's oldest DNA reveals secrets of lost Arctic ecosystem from 2 million years ago
—Researchers can now collect and sequence DNA from the air
格尔德說,有了開發數據集的資金,人工智能eDNA 工具可以“真的快”的準備就緒。“我毫不懷疑我們正在做的事情在技術上並不困難。只是我們沒有為其提供資源。如果我們真的想做這件事並大規模動員起來,我毫不懷疑,到 [2028 年] 在洛杉磯舉行的下一屆奧運會之前,我們可以有好工具、資源和網路建立,並準備好這樣做”。
格尔德估計,如果投資和資源繼續以它们目前的步伐,這將是一個 「緩慢的涓涓細流」,我們將在大約15年內達到這一目標。但他是樂觀的,這個時程表可能會更快。格尔德說,“很多東西並不難;它只是要用現有的已经在那里的工具,我們只要指明正確方向中的自行車” 。
在科学探照灯Science Spotlight,中, Live Science更深入观察新興科學,给你关于這些進步需要的觀點。我們的故事突出不同領域中的趨勢,新的研究如何改變舊想法,以及我們生活的世界圖片如何因科學被改變。
https://www.livescience.com/planet-earth/invisible-dna-lurks-everywhere-in-the-environment-and-were-on-the-verge-of-decoding-its-secrets