Nature:2024年值得關注的七項技術,它是核心
隨著人工智能(AI)技術的不斷突破和大型模型的層出不窮,AI受到了前所未有的關注。面對這一浪潮,人們不禁好奇:未來究竟會是什么樣子?
為了解答這一問題,《Nature》雜志發布了未來的一年里,將密切關注以下七個技術領域。核心技術創新集中在人工智能領域,更是引領未來發展的重要力量。從蛋白質工程到3D打印再到深度偽造(deepfake),這些領域都將取得新的突破和進步。
面向蛋白質設計的深度學習
二十年前,西雅圖華盛頓大學的大衛·貝克(David Baker)和他的同事們取得了一項里程碑式的壯舉:他們使用計算工具從頭開始設計了一種全新的蛋白質。“Top7”如預測的那樣折疊,但它是惰性的:它沒有執行有意義的生物學功能。如今,從頭蛋白質設計已經成熟為一種實用工具,用于生成定制酶和其他蛋白質。“這是非常強大的,”華盛頓大學的生物化學家尼爾·金說,他與貝克的團隊合作設計了基于蛋白質的疫苗和藥物遞送載體。“一年半前不可能的事情——現在你只要去做就行了。”
其中大部分進展歸結為將蛋白質序列與結構聯系起來的日益龐大的數據集。但是,深度學習(人工智能(AI)的一種形式)的復雜方法也是必不可少的。
“基于序列”的策略使用大型語言模型 (LLM),這些模型為聊天機器人 ChatGPT 等工具提供支持(參見“ChatGPT?也許明年')。通過將蛋白質序列視為包含多肽“單詞”的文檔,這些算法可以辨別構成真實世界蛋白質架構手冊的模式。“他們真的學會了隱藏的語法,”西班牙巴塞羅那分子生物學研究所的蛋白質生物化學家Noelia Ferruz說。2022 年,她的團隊開發了一種名為 ProtGPT2 的算法,該算法始終如一地提出在實驗室生產時可以穩定折疊的合成蛋白質1.Ferruz共同開發的另一個工具稱為ZymCTRL,它利用序列和功能數據來設計天然存在的酶家族的成員2.
ChatGPT?也許明年
讀者可能會在今年的技術中發現一個值得關注的主題:深度學習方法的巨大影響。但有一個這樣的工具并沒有進入最終階段:大肆宣傳的人工智能(AI)驅動的聊天機器人。ChatGPT 及其同類產品似乎有望成為許多研究人員日常生活的一部分,并作為 2023 年《自然》雜志 10 篇綜述的一部分(見 go.nature.com/3trp7rg)。在9月份的一項《自然》調查中(見 go.nature.com/45232vd),受訪者認為ChatGPT是最有用的基于人工智能的工具,并對其在編碼、文獻綜述和行政任務方面的潛力充滿熱情。
從公平的角度來看,這些工具也被證明很有價值,可以幫助那些英語不是第一語言的人完善他們的散文,從而簡化他們的出版和職業發展之路。然而,其中許多應用代表了節省勞動力的收益,而不是研究過程的轉變。此外,ChatGPT持續發布誤導性或捏造的回復是超過三分之二的受訪者的主要擔憂。盡管值得監測,但這些工具需要時間來成熟并在科學界建立更廣泛的作用。
基于序列的方法可以建立在現有的蛋白質特征之上并對其進行調整以形成新的框架,但它們對于結構元件或特征的定制設計效果較差,例如以可預測的方式結合特定靶標的能力。“基于結構”的方法更適合這一點,2023 年這種類型的蛋白質設計算法也取得了顯著進展。其中一些最復雜的使用“擴散”模型,這也是DALL-E等圖像生成工具的基礎。這些算法最初經過訓練,可以從大量真實結構中去除計算機生成的噪聲;通過學習從噪聲中區分真實的結構元素,他們獲得了形成生物學上合理的用戶定義結構的能力。
RFdiffusion 軟件3由 Baker 的實驗室和馬薩諸塞州薩默維爾的 Generate Biomedicines 開發的 Chroma 工具4,利用這一策略取得了顯著的效果。例如,Baker 的團隊正在使用 RFdiffusion 來設計新型蛋白質,這些蛋白質可以與感興趣的靶標形成緊密的界面,從而產生“完全符合表面”的設計,Baker 說。RFdiffusion 的更新的“全原子”迭代5允許設計人員圍繞非蛋白質靶標(如 DNA、小分子甚至金屬離子)進行計算塑造蛋白質。由此產生的多功能性為工程酶、轉錄調節劑、功能性生物材料等開辟了新的視野。
“深度偽造”Deepfake檢測
公開可用的生成式 AI 算法的爆炸式增長使合成令人信服但完全人工的圖像、音頻和視頻變得簡單。選舉結果可能會讓人分心,但隨著多場持續的地緣政治沖突和美國總統大選的臨近,武器化媒體操縱的機會比比皆是。
紐約布法羅大學(University at Buffalo)的計算機科學家劉思偉(Siwei Lyu)說,例如,他已經看到了許多人工智能生成的與以色列-哈馬斯沖突有關的“深度偽造”圖像和音頻。這只是一場高風險的貓捉老鼠游戲的最新一輪,人工智能用戶制作欺騙性內容,呂和其他媒體取證專家致力于檢測和攔截它。
人工智能與科學:1,600 名研究人員的想法
一種解決方案是讓生成式 AI 開發人員在模型的輸出中嵌入隱藏信號,從而生成 AI 生成內容的水印。其他策略側重于內容本身。例如,一些經過處理的視頻將一個公眾人物的面部特征替換為另一個公眾人物的面部特征,而新的算法可以在替換特征的邊界處識別偽影,Lyu說。一個人外耳的獨特褶皺也可以揭示面部和頭部之間的不匹配,而牙齒的不規則性可以揭示經過編輯的口型同步視頻,其中一個人的嘴巴被數字操縱,說出受試者沒有說的話。人工智能生成的照片也帶來了一個棘手的挑戰——也是一個移動的目標。2019 年,意大利那不勒斯費德里科二世大學的媒體取證專家 Luisa Verdoliva 幫助開發了 FaceForensics++,這是一種用于發現被幾個廣泛使用的軟件包操縱的人臉的工具6.但圖像取證方法因主題和軟件而異,泛化是一個挑戰。“你不能有一個單一的通用探測器——這非常困難,”她說。
然后是實施的挑戰。美國國防高級研究計劃局的語義取證 (SemaFor) 計劃開發了一個有用的深度偽造分析工具箱,但正如《自然》雜志報道的那樣(見 Nature 621, 676–679; 2023),主要社交媒體網站并沒有經常使用它。擴大對此類工具的訪問可能有助于促進吸收,為此,Lyu的團隊開發了DeepFake-O-Meter7,一個集中的公共算法存儲庫,可以從不同角度分析視頻內容以嗅探出深度偽造內容。這些資源將有所幫助,但與人工智能生成的錯誤信息的斗爭可能會持續數年。
大片段DNA插入
2023年底,美國和英國監管機構批準了有史以來第一個基于CRISPR的基因編輯療法,用于治療鐮狀細胞病和輸血依賴性β地中海貧血,這是基因組編輯作為臨床工具的重大勝利。
CRISPR 及其衍生物使用短的可編程 RNA 將 DNA 切割酶(如 Cas9)引導至特定的基因組位點。它們在實驗室中通常用于禁用有缺陷的基因并引入微小的序列變化。精確和可編程地插入跨越數千個核苷酸的較大DNA序列是困難的,但新興的解決方案可以讓科學家替換缺陷基因的關鍵片段或插入功能齊全的基因序列。加州斯坦福大學的分子遺傳學家Le Cong和他的同事們正在探索單鏈退火蛋白(SSAPs)——介導DNA重組的病毒衍生分子。當與 CRISPR-Cas 系統結合使用時,其中 Cas9 的 DNA 切片功能已被禁用,這些 SSAP 允許將多達 2 千堿基的 DNA 精確靶向插入人類基因組。
其他方法利用一種稱為引物編輯的基于CRISPR的方法引入短的“著陸點”序列,這些序列選擇性地募集酶,而這些酶又可以精確地將大DNA片段拼接到基因組中。例如,2022 年,劍橋麻省理工學院的基因組工程師 Omar Abudayyeh 和 Jonathan Gootenberg 及其同事首次描述了通過位點特異性靶向元件 (PASTE) 進行可編程添加的方法,這種方法可以精確插入多達 36 千堿基的 DNA8.Cong說,PASTE在培養的患者來源細胞的體外修飾方面特別有前途,并且潛在的引物編輯技術已經進入了臨床研究的軌道。但對于人類細胞的體內修飾,SSAP可能會提供一種更緊湊的解決方案:更笨重的PASTE機制需要三個獨立的病毒載體才能遞送,這可能會降低相對于雙組分SSAP系統的編輯效率。也就是說,即使是相對低效的基因替代策略也足以減輕許多遺傳疾病的影響。
這些方法不僅與人類健康有關。由北京中國科學院的Caixia Gao領導的研究人員開發了PrimeRoot,這是一種使用Prime Editing引入特定靶位點的方法,酶可以使用這些靶位點在水稻和玉米中插入多達20千堿基的DNA9.Gao認為,該技術可能廣泛用于賦予作物抗病性和病原體抗性,從而繼續基于CRISPR的植物基因組工程的創新浪潮。“我相信這項技術可以應用于任何植物物種,”她說。
腦機接口
帕特·貝內特(Pat Bennett)的言語速度比一般人慢,有時可能會用錯詞。但鑒于運動神經元疾病,也稱為肌萎縮側索硬化癥,以前使她無法用語言表達自己,這是一項了不起的成就。
貝內特的康復得益于斯坦福大學神經科學家弗朗西斯·威利特(Francis Willett)及其在美國BrainGate聯盟的同事開發的復雜腦機接口(BCI)設備10.威利特和他的同事在貝內特的大腦中植入電極以跟蹤神經元活動,然后訓練深度學習算法將這些信號轉化為語音。經過幾周的訓練,貝內特能夠從125,000個單詞的詞匯量中每分鐘說出多達62個單詞,是普通英語使用者詞匯量的兩倍多。“這真的令人印象深刻,他們溝通的速度,”在賓夕法尼亞州匹茲堡大學開發腦機接口技術的生物工程師詹妮弗·科林格說。
腦機接口技術使帕特·貝內特(Pat Bennett)(坐著)恢復了說話能力。圖片來源:Steve Fisch/Stanford Medicine
BrainGate的試驗只是過去幾年的幾項研究之一,這些研究展示了BCI技術如何幫助患有嚴重神經損傷的人重新獲得失去的技能并實現更大的獨立性。其中一些進展源于各種神經系統疾病患者大腦中功能神經解剖學知識的穩步積累,羅德島州普羅維登斯布朗大學的神經學家、BrainGate聯盟主任Leigh Hochberg說。但是,他補充說,通過機器學習驅動的分析方法,這些知識已經大大放大了,這些方法揭示了如何更好地放置電極并解密它們拾取的信號。
研究人員還在應用基于人工智能的語言模型來加速對患者試圖交流的內容的解釋——本質上是大腦的“自動完成”。這是威利特研究的核心組成部分,也是另一個核心組成部分11來自加州大學舊金山分校神經外科醫生 Edward Chang 領導的團隊。在這項工作中,BCI神經假體允許一名因中風而無法說話的女性以每分鐘78個單詞的速度進行交流 ?-大約是英語平均速度的一半,但比女性以前的語音輔助設備快五倍多。該領域在其他領域也取得了進展。2021 年,匹茲堡大學的 Collinger 和生物醫學工程師 Robert Gaunt 將電極植入四肢癱瘓的人的運動和軀體感覺皮層中,以提供對機械臂的快速精確控制以及觸覺反饋12.此外,BrainGate和荷蘭UMC烏得勒支的研究人員正在進行獨立臨床研究,以及來自紐約布魯克林的BCI公司Synchron的一項試驗,以測試一種允許癱瘓者控制計算機的系統——這是第一個由行業贊助的BCI設備試驗。
作為一名重癥監護專家,Hochberg 渴望將這些技術提供給患有最嚴重殘疾的患者。但隨著BCI能力的發展,他看到了治療更中度的認知障礙以及心理健康狀況(如情緒障礙)的潛力。“由腦機接口提供的閉環神經調控系統可能對很多人有巨大的幫助,”他說。
超強分辨率
Stefan Hell、Eric Betzig 和 William Moerner 因打破了限制光學顯微鏡空間分辨率的“衍射極限”而獲得 2014 年諾貝爾化學獎。由此產生的細節水平(大約為數十納米)開啟了廣泛的分子尺度成像實驗。盡管如此,一些研究人員仍然渴望更好——而且他們正在取得迅速的進展。“我們真的在努力縮小從超分辨率顯微鏡到冷凍電子顯微鏡等結構生物學技術的差距,”德國普蘭內格馬克斯普朗克生物化學研究所的納米技術研究員拉爾夫·榮格曼(Ralf Jungmann)說,他指的是一種可以重建具有原子級分辨率的蛋白質結構的方法。
2022年底,由Hell及其團隊在哥廷根馬克斯·普朗克多學科科學研究所(Max Planck Institute for Multidisciplinary Sciences)領導的研究人員首次涉足這一領域,他們使用一種名為MINSTED的方法,可以使用專門的光學顯微鏡以2.3-?ngstr?m的精度(大約四分之一納米)解析單個熒光標記13.
較新的方法使用傳統顯微鏡提供相當的分辨率。例如,Jungmann 和他的團隊在 2023 年描述了一種策略,其中單個分子用不同的 DNA 鏈標記14.然后用染料標記的互補DNA鏈檢測這些分子,這些DNA鏈瞬時但重復地與相應的靶標結合,從而可以區分單個熒光“閃爍”點,如果同時成像,這些點會模糊成一個斑點。這種通過順序成像 (RESI) 方法提高分辨率的方法可以解析 DNA 鏈上的單個堿基對,使用標準熒光顯微鏡展示 ?ngstr?m 級分辨率。
由德國哥廷根大學醫學中心的神經科學家Ali Shaib和Silvio Rizzoli領導的團隊開發的一步納米級擴展(ONE)顯微鏡方法并沒有完全達到這種分辨率水平。然而,ONE顯微鏡提供了一個前所未有的機會,可以直接對單個蛋白質和多蛋白復合物的精細結構細節進行成像,無論是在分離中還是在細胞中15.
一種稱為RESI的成像形式可以對DNA中的單個堿基對進行成像。圖片來源:Max Iglesias, Max Planck Institute of Biochemistry
ONE是一種基于擴增顯微鏡的方法,涉及將樣品中的蛋白質化學偶聯到水凝膠基質上,將蛋白質分解,然后使水凝膠的體積膨脹1000倍。碎片在各個方向上均勻膨脹,保留了蛋白質結構,并使用戶能夠使用標準共聚焦顯微鏡分離幾納米的特征。“我們提取抗體,將它們放入凝膠中,在擴增后標記它們,然后說,”哦,我們看到了Y形!“Rizzoli說,指的是蛋白質的特征形狀。
Rizzoli說,ONE顯微鏡可以提供對構象動態生物分子的見解,或者能夠從血液樣本中對蛋白質錯誤折疊疾病(如帕金森病)進行視覺診斷。Jungmann 同樣熱衷于 RESI 記錄疾病或藥物治療中單個蛋白質重組的潛力。甚至可以更緊密地放大。“也許這不是空間分辨率限制的終點,”Jungmann說。“情況可能會好轉。”
細胞圖譜
如果您正在尋找一家方便的咖啡館,Google 地圖可以找到附近的選擇并告訴您如何到達那里。在更復雜的人體環境中導航是沒有等價物的,但各種細胞圖譜計劃的持續進展 ?-由單細胞分析和“空間組學”方法的進步推動 ?-可能很快就會提供生物學家渴望的組織范圍的細胞圖譜。
這些計劃中規模最大,也許也是最雄心勃勃的,是人類細胞圖譜(HCA)。該聯盟于2016年由英國欣克斯頓惠康桑格研究所的細胞生物學家Sarah Teichmann和現任加利福尼亞州南舊金山生物技術公司Genentech的研究和早期開發負責人Aviv Regev發起。它包括近100個國家的約3,000名科學家,使用來自10,000名捐贈者的組織。但HCA也是細胞和分子圖譜交叉工作的更廣泛生態系統的一部分。其中包括由美國國立衛生研究院資助的人類生物分子圖譜計劃(HuBMAP)和通過推進創新神經技術(BRAIN)倡議進行的大腦研究細胞普查網絡(BICCN),以及由華盛頓州西雅圖艾倫研究所資助的艾倫腦細胞圖譜。
斯坦福大學基因組學家、HuBMAP指導委員會前聯合主席邁克爾·斯奈德(Michael Snyder)表示,這些努力在一定程度上是由分析工具的開發和快速商業化推動的,這些工具可以在單細胞水平上解碼分子內容。例如,Snyder的團隊經常使用位于加利福尼亞州普萊森頓的10X Genomics的Xenium平臺進行空間轉錄組學分析。該平臺可以每周在 4 個組織樣本中同時調查大約 400 個基因的表達。基于抗體的多重方法,例如位于馬薩諸塞州馬爾堡的 Akoya Biosciences 的 PhenoCycler 平臺,使該團隊能夠以單細胞分辨率跟蹤大量蛋白質,從而實現 3D 組織重建。其他“多組學”方法允許科學家同時分析同一細胞中的多個分子類別,包括RNA的表達,染色質的結構和蛋白質的分布。
人肺的細胞圖譜描述了不同的細胞類型以及它們是如何被調節的。圖片來源:Peng He
去年,有數十項研究展示了使用這些技術生成器官特異性圖譜的進展。例如,今年6月,HCA發布了對來自人類肺部的49個數據集的綜合分析16.Teichmann 說:“擁有非常清晰的肺部地圖可以告知肺纖維化、不同腫瘤等疾病發生的變化,即使是 COVID-19。2023 年,《自然》雜志發布了一篇文章集(見 go.nature.com/3vbznk7),重點介紹了 HuBMAP 的進展,《科學》雜志制作了一本詳細介紹了 BICCN 工作的文集(見 go.nature.com/3nsf4ys)。
還有大量的工作要做——Teichmann 估計,HCA 至少需要五年時間才能完成。但是,當它們到達時,由此產生的地圖將是無價的。例如,Teichmann 預測使用圖譜數據來指導組織和細胞特異性藥物靶向,而 Snyder 則渴望了解細胞微環境如何告知癌癥和腸易激綜合征等復雜疾病的風險和病因。“我們會在2024年解決這個問題嗎?我不這么認為——這是一個多年的問題,“斯奈德說。“但它是整個領域的一大驅動力。
納米材料3D打印
奇怪而有趣的事情可能會在納米尺度上發生。這可能使材料科學預測變得困難,但這也意味著納米級建筑師可以制造具有獨特特性的輕質材料,例如增加強度、與光或聲音的定制相互作用以及增強的催化或儲能能力。
有幾種方法可以精確地制作這種納米材料,其中大多數使用激光來誘導光敏材料的圖案化“光聚合”,并且在過去幾年中,科學家們在克服阻礙更廣泛采用這些方法的局限性方面取得了相當大的進展。
研究人員使用水凝膠制作了微尺度金屬結構。圖片來源:Max Saccone/Greer Lab
一是速度。亞特蘭大佐治亞理工學院的工程師Sourabh Saha表示,使用光聚合技術組裝納米結構的速度比其他納米級3D打印方法快大約三個數量級。這對于實驗室使用來說可能已經足夠了,但對于大規模生產或工業過程來說太慢了。2019 年,香港中文大學的 Saha 和機械工程師 Shih-Chi Chen 及其同事表明,他們可以通過使用圖案化的 2D 光片而不是傳統的脈沖激光來加速聚合17.“這將速率提高了一千倍,而且你仍然可以保持那些100納米的特征,”Saha說。包括Chen在內的研究人員的后續工作已經確定了加快納米加工的其他途徑18.
另一個挑戰是,并非所有材料都可以直接通過光聚合進行打印,例如金屬。但帕薩迪納加州理工學院的材料科學家朱莉婭·格里爾(Julia Greer)開發了一種聰明的解決方法。2022 年,她和她的同事描述了一種將光聚合水凝膠用作微尺度模板的方法;然后將它們注入金屬鹽,并以誘導金屬呈現模板結構同時收縮的方式進行加工19.盡管該技術最初是為微尺度結構開發的,但Greer的團隊也將這種策略用于納米制造,研究人員對從堅固的高熔點金屬和合金中制作功能性納米結構的潛力充滿熱情。
最后一個障礙——經濟——可能是最難打破的。根據Saha的說法,許多光聚合方法中使用的基于脈沖激光的系統成本高達50萬美元。但更便宜的替代品正在出現。例如,德國卡爾斯魯厄理工學院的物理學家馬丁·韋格納(Martin Wegener)及其同事探索了比標準脈沖激光器更便宜、更緊湊、功耗更低的連續激光器20.格里爾還成立了一家初創公司,將一種制造納米架構金屬板的工藝商業化,該工藝可能適用于下一代防彈衣或飛機和其他車輛的超耐用和抗沖擊外層等應用。
參考文獻:
1.Ferruz, N., Schmidt, S. & H?cker, B. Nature Commun. 13, 4348 (2022).
2.Munsamy, G., Lindner, S., Lorenz, P. & Ferruz, N. ZymCTRL: A Conditional Language Model for the Controllable Generation of Artificial Enzymes (MLSB, 2022).
3.Watson, J. L. et al. Nature 620, 1089–1100 (2023).
4.Ingraham, J. B. et al. Nature 623, 1070–1078 (2023).
5.Krishna, R. et al. Preprint at bioRxiv https://doi.org/10.1101/2023.10.09.561603 (2023).
6.R?ssler, A. et al. Preprint at https://arxiv.org/abs/1901.08971 (2019).
7.Li, Y., Zhang, C., Sun, P., Qi, H. & Lyu, S. Preprint at https://arxiv.org/abs/2103.02018 (2021).
8.Yarnall, M. T. N. et al. Nature Biotechnol. 41, 500–512 (2023).
9.Sun, C. et al. Nature Biotechnol. https://doi.org/10.1038/s41587-023-01769-w (2023).
10.Willett, F. R. et al. Nature 620, 1031–1036 (2023).
11.Metzger, S. L. et al. Nature 620, 1037–1046 (2023).
12.Sharlene, N. et al. Science 372, 831–836 (2021).
13.Weber, M. et al. Nature Biotechnol. 41, 569–576 (2023).
14.Reinhardt, S. C. M. et al. Nature 617, 711–716 (2023).
15.Shaib, A. H. et al. Preprint at bioRxiv https://doi.org/10.1101/2022.08.03.502284 (2023).
16.Sikkema, L. et al. Nature Med. 29, 1563–1577 (2023).
17.Saha, S. K. et al. Science 366, 105–109 (2019).
18.Ouyang, W. et al. Nature Commun. 14, 1716 (2023).
19.Saccone, M. A. et al. Nature 612, 685–690 (2022).
20.Hahn, V. et al. Nature Photon. 16, 784–791 (2022).
原文以Seven technologies to watch in 2024標題發表在2024年1月22日《Nature》的技術特寫版塊上
-
會議會展
-
焦點事件
-
焦點事件