日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

給幾句話就能生成分子,看見分子也能生成描述,神秘的Google X把多模態AI做成了黑科技

來源: 責編: 時間:2023-08-07 16:30:16 310觀看
導讀 設想一下,醫生寫幾句話來描述一種專門用于治療患者的藥物,AI 就能自動生成所需藥物的確切結構。這聽起來像是科幻小說,但隨著自然語言和分子生物學交叉領域的進展,未來很有可能

設想一下,醫生寫幾句話來描述一種專門用于治療患者的藥物,AI 就能自動生成所需藥物的確切結構。這聽起來像是科幻小說,但隨著自然語言和分子生物學交叉領域的進展,未來很有可能成為現實。傳統意義上講,藥物創造通常依靠人工設計和構建分子結構,然后將一種新藥推向市場可能需要花費超過 10 億美元并需要十年以上的時間(Gaudelet et al., 2021)。Bpu28資訊網——每日最新資訊28at.com

近來,人們對使用深度學習工具來改進計算機藥物設計產生了相當大的興趣,該領域通常被稱為化學信息學(Rifaioglu et al., 2018)。然而,其中大多數實驗仍然只關注分子及其低級特性,例如 logP,辛醇 / 水分配系數等。未來我們需要對分子設計進行更高級別的控制,并通過自然語言輕松實現控制。Bpu28資訊網——每日最新資訊28at.com

來自伊利諾伊大學厄巴納-香檳分校和 Google X 的研究者通過提出兩項新任務來實現分子與自然語言轉換的研究目標:1)為分子生成描述;2)在文本指導下從頭生成分子。Bpu28資訊網——每日最新資訊28at.com

Bpu28資訊網——每日最新資訊28at.com

論文地址:http://blender.cs.illinois.edu/paper/molt5.pdfBpu28資訊網——每日最新資訊28at.com

Bpu28資訊網——每日最新資訊28at.com

如下圖所示,文本指導分子生成任務是創建一個與給定自然語言描述相匹配的分子,這將有助于加速多個科學領域的研究。Bpu28資訊網——每日最新資訊28at.com

Bpu28資訊網——每日最新資訊28at.com

在多模態模型領域,自然語言處理和計算機視覺 (V+L) 的交叉點已被廣泛研究。通過自然語言實現對圖像的語義級控制已取得一些進展,人們對多模態數據和模型越來越感興趣。Bpu28資訊網——每日最新資訊28at.com

該研究提出的分子 - 語言任務與 V+L 任務有一些相似之處,但也有幾個特殊的難點:1)為分子創建注釋需要大量的專業知識,2)因此,很難獲得大量的分子 - 描述對,3) 同一個分子可以具有許多功能,需要多種不同的描述方式,這導致 4) 現有評估指標(例如 BLEU)無法充分評估這些任務。Bpu28資訊網——每日最新資訊28at.com

為了解決數據稀缺的問題,該研究提出了一種新的自監督學習框架 MolT5(Molecular T5),其靈感來源于預訓練多語言模型的最新進展(Devlin et al., 2019; Liu et al., 2020)。MolT5 首先使用簡單的去噪目標在大量未標記的自然語言文本和分子字符串上預訓練模型。之后,預訓練模型在有限的黃金標準注釋上進行微調。Bpu28資訊網——每日最新資訊28at.com

此外,為了充分評估分子描述或生成模型,該研究提出了一個名為 Text2Mol 的新指標(Edwards et al., 2021)。Text2Mol 重新調整了檢索模型的用途,以分別評估實際分子 / 描述和生成的描述 / 分子之間的相似性。Bpu28資訊網——每日最新資訊28at.com

多模態文本 - 分子表示模型 MolT5 Bpu28資訊網——每日最新資訊28at.com

研究人員可以從互聯網上抓取大量的自然語言文本。例如,Raffel et al. (2019) 構建了一個 Common Crawl-based 數據集,該數據集包含超過 700GB、比較干凈的自然英語文本。另一方面,我們也可以從 ZINC-15 等公共數據庫中獲取超過 10 億個分子的數據集。受近期大規模預訓練進展的啟發,該研究提出了一種新的自監督學習框架 MolT5(Molecular T5),其可以利用大量未標記的自然語言文本和分子字符串。Bpu28資訊網——每日最新資訊28at.com

圖 3 為 MolT5 架構圖。該研究首先使用 T5.1.1(T5 的改進版本)的公共檢查點(public checkpoints)之一初始化編碼器 - 解碼器 Transformer 模型。之后,他們使用「replace corrupted spans」目標對模型進行預訓練。具體而言,在每個預訓練 step 中,該研究都會采樣一個包含自然語言序列和 SMILES 序列的 minibatch。對于每個序列來說,研究者將隨機選擇序列中的一些單詞進行修改。每個連續 span 中的 corrupted token 都被一個 sentinel token 替換(如圖 3 中的 [X] 和 [Y] 所示)。接下來的任務是預測 dropped-out span。Bpu28資訊網——每日最新資訊28at.com

Bpu28資訊網——每日最新資訊28at.com

分子(例如,用 SMILES 字符串表示)可以被認為是一種具有非常獨特語法的語言。直觀地說,該研究的預訓練階段本質上是在來自兩種不同語言的兩個單語語料庫上訓練一個語言模型,并且兩個語料庫之間沒有明確的對齊方式。這種方法類似于 mBERT 和 mBART 等多語言語言模型的預訓練方式。由于 mBERT 等模型表現出出色的跨語言能力,該研究還期望使用 MolT5 預訓練的模型對文本 - 分子翻譯任務有用。Bpu28資訊網——每日最新資訊28at.com

預訓練之后,可以對預訓練模型進行微調,以用于分子描述(molecule captioning)或生成(如圖 3 的下半部分所示)。在分子生成中,輸入是一個描述,輸出是目標分子的 SMILES 表示。另一方面,在分子描述中,輸入是某個分子的 SMILES 字符串,輸出是描述輸入分子的文字。Bpu28資訊網——每日最新資訊28at.com

實驗結果Bpu28資訊網——每日最新資訊28at.com

下表 1 為分子描述測試結果,研究發現,大的預訓練模型在生成逼真語言來描述分子方面,T5 或 MolT5 比 Transformer 或 RNN 要好得多。Bpu28資訊網——每日最新資訊28at.com

Bpu28資訊網——每日最新資訊28at.com

下圖 5 顯示了幾個不同模型輸出示例。Bpu28資訊網——每日最新資訊28at.com

Bpu28資訊網——每日最新資訊28at.com

不同模型的生成結果示例(節選)。Bpu28資訊網——每日最新資訊28at.com

通常 RNN 模型在分子生成方面優于 Transformer 模型,而在分子描述任務中,大型預訓練模型比 RNN 和 Transformer 模型表現得更好。眾所周知,擴展模型大小和預訓練數據會導致性能顯著提高,但該研究的結果仍然令人驚訝。Bpu28資訊網——每日最新資訊28at.com

例如,一個默認的 T5 模型,它只在文本數據上進行了預訓練,能夠生成比 RNN 更接近真值的分子,而且通常是有效的。并且隨著語言模型規模的擴展,這種趨勢持續存在,因為具有 770M 參數的 T5-large 優于具有 60M 參數的專門預訓練的 MolT5-small。盡管如此,MolT5 中的預訓練還是略微改善了一些分子生成結果,尤其是在有效性方面的大幅提升。Bpu28資訊網——每日最新資訊28at.com

下圖 4 顯示了模型的結果,并且按輸入描述對其進行編號。實驗發現,與 T5 相比,MolT5 能夠更好地理解操作分子的指令。Bpu28資訊網——每日最新資訊28at.com

Bpu28資訊網——每日最新資訊28at.com

不同模型生成的分子示例展示。Bpu28資訊網——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-119-2319-0.html給幾句話就能生成分子,看見分子也能生成描述,神秘的Google X把多模態AI做成了黑科技

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 2022 年云計算網絡安全威脅和趨勢

下一篇: 云安全日報220512:Ubuntu Linux內核發現執行任意代碼漏洞,需要盡快升級

標簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
国产精品视频xxx| 久久综合狠狠综合久久综青草 | 激情综合中文娱乐网| 国产三级欧美三级日产三级99| 国产在线观看一区| 亚洲日本中文字幕区| 亚洲无玛一区| 久久久亚洲高清| 欧美日韩爆操| 国产欧美综合在线| 亚洲国产欧美一区| 亚洲一级网站| 久久久亚洲精品一区二区三区| 欧美精品性视频| 国产女优一区| 亚洲精品看片| 欧美一区二区精美| 欧美国产精品v| 国产精品卡一卡二卡三| 在线观看日韩欧美| 亚洲一区二区影院| 免费欧美在线| 国产日韩欧美一区在线| 亚洲人永久免费| 欧美怡红院视频| 欧美日韩国产精品成人| 国产一区二区三区久久久久久久久| 亚洲人在线视频| 久久都是精品| 国产精品v片在线观看不卡| 曰韩精品一区二区| 亚洲欧美成人一区二区在线电影| 麻豆精品在线观看| 国产精品自拍视频| 夜夜狂射影院欧美极品| 久久躁日日躁aaaaxxxx| 国产精品一区二区视频| 亚洲毛片在线看| 久久一区中文字幕| 国产日产亚洲精品系列| 在线视频亚洲欧美| 欧美精品v日韩精品v韩国精品v | 免费精品99久久国产综合精品| 国产精品人人爽人人做我的可爱| 亚洲三级色网| 久久永久免费| 国产一区二区无遮挡| 亚洲欧美成aⅴ人在线观看| 欧美日韩国产综合一区二区| 亚洲第一页自拍| 久久av一区二区三区亚洲| 国产精品高潮呻吟久久av黑人| 亚洲精品黄色| 欧美1区2区3区| 在线不卡中文字幕| 久久久国产成人精品| 国产色爱av资源综合区| 亚洲免费中文| 国产精品久久久久毛片软件| 一区二区日韩免费看| 欧美精品在线网站| 亚洲清纯自拍| 欧美高清在线一区二区| 亚洲国产欧美一区二区三区同亚洲 | 午夜视频久久久| 欧美亚洲成人网| 99视频精品免费观看| 欧美精品一区在线发布| 亚洲欧洲一区二区在线播放| 嫩草国产精品入口| 亚洲国产导航| 男同欧美伦乱| 亚洲激情成人在线| 欧美mv日韩mv国产网站app| 亚洲成在线观看| 玖玖玖免费嫩草在线影院一区| 国内精品国语自产拍在线观看| 欧美在线三级| 国内精品免费午夜毛片| 久久久最新网址| 亚洲高清不卡在线| 欧美高清成人| 99精品视频免费观看视频| 欧美日韩亚洲另类| 亚洲午夜免费福利视频| 国产精品美腿一区在线看| 午夜精品亚洲| 国模精品一区二区三区色天香| 久久欧美中文字幕| 136国产福利精品导航| 欧美成人亚洲成人| 日韩视频欧美视频| 欧美性天天影院| 亚洲欧美日韩综合国产aⅴ| 国产精品一卡| 久久精品日产第一区二区| 影音先锋久久| 欧美波霸影院| av成人免费在线观看| 国产精品久久久99| 欧美亚洲综合另类| 韩国av一区二区| 欧美91视频| 一区二区三区www| 国产乱肥老妇国产一区二| 久久国产精品第一页| 亚洲第一福利视频| 欧美日韩国产精品一区| 午夜精品美女久久久久av福利| 国产一区激情| 欧美二区在线观看| 亚洲午夜激情在线| 国产一区二区三区观看| 欧美高清视频在线观看| 亚洲一区二区精品视频| 国产视频综合在线| 欧美freesex交免费视频| 一区二区三区免费在线观看| 国产日韩在线视频| 欧美成人一品| 亚洲欧美日韩中文视频| 伊人久久大香线蕉综合热线| 欧美日韩a区| 性色av一区二区怡红| 亚洲国产成人av| 国产精品久久久久秋霞鲁丝| 久久在线免费观看视频| 亚洲视频一区在线| 伊人狠狠色j香婷婷综合| 欧美日韩成人一区二区| 欧美一区1区三区3区公司| 91久久国产综合久久| 国产乱肥老妇国产一区二| 欧美成人一区二免费视频软件| 亚洲伊人网站| 亚洲高清毛片| 国产精自产拍久久久久久| 欧美国产亚洲视频| 久久不射2019中文字幕| 一本色道久久综合| 在线观看av一区| 国产精品久久中文| 欧美不卡三区| 久久riav二区三区| 一区二区欧美激情| 在线成人av.com| 国产精品久久久久毛片软件| 欧美高清视频| 久久精品99国产精品酒店日本| av成人国产| 亚洲国产欧美一区| 国产夜色精品一区二区av| 欧美色精品在线视频| 免费成人av| 国产一区二区无遮挡| 国产精品chinese| 女人香蕉久久**毛片精品| 久久精品国产99精品国产亚洲性色 | 欧美三区在线| 免费在线观看一区二区| 欧美在线国产精品| 亚洲深爱激情| 亚洲精品极品| 在线播放豆国产99亚洲| 国产婷婷成人久久av免费高清 | 欧美日韩国产精品专区| 麻豆国产va免费精品高清在线| 亚洲欧美日韩系列| 一区二区欧美视频| 亚洲日韩中文字幕在线播放| 精品9999| 国内精品美女在线观看| 国产欧美日韩精品a在线观看| 欧美视频在线观看一区二区| 欧美激情在线| 欧美承认网站| 久热这里只精品99re8久| 久久精品国产免费观看| 午夜精品国产更新| 亚洲综合二区| 亚洲男女自偷自拍| 亚洲私人黄色宅男| 一本色道久久| 夜色激情一区二区| 日韩视频免费| 日韩午夜在线电影| 亚洲精品日韩在线观看| 亚洲国产婷婷香蕉久久久久久| 尤物视频一区二区| 悠悠资源网亚洲青| 一区二区视频欧美| 精东粉嫩av免费一区二区三区| 国内精品久久久久久久影视蜜臀 | 久久亚洲私人国产精品va媚药| 久久精品一级爱片| 久久久国产一区二区| 久久久久久久性| 久久五月天婷婷| 老司机久久99久久精品播放免费 | 免费日韩一区二区| 欧美成人dvd在线视频| 欧美国产精品人人做人人爱| 欧美激情精品久久久| 欧美精选午夜久久久乱码6080|