AlphaFold2 是 2021 年 AI for Science 領(lǐng)域最耀眼的一顆星?,F(xiàn)在,有人在 PyTorch 中復(fù)現(xiàn)了它,并已在 GitHub 上開源。這一復(fù)現(xiàn)在性能上媲美原版 AlphaFold2,且在算力、存儲方面的要求對于大眾來說更加友好。
剛剛,哥倫比亞大學(xué)系統(tǒng)生物學(xué)助理教授 Mohammed AlQuraishi 在推特上宣布,他們從頭訓(xùn)練了一個名為 OpenFold 的模型,該模型是 AlphaFold2 的可訓(xùn)練 PyTorch 復(fù)現(xiàn)版本。Mohammed AlQuraishi 還表示,這是第一個大眾可用的 AlphaFold2 復(fù)現(xiàn)。
- 短序列推理:加快了在 GPU 上推理少于 1500 個氨基酸殘基的鏈的速度;
- 長序列推理:通過該研究實(shí)現(xiàn)的低記憶注意力(low-memory attention)對極長鏈進(jìn)行推理,OpenFold 可以在單個 A100 上預(yù)測 超過 4000 個殘基的序列結(jié)構(gòu),借助 CPU offload 甚至可以預(yù)測更長的序列;
- 內(nèi)存高效在訓(xùn)練和推理期間,在 FastFold 內(nèi)核基礎(chǔ)上修改的自定義 CUDA 注意力內(nèi)核,使用的 GPU 內(nèi)存分別比等效的 FastFold 和現(xiàn)有的 PyTorch 實(shí)現(xiàn)少 4 倍和 5 倍;
- 高效對齊腳本:該團(tuán)隊(duì)使用原始 AlphaFold HHblits/JackHMMER pipeline 或帶有 MMseqs2 的 ColabFold,已經(jīng)生成了數(shù)百萬個對齊。
scripts/install_third_party_dependencies.sh
使用如下命令激活環(huán)境:
sourcescripts/activate_conda_env.sh
停用命令:
sourcescripts/deactivate_conda_env.sh
在激活環(huán)境下,編譯 OpenFold 的 CUDA 內(nèi)核
python3setup.pyinstall
在 / usr/bin 路徑下安裝 HH-suite:
#scripts/install_hh_suite.sh
使用如下命令可以下載用于訓(xùn)練 OpenFold 和 AlphaFold 的數(shù)據(jù)庫:
bashscripts/download_data.shdata/
如果要使用一組 DeepMind 的預(yù)訓(xùn)練參數(shù)對一個或多個序列進(jìn)行推理,可以運(yùn)行如下代碼:
python3run_pretrained_openfold.py
fasta_dir
data/pdb_mmcif/mmcif_files/
--uniref90_database_pathdata/uniref90/uniref90.fasta
--mgnify_database_pathdata/mgnify/mgy_clusters_2018_12.fa
--pdb70_database_pathdata/pdb70/pdb70
--uniclust30_database_pathdata/uniclust30/uniclust30_2018_08/uniclust30_2018_08
--output_dir./
--bfd_database_pathdata/bfd/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt
--model_device"cuda:0"
--jackhmmer_binary_pathlib/conda/envs/openfold_venv/bin/jackhmmer
--hhblits_binary_pathlib/conda/envs/openfold_venv/bin/hhblits
--hhsearch_binary_pathlib/conda/envs/openfold_venv/bin/hhsearch
--kalign_binary_pathlib/conda/envs/openfold_venv/bin/kalign
--config_preset"model_1_ptm"
--openfold_checkpoint_pathopenfold/resources/openfold_params/finetuning_2_ptm.pt
更多細(xì)節(jié)請參見 GitHub:https://github.com/aqlaboratory/openfold
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
算法
+關(guān)注
關(guān)注
23文章
4646瀏覽量
93747 -
開源
+關(guān)注
關(guān)注
3文章
3472瀏覽量
42944 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5527瀏覽量
121892
原文標(biāo)題:首個大眾可用PyTorch版AlphaFold2復(fù)現(xiàn),哥大開源OpenFold,star量破千
文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
求教:樹莓派和arduino的通信
想讓樹莓派做arduino的上位機(jī)。 用的是樹莓派2B 和arduino UNO。第一步:在樹莓派linux系統(tǒng)下安裝arduino ide(失敗了)在樹莓派
發(fā)表于 09-23 10:01
【NanoPi M2試用體驗(yàn)】NanoPi M2 debian簡單認(rèn)識和疑問
聯(lián)網(wǎng)就成了一項(xiàng)極難的任務(wù),即使現(xiàn)在,我依然沒有一個合理的解決方案。當(dāng)然這也是我發(fā)表這篇帖子的初衷,學(xué)習(xí)之樂趣和水平的提高亦在交流(有點(diǎn)兒裝?。?。 目前我能想到的方法為,在Linux系統(tǒng)下安裝
發(fā)表于 05-03 22:22
【從0教學(xué)嵌入式Linux】第十七集
開發(fā)板的IP地址為:192.168.1.1013.開發(fā)板ping一下PC的Linux系統(tǒng),確保網(wǎng)絡(luò)暢通4.在PC端的Linux系統(tǒng)
發(fā)表于 06-02 17:20
【從0教學(xué)嵌入式Linux】第三十二集
第32課:QT應(yīng)用程序開發(fā) (一)Linux系統(tǒng)下安裝QT Creator集成開發(fā)環(huán)境1、打開Software Center2、搜索QT Creator(二)應(yīng)用開發(fā)1、
發(fā)表于 06-27 10:42
Linux系統(tǒng)下安裝ISO文件
路徑名) /mnt/cd1
3、此時(shí),在/mnt/cd1目錄下,就有相應(yīng)的安裝文件了,接下來安裝就可以了。
注:以上操作在su root 后進(jìn)行,需要root權(quán)限。
發(fā)表于 07-04 08:21
如何在Linux系統(tǒng)下安裝Perl腳本語言
本文向大家簡單介紹一下如何在Linux系統(tǒng)下安裝Perl腳本語言,Linux和Perl都屬于自由
發(fā)表于 07-16 06:38
最新版CCS7.3.0_官方軟件下載
CCSv6[6.2] 開始 Linux 版本只提供64位版本,只能在64位 Linux 系統(tǒng)下安裝及運(yùn)行。 從 CCSv7 開始不支持 W
發(fā)表于 04-19 17:02
?0次下載

安裝Linux系統(tǒng)對硬件有什么要求
很多初學(xué)者在安裝 Linux 系統(tǒng)時(shí),都對自己的電腦配置存在質(zhì)疑,擔(dān)心其是否能夠滿足安裝 Linux 的要求。本節(jié)就從 CPU、內(nèi)存、硬盤、
發(fā)表于 07-15 16:12
?2205次閱讀

Linux下Apache服務(wù)器的安裝和配置
Linux下Apache服務(wù)器的安裝和配置(現(xiàn)代電源技術(shù)的發(fā)展概況)-Linux下Apache服務(wù)器的安
發(fā)表于 08-31 16:22
?8次下載

在Linux下如何安裝和卸載rpm工具
在Windows系統(tǒng)下安裝軟件很簡單,只要雙擊后綴為.exe的文件,然后根據(jù)提示連續(xù)單擊“下一步”按鈕即可。然而在Linux系統(tǒng)
評論