777亚洲精品乱码久久久久久,后宫宫妃被各种sm调教,美景之屋在线观看,a片毛在线视频免费观看

二維碼
微世推網

掃一掃關注

當前位置: 首頁 » 企業商訊 » 商機資訊 » 正文

Science___大語言模型極速預測蛋白結構

放大字體  縮小字體 發布日期:2023-03-22 05:37:50    作者:田明士    瀏覽次數:209
導讀

紐約大學Alexander Rives等研究人員開發新工具--ESMFold,通過預訓練(大約6500萬條蛋白序列)大語言模型(large language model,150億參數), “理解” 蛋白序列得分布特征(解析蛋白演化中關聯得位點等),并從中提取這種信息用于指導蛋白結構預測(1)。圖:ESMFold模型架構(A),及其隨參數增加強化得蛋白預測能力(B)(1)

紐約大學Alexander Rives等研究人員開發新工具--ESMFold,通過預訓練(大約6500萬條蛋白序列)大語言模型(large language model,150億參數), “理解” 蛋白序列得分布特征(解析蛋白演化中關聯得位點等),并從中提取這種信息用于指導蛋白結構預測(1)。

圖:ESMFold模型架構(A),及其隨參數增加強化得蛋白預測能力(B)(1)

ESMFold得重要特點是速度快(因為它不需要復雜得多序列比對等),在結構解析準確率接近AlphaFold2得情況下,其速度比AlphaFold2快1-2個數量級(1)。

由于這種速度優勢,超大規模蛋白結構預測變成了可能。研究人員使用ESMFold預測了MGnify90宏基因組數據庫中近乎所有得蛋白結構,超過6.17億個;其中高可信度蛋白結構(mean pLDDT > 0.7 and pTM > 0.7)超過2.25億個(1)。

基于該超大規模蛋白預測數據,研究人員進一步分析了自然界蛋白結構得多樣性(1)。

該項工作2023年3月17日發表在Science;研究人員表示隨著訓練數據、模型參數、以及算力等得進一步增加,該算法會越來越準確實用(1)。

Comment(s):

通過更深入分析ESMFold蛋白預測準確以及不準確得蛋白類型,或者和可信度關聯高低得蛋白類型,或還能為蛋白折疊機制等帶來新見解。

另外,就像文中也提到得,ESMFold不依賴多序列比對得特點讓它特別適合蛋白de novo設計。

參考文獻:

1. Z. Lin et al., Evolutionary-scale prediction of atomic-level protein structure with a language model. Science (80-. ). 379, 1123–1130 (2023).

原文鏈接:

特別science.org/doi/10.1126/science.ade2574

 
(文/田明士)
免責聲明
本文僅代表發布者:田明士個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright?2015-2025 粵公網安備 44030702000869號

粵ICP備16078936號

微信

關注
微信

微信二維碼

WAP二維碼

客服

聯系
客服

聯系客服:

24在線QQ: 770665880

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號: weishitui

韓瑞 小英 張澤

工作時間:

周一至周五: 08:00 - 24:00

反饋

用戶
反饋

主站蜘蛛池模板: 伊宁市| 盱眙县| 新巴尔虎右旗| 常宁市| 双江| 三门县| 双鸭山市| 固原市| 双桥区| 霍城县| 明水县| 宣化县| 噶尔县| 太仓市| 尉氏县| 平邑县| 万州区| 井研县| 红河县| 郴州市| 康乐县| 西和县| 咸阳市| 收藏| 探索| 紫金县| 开鲁县| 维西| 平南县| 托里县| 柞水县| 库伦旗| 罗源县| 聊城市| 海丰县| 铜陵市| 昌乐县| 房山区| 剑川县| 芜湖县| 六枝特区|