資料介紹
??基于高性能計(jì)算集群這樣的新一代測(cè)序器和快速演化分析平臺(tái),基因研究領(lǐng)域已經(jīng)被海量數(shù)據(jù)淹沒。眾多基因、癌癥、醫(yī)學(xué)研究機(jī)構(gòu)和制藥公司不斷產(chǎn)生的海量數(shù)據(jù),已不再能被及時(shí)的處理并恰當(dāng)?shù)拇鎯?chǔ),甚至通過常規(guī)通訊線路進(jìn)行傳輸都變得困難。而通常情況下,這些數(shù)據(jù)必須能被快速存儲(chǔ)、分析、共享和歸檔,以適應(yīng)基因研究的需要。于是他們不得不訴諸于磁盤驅(qū)動(dòng)器及運(yùn)輸公司,來轉(zhuǎn)移原始數(shù)據(jù)到國外的計(jì)算中心,這為快速訪問和分析數(shù)據(jù)帶來了巨大障礙。與規(guī)模和速度同等重要的是,所有基因組信息都能基于數(shù)據(jù)模型和類別被鏈接,并以機(jī)器或人類語言進(jìn)行標(biāo)注,這樣智能化的數(shù)據(jù)就能被分解成方程式,在處理基因、臨床和環(huán)境數(shù)據(jù)時(shí)應(yīng)用于普通分析平臺(tái)。
概述
機(jī)遇與挑戰(zhàn)并存的基因組醫(yī)學(xué)革命
自人類啟動(dòng)基因組計(jì)劃以來,各項(xiàng)工程已逐步開始揭示人類基因組與疾病間關(guān)聯(lián)的奧秘。隨著測(cè)序技術(shù)的不斷進(jìn)步,僅用1000美元即可識(shí)別出基因組。
圖1 基因組醫(yī)學(xué)技術(shù)進(jìn)步的十年
人類基因組計(jì)劃是首個(gè)用來確定人類基因組序列的科研項(xiàng)目。該項(xiàng)目歷時(shí)13年,耗費(fèi)近30億美元,于2003年完成,是目前為止最大的生物學(xué)合作項(xiàng)目。從那時(shí)起,一系列的技術(shù)進(jìn)步在DNA測(cè)序和大規(guī)?;蚪M數(shù)據(jù)分析中展露頭腳,對(duì)單個(gè)人類全基因組進(jìn)行測(cè)序的時(shí)間和成本隨之急劇下降,下降速度甚至超過了摩爾定律。
圖2 DNA測(cè)序成本的快速下降
?。ㄗ?001年以來,美國國家人類基因組研究所(NHGRI)對(duì)由美國國立衛(wèi)生研究院(NIH)資助的測(cè)序中心所進(jìn)行的所有DNA測(cè)序工作進(jìn)行了跟蹤,并統(tǒng)計(jì)了相關(guān)費(fèi)用,這些信息已作為DNA測(cè)序的重要改進(jìn)評(píng)估基準(zhǔn)。圖中展現(xiàn)出近年來DNA測(cè)序技術(shù)和數(shù)據(jù)產(chǎn)生流程的顯著改善。來源:NHGRI,http://www.genome.gov/sequencingcosts/)
作為測(cè)序技術(shù)進(jìn)步的一個(gè)例子,Illumina公司在2014年發(fā)布了新一代測(cè)序器HiSeq X10,它以每個(gè)基因組僅1000美元的成本,一年可解密18000個(gè)人類全基因組。這個(gè)所謂的“千元基因組技術(shù)”使人類全基因組測(cè)序比以往任何時(shí)候更廉價(jià)可行,并有望對(duì)醫(yī)療保健和生命科學(xué)行業(yè)產(chǎn)生巨大影響。
新技術(shù)和研究方法的成功同樣帶來了相當(dāng)大的成本,海量數(shù)據(jù)成為亟待解決的難題:
基因組數(shù)據(jù)在過去的8年中,每5個(gè)月翻一番?;蚓幋a項(xiàng)目為80%的基因組賦予了明確的含義,所以獲取全基因組序列變得尤為重要。癌癥基因組研究揭示了一組不同的癌細(xì)胞基因變體,通過全基因組測(cè)序的跟蹤和監(jiān)控,每次分析都會(huì)產(chǎn)生約1TB的數(shù)據(jù)。已有越來越多的國家啟動(dòng)了基因組測(cè)序項(xiàng)目,如美國、英國、中國和卡塔爾。這些項(xiàng)目動(dòng)輒就會(huì)產(chǎn)生數(shù)以百PB級(jí)的測(cè)序數(shù)據(jù)。
對(duì)端到端架構(gòu)的要求
為了滿足基因醫(yī)藥研究對(duì)于速度、規(guī)模和智能化的苛刻要求,需要端到端參考架構(gòu)涵蓋基因計(jì)算的關(guān)鍵功能,如數(shù)據(jù)管理(數(shù)據(jù)集線器),負(fù)載編排(負(fù)載編排器)和企業(yè)接入(應(yīng)用中心)等。為了確定參考架構(gòu)(能力與功能)和映射解決方案(硬件與軟件)的內(nèi)容和優(yōu)先級(jí),需要遵循以下三個(gè)主要原則:
軟件定義:即基于軟件的抽象層進(jìn)行計(jì)算、存儲(chǔ)和云服務(wù),以此定義基礎(chǔ)架構(gòu)和部署模式,以便在未來通過數(shù)據(jù)量和計(jì)算負(fù)載的積累進(jìn)行基因組基礎(chǔ)設(shè)施的增長和擴(kuò)展。數(shù)據(jù)中心:以數(shù)據(jù)管理功能面向基因組研究、成像和臨床數(shù)據(jù)的爆炸式增長。應(yīng)用就緒:整合多種應(yīng)用到一致的環(huán)境,提供數(shù)據(jù)管理、版本控制、負(fù)載管理、工作流編排,以及通過訪問執(zhí)行和監(jiān)控等多種功能。
概述
機(jī)遇與挑戰(zhàn)并存的基因組醫(yī)學(xué)革命
自人類啟動(dòng)基因組計(jì)劃以來,各項(xiàng)工程已逐步開始揭示人類基因組與疾病間關(guān)聯(lián)的奧秘。隨著測(cè)序技術(shù)的不斷進(jìn)步,僅用1000美元即可識(shí)別出基因組。
圖1 基因組醫(yī)學(xué)技術(shù)進(jìn)步的十年
人類基因組計(jì)劃是首個(gè)用來確定人類基因組序列的科研項(xiàng)目。該項(xiàng)目歷時(shí)13年,耗費(fèi)近30億美元,于2003年完成,是目前為止最大的生物學(xué)合作項(xiàng)目。從那時(shí)起,一系列的技術(shù)進(jìn)步在DNA測(cè)序和大規(guī)?;蚪M數(shù)據(jù)分析中展露頭腳,對(duì)單個(gè)人類全基因組進(jìn)行測(cè)序的時(shí)間和成本隨之急劇下降,下降速度甚至超過了摩爾定律。
圖2 DNA測(cè)序成本的快速下降
?。ㄗ?001年以來,美國國家人類基因組研究所(NHGRI)對(duì)由美國國立衛(wèi)生研究院(NIH)資助的測(cè)序中心所進(jìn)行的所有DNA測(cè)序工作進(jìn)行了跟蹤,并統(tǒng)計(jì)了相關(guān)費(fèi)用,這些信息已作為DNA測(cè)序的重要改進(jìn)評(píng)估基準(zhǔn)。圖中展現(xiàn)出近年來DNA測(cè)序技術(shù)和數(shù)據(jù)產(chǎn)生流程的顯著改善。來源:NHGRI,http://www.genome.gov/sequencingcosts/)
作為測(cè)序技術(shù)進(jìn)步的一個(gè)例子,Illumina公司在2014年發(fā)布了新一代測(cè)序器HiSeq X10,它以每個(gè)基因組僅1000美元的成本,一年可解密18000個(gè)人類全基因組。這個(gè)所謂的“千元基因組技術(shù)”使人類全基因組測(cè)序比以往任何時(shí)候更廉價(jià)可行,并有望對(duì)醫(yī)療保健和生命科學(xué)行業(yè)產(chǎn)生巨大影響。
新技術(shù)和研究方法的成功同樣帶來了相當(dāng)大的成本,海量數(shù)據(jù)成為亟待解決的難題:
基因組數(shù)據(jù)在過去的8年中,每5個(gè)月翻一番?;蚓幋a項(xiàng)目為80%的基因組賦予了明確的含義,所以獲取全基因組序列變得尤為重要。癌癥基因組研究揭示了一組不同的癌細(xì)胞基因變體,通過全基因組測(cè)序的跟蹤和監(jiān)控,每次分析都會(huì)產(chǎn)生約1TB的數(shù)據(jù)。已有越來越多的國家啟動(dòng)了基因組測(cè)序項(xiàng)目,如美國、英國、中國和卡塔爾。這些項(xiàng)目動(dòng)輒就會(huì)產(chǎn)生數(shù)以百PB級(jí)的測(cè)序數(shù)據(jù)。
對(duì)端到端架構(gòu)的要求
為了滿足基因醫(yī)藥研究對(duì)于速度、規(guī)模和智能化的苛刻要求,需要端到端參考架構(gòu)涵蓋基因計(jì)算的關(guān)鍵功能,如數(shù)據(jù)管理(數(shù)據(jù)集線器),負(fù)載編排(負(fù)載編排器)和企業(yè)接入(應(yīng)用中心)等。為了確定參考架構(gòu)(能力與功能)和映射解決方案(硬件與軟件)的內(nèi)容和優(yōu)先級(jí),需要遵循以下三個(gè)主要原則:
軟件定義:即基于軟件的抽象層進(jìn)行計(jì)算、存儲(chǔ)和云服務(wù),以此定義基礎(chǔ)架構(gòu)和部署模式,以便在未來通過數(shù)據(jù)量和計(jì)算負(fù)載的積累進(jìn)行基因組基礎(chǔ)設(shè)施的增長和擴(kuò)展。數(shù)據(jù)中心:以數(shù)據(jù)管理功能面向基因組研究、成像和臨床數(shù)據(jù)的爆炸式增長。應(yīng)用就緒:整合多種應(yīng)用到一致的環(huán)境,提供數(shù)據(jù)管理、版本控制、負(fù)載管理、工作流編排,以及通過訪問執(zhí)行和監(jiān)控等多種功能。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 數(shù)據(jù)分析工具下載 5次下載
- 基于大數(shù)據(jù)分析LTE下行速率影響因素研究案例 15次下載
- 工程大數(shù)據(jù)分析——汽車傳感器數(shù)據(jù)應(yīng)用 10次下載
- 基于計(jì)算分析的高可用彈性宏基因組學(xué)計(jì)算平臺(tái) 6次下載
- 大數(shù)據(jù)分析如何解決汽車?yán)^電器異常資料下載
- 基于異質(zhì)網(wǎng)絡(luò)層次的基因節(jié)點(diǎn)表示學(xué)習(xí)方法 5次下載
- 教育大數(shù)據(jù)可視化分析研究的綜合分析 108次下載
- 如何使用大數(shù)據(jù)進(jìn)行用戶用電行為分析平臺(tái)的研究資料說明 3次下載
- 如何使用大數(shù)據(jù)技術(shù)進(jìn)行居民在夜間的情感變化研究資料分析 5次下載
- 大數(shù)據(jù)與推薦系統(tǒng) 18次下載
- 一種輕量級(jí)的大數(shù)據(jù)分析系統(tǒng) 10次下載
- GUIDE-seq和Digenome-seq等全基因組CRISPR 檢測(cè)的關(guān)鍵技術(shù)介紹 24次下載
- 設(shè)計(jì)多網(wǎng)絡(luò)協(xié)議的Python網(wǎng)絡(luò)編程的探索性指南 5次下載
- 神經(jīng)網(wǎng)絡(luò)在基因序列預(yù)測(cè)中的應(yīng)用研究
- Agent在數(shù)據(jù)分析平臺(tái)中的應(yīng)用研究
- GPU助力基因組重測(cè)序分析 1578次閱讀
- 數(shù)據(jù)分析有哪些工具 8197次閱讀
- 大數(shù)據(jù)分析所面臨的機(jī)遇與挑戰(zhàn) 5679次閱讀
- 大數(shù)據(jù)分析如何來增強(qiáng) 1147次閱讀
- 如何同時(shí)使用Nucleus與TensorFlow解決基因組學(xué)領(lǐng)域的機(jī)器學(xué)習(xí)問題 3756次閱讀
- 如何看懂R中的探索性數(shù)據(jù)分析(附R代碼) 3483次閱讀
- 什么是大數(shù)據(jù)分析?大數(shù)據(jù)分析的含義與目前形式 1.6w次閱讀
- 你去將你的基因組測(cè)序了嗎?面臨挑戰(zhàn)的基因組數(shù)據(jù)壓縮技術(shù) 4577次閱讀
- 材料基因組方法如何促進(jìn)鋰電池材料研發(fā) 4120次閱讀
- 介紹幾種用于機(jī)器學(xué)習(xí)探索性數(shù)據(jù)分析的數(shù)據(jù)類型 4874次閱讀
- EDA實(shí)際應(yīng)用的典型小案例 4232次閱讀
- 高通量測(cè)序生物信息學(xué)分析 1.5w次閱讀
- 大數(shù)據(jù)分析到底需要多少種工具_(dá)大數(shù)據(jù)分析總結(jié) 1.1w次閱讀
- 常用的數(shù)據(jù)分析方法有哪些 1.8w次閱讀
- 醫(yī)療大數(shù)據(jù)分析深入淺出 9306次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1491次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費(fèi)
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機(jī)和 SG3525的程控開關(guān)電源設(shè)計(jì)
- 0.23 MB | 4次下載 | 免費(fèi)
- 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論
查看更多