《服務:數據驅動的基因組分析與解讀(29頁).pdf》由會員分享,可在線閱讀,更多相關《服務:數據驅動的基因組分析與解讀(29頁).pdf(29頁珍藏版)》請在三個皮匠報告上搜索。
陳鋼CTOWeGene服務:數據驅動的基因組分析與解讀個人基因組為用戶做什么?我們在阿里云生態中的實踐未來的基因組數據平臺目 錄content一、個人基因組為用戶做什么?WeGene:基因組數據Fitbit:運動數據若飯:定量飲食Quantified Self!二、我們在阿里云中的實踐數據存儲RDS:預處理后的基因組數據,表型數據,網站數據OSS:基因組原始數據,大型的計算結果:全基因組數據:FASTQ,BAM,約每用戶200GB,約50用戶芯片數據:CEL,約每用戶200MB,約7000用戶GeneDock:正在處理的全基因組數據和芯片數據本地存儲:所有數據的備份數據傳輸芯片數據:實驗室用OSS客戶端上傳OSS全基因組數據:通過GeneDock的專線上傳GeneDock系統23andme等數據:通過API直接存儲RDS計算本地服務器:主要用于研發,或者是處于alpha測試階段的產品,Celery調度基于Spark的芯片數據質控ECS:實時的小規模計算,例如簡單的遺傳風險評估;常規Web服務GeneDock:全基因組數據分析三、未來基因組數據的二次分析統計分析,機器學習,數據可視化全基因組數據存儲、分析和可視化Genomics API,上層應用,標準化亞洲人群的Genome Graph參考數據集,自學習系統,開放服務