本講義出自<b>lucy lu與eric kaczmarek</b>在spark summit east 2017上的演講,主要介紹了正在研發中的基于spark的程式設計平台gatk4(genome analysis toolkit version 4 ),并用案例講解了如何在雲上配置spark叢集加速對于基因序列的測序工作。除此之外還介紹了名為pat的内部資料分析架構,并介紹了如何使用pat快速建立spark與虛拟機合适的配置組合來優化對于雲的硬體資源以及spark計算并行性的使用。
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究
【Spark Summit East 2017】加速雲上Spark基因測序的資料驅動方法以及案例研究