2012年4月24日,华大基因宣布其成功构建了一个自主开发的云计算服务产品——EasyGenomicsTM。该产品旨在为“组学”研究领域的科研人员提供快捷、准确和易于操作的新一代测序分析服务,从而更好地应对及解决海量生物信息数据的存储、处理、计算和分析等问题。
以数据为驱动力的研究正引发着现代生命科学领域的巨大变革。“大数据”(Big data)成为近期兴起的一个热点话题。它被一些科学家称为“一种新型货币”和“一种新的石油”。美国总统奥巴马于3月29日刚刚宣布了他的“大数据”计划,并决定每年投资2亿美元来资助“大数据”研究。由此可见“大数据”的重要性,与之相关的研究也迫在眉睫。
云计算则成为解决这一难题的强大利器。基于此,华大基因构建了云计算平台并成功推出了其首款云产品——EasyGenomics。该产品为一套操作简单、灵活多样、集存储分析于一体的“一站式”自动化服务系统。据介绍,EasyGenomics主要集基因组学领域内的常用的和华大基因特有的数据及参数为一体,结合云存储和高性能计算技术,能够以更低的成本、更高的效率完成大量的数据处理及分析。
此外,EasyGenomics整合了Aspera公司的fasp™高速文件传输技术,有效解决了“大基因数据”的传输瓶颈。EasyGenomics在各种共享和私有网络环境中的数据传输速度比传统传输方法提高了约10到100倍,极大地降低了数据传输的成本,实现了基因组学测序数据的高效交流。
华大基因EasyGenomics产品主管何思飞表示:“Aspera是生命科学领域海量数据传输和管理的行业标准,其卓越的数据传输速度、网络带宽管理以及可靠性,使得EasyGenomics能够更加高效地进行大量基因数据的处理和分析。”
EasyGenomics精心部署及构建了多项标准化生物信息分析流程及个性化比对、分析、注释服务。目前,EasyGenomics支持的数据分析服务主要包括外显子重测序(Exome Resequencing)分析、基因组重测序(Resequencing)分析、RNAseq分析、Small RNA分析,de novo基因组组装等。该平台可以为各大科研机构和生物科技行业用户提供高效数据传输、信息挖掘、生物信息分析等多种服务及创新解决方案。华大基因将继续完善EasyGenomics系统,并在未来5年中推出系列基于生物云计算平台的云产品,提供更多更丰富的生物信息分析服务,进一步推动基因组学研究向应用的转化。
深圳华大基因研究院副院长方林指出:“目前,华大基因已经拥有212 T Flops的峰值计算能力,总内存容量已达到37.2 TB,总存储能力已达到17 PB,此外,华大基因还在不断提升其高性能计算能力,希望可以为基因组学研究带来更多的创新解决方案。”
方林补充说:“我们的目标是以更低的成本和更高的效率完成大量的生物信息数据处理。通过云计算平台,全球的科研人员可以更加便捷地共享基因数据和软件系统,从而可以更好更快地开展各项研究工作,促进以基因信息为指导的临床诊断和治疗的贯穿应用。”
为适应更庞大数据存储、处理、分析与应用的要求,深圳华大基因研究院已和国家超算天津中心、深圳超算中心、广州超算中心等机构展开战略性合作,旨在进一步提高基因组学相关技术的研发和应用的效率。