发展互联网基础设施的十巨头(五)数据科学家:AndreasSundquist,DNAnexusCEO和联合创始人
2012-06-21 18:54

你有大量的数据,但这只能证明你有大量的数据,对你没有任何用处。DNAnexus的合作创始人兼CEOAndreasSundquist就发现了这一点,这也是为什么后来他选择建立了DNAnexus—这是一个可以储存,分析,合作一起处理大量数据的平台—使用云技术。虽然云计算经常被人们怀疑它有限的储存和计算能力,但它还是被认为是能把庞大数据整合入主流的主要基础设备。

从MIT毕业的电脑科学家Sundquist来说,开始对基因组学感兴趣是因为他在斯坦福大学完成他博士学位时学习的一个计算生物学的课程。“我最终发现自己喜欢上了这个领域,因为我发现对于一个有计算背景的人来说在这个领域中有多少有趣的机会。”他最近对我说,“越来越多的,科学成为了一个数据为主的领域,而生物学也成为了数据为主的新尝试。”

这就是为什么与传统的智慧反向而行,Sundquist和他的合作创始人ArendSidow还有SerafimBatzoglou当他们在2009年发布DNAnexus时还是选择了云技术作为支持。“在那个时候,使用云技术去支持基因组学…还是一个外来的概念,”Sundquist这样解释道“当我们开始创建这家公司的时候,我想大多数在这个领域中的人还不知道什么是云技术呢。”

但是以指数倍数出现的基因排列组合会带来大量的数据,而这些数据的处理需要云技术带来的规模和合作特性。在未来的两到三年,Sundquist预测,基因的数据大概会达到千兆兆的量级,因为越来越多的人把他们的DNA送来要求得到排列。DNAnexus自身早已处理了超过千兆兆量级字节的庞大基因数据。

不难看出为什么Sundquist认为千兆兆的纪元已经就要到来了。现如今,例如,Ancestry.com和23andMe这样的服务商已经使得人们有机会得到有限的DNA分析,而这最多只需要最多300美元。而Ancestry.com只需要99美元。尽管这关系到个人的隐私,Sundquist说,假如我们可以得到十亿的基因组资料,“我们就可以把每个人都放入人类家族族谱中的一个位置。”

我看到[量化的自我]是一个局势,因为人们想要得到自己的数据,并使用这些数据为他们自身做事情,"Sundquist说,这也正是为什么DNAnexus正试图为生物学家完成他们想要完成的基因组的工作。"我不知道什么时候每个人都能拥有他们自己的基因组数据,但我们当然希望这一天可以真正的到来。"

但与使用基因组数据来治愈癌症的可能性或以其它方式革新的医生诊断和治疗疾病的方法相比。环境与健康相关的数据的机会才刚刚开始。

然而,尽管云技术可能已经解决了如此庞大数据的计算和存储问题,建立一个系统,可以管理,存储和处理千兆兆量级的数据仍是一项复杂的任务。Sundquist认为他的团队能部分解决这些问题,因为它还包括更多计算机科学,而这其实已经进入到了比生物科学更流行并且更有利可图的领域了。Sundquist认为,它可能永远不会像你的手机上玩的FarmVille一样性感,但影响人的健康对我们这样工作的人来说是很重要的。

系列文章
发展互联网基础设施的十巨头(一)超级英雄:Rob Roy, Switch创始人兼CEO
发展互联网基础设施的十巨头(二)监管机构: Steve VanRoekel,美国首席信息官
发展互联网基础设施的十巨头(三)研究员:Jonathan Koomey,斯坦福大学顾问教授
发展互联网基础设施的十巨头(四)开发者:TomPreston-Werner,Github的联合创始人
发展互联网基础设施的十巨头(五)数据科学家:AndreasSundquist,DNAnexusCEO和联合创始人
发展互联网基础设施的十巨头(六)变革者:FrankFrankovsky,FacebookVP负责基础建设
发展互联网基础设施的十巨头(七)通配符:BarryEvans,Calxeda首席执行官
发展互联网基础设施的十巨头(八)执行者:SimonCrosby,Bromium联合创始人,CTO
发展互联网基础设施的十巨头(九)大用户:DebraChrapaty,ZyngaCIO
发展互联网基础设施的十巨头(十)工程师:MartinCasado,Nicira联合创始人,CEO


Via i黑马 By Cong.W.