当前位置: 首页 > 新闻 > 国际新闻
国际新闻
Exascale计算旨在破解癌症代码
发布时间: 2017-09-11     来源: 麦肯息讯

资源:

阿贡国家实验室

概要:

研究人员正在通过深入学习解决癌症,着眼于未来和exascale计算。

癌症诊断是压倒性的,治疗往往复杂和不确定。医生还没有明白特定的癌症如何影响个体,而对一个患者可能有希望的药物,可能对另一个患者无效。

但是,通过创建基于遗传学的精确治疗方案,医学研究和高性能计算的融合正在采取更个性化的治疗方法。

“精密医学是根据具体的变化,无论是遗传学,环境还是历史,对每个患者有进行微调治疗的能力。在癌症方面,不仅要从患者那里要求大量的数据,美国能源部(DOE)阿贡国家实验室的计算,环境和生命科学副实验室总监Rick Stevens说,肿瘤也是因为癌症改变了它所围绕的组织的遗传学。

在今天的典型癌症研究中,从单个肿瘤的活组织检查获取了超过八百万次测量。但即使目前的技术使我们能够以更高的准确度来表征癌症的生物学成分,所产生的大量数据已经超出了我们快速准确地分析这些成分的能力。

为了解决这些复杂和相应的精准医药问题,全球研究人员正在寻求超级计算的前景。史蒂文生是多机构努力的主要研究者,推进了一个专注于开发深层神经网络代码CANDLE(CANcer分布式学习环境)的exascale计算框架。

癌症先进计算解决方案(JDACS4C),美国能源部和国家癌症研究所(NCI)合作的联合设计的一部分,CANDLE将解决三个关键的癌症挑战,以加速分子,细胞和人口水平的研究。

挑战将测试CANDLE先进的机器学习方法 - 深度学习 - 结合新颖的数据采集和分析技术,模型制定和模拟,将有助于达到专门为个别患者设计的预后和治疗计划。

史蒂文生说:“深度学习是利用多层神经网络进行机器学习,这个程序在获得更多数据进行预测时,可以更智能或更准确,在研究解决问题方面非常成功。

该模型存储已经观察到的数据,并稍后使用它来快速推断出类似或重复的事件或问题的解决方案。语音识别,图像识别和文本翻译是机器学习的例子,我们许多人每天都在使用,而不意识到这一点。

“每次和SIRI或Alexa交谈,你都会深入学习,”他补充说。

该框架将建立在可用的开放源码深度学习平台的基础之上,可以针对JDACS4C的挑战主题所代表的癌症过程的不同方面进行调整:1)了解关键蛋白质相互作用的分子基础; 2)制定药物反应预测模型;和3)自动化从数百万癌症患者记录中提取和分析信息,以确定最佳的癌症治疗策略。

该过程开始于编辑关于癌症功能,药物反应和个人行为的所有已知数据,并创建其虚拟近似值。虽然分子配置,药物组合和患者数据集的数量令人吃惊,但是预期的exascale框架将逐步“学习”来管理它。

例如,药物反应挑战的目的是预测肿瘤如何基于肿瘤和药物的特征对药物作出反应,其信息通过先前可获得的数据(例如肿瘤样品和先前的)被鉴定药物筛选。

CANDLE网络代码将被训练以吸收数百万以前的药物筛选结果。然后,开源内容管理系统将搜索超过十亿种药物组合,以找到最有可能抑制给定肿瘤的药物,或者十亿假设化合物来鉴定新药开发的候选者。

通过另一种称为数据挖掘的技术,研究治疗策略问题的研究人员可以训练网络筛选并自动解释数百万个临床报告和患者记录。从那些,它可以直接提取与特定患者相关的数据,并为该个体建立治疗和预后轨迹的预测模型。

到目前为止,癌症研究人员一直在小团队中做这一点,维护了癌症发展特征不同因素的大量数据库。但是大部分信息是外设的。最有用的信息被埋在收集的数百万个数据点之内和之中。

史蒂文生解释说:“这是挑战的很大一部分,因为人类现在这样做的属于手工制造。 “我们试图通过机器学习来设计自动搜索的方法,以便您可以从初始模型开始,然后自动找到比初始模型更好的模型,然后可以为每个患者重复此过程。

虽然仅针对这些培训问题的计算解决方案将需要最大的可用高性能计算机,但史蒂文生及其团队认为,所产生的模型可能需要exascale或near-exascale系统来推动每个癌症问题领域。

CANDLE是由美国能源部的Exascale计算项目(ECP)资助的三个独特的阿贡国家实验室计划之一,该计划于2015年推出,旨在促进应用程序,软件和硬件技术的设计和集成到超级系统。

这些系统将能够像现在最强大的超级计算机那样运行诸如CANDLE等应用程序,比那些位于阿尔贡领导力计算设施(ALCF)的DOE科学用户设施办公室的100倍。 Theta,ALCF的新型9.65 petaflops Intel-Cray系统在传统建模和仿真应用中提供高性能,并被以更快速,更有效地处理高级软件和数据分析方法开发了出来。

Paul Messina表示:“研究人员想要完成的事情类型需要比我们更多的数据,容量和计算能力,这就是为什么要建立一个全新的框架,一个更加关注数据的原因。 “CANDLE将在开发推动这一框架的应用程序的开发中发挥至关重要的作用,从而创造出分析数亿个数据项以提供单独的癌症治疗的能力。”

凭借JDACS4C的独特合作,CANDLE团队可以立即访问NCI强大的主题和癌症领域专家。作为与DOE的合作伙伴,特别是CORAL(由Oak Ridge,Argonne和Lawrence Livermore国家实验室组成的合作伙伴),CANDLE征集了一些国家领先的计算科学家来提供计算和数据科学专业知识。

涉及实验室和ECP的供应商是世界上高性能计算架构的领先设计师之一。史蒂文生指出,像英特尔,Nvidia,IBM和Cray这样的公司有兴趣在癌症研究方面进行合作,并且完全归功于模拟,数据和机器学习之间的融合是未来的方向。

“在整个企业中,团队合作水平和共享水平都非常高,癌症是人们可以亲自参与的事情,所以有机会发展能够最终帮助其他人的能力。”弗雷德里克国家癌症研究国家实验室的战略和数据科学计划主任埃里克·斯塔尔伯格说。

“这是一项艰巨的任务,但即使是逐步实现这一目标,也将对许多受癌症影响的人产生重大影响。”。


代理服务