联系我们

  • E-mail:tr@zxopen.com
  • E-mail:canny@zxopen.com
  • 点击交谈! 点击交谈! 点击交谈!

即将火热 生物领域高性能计算加速技术

在计算生物领域,总有人争相开发工具来支持蛋白序列、结构分析和互动数据,但是不幸的是,硬件方面一直被忽视。一些小的集群往往之对大部分基础的处理任务有用。今天使用的一般都是标准的Linux服务器集 群,不过这也导致了一系列不同类型的瓶颈。研究小组发现CPU耗费了大量的资源,比如它们总是占据相当的面积,散热要求、电力以及维护,似乎研究机构很难 去满足这些要求。根据很多评估报告,集群系统比公路上所有的SUV的碳排放的量都要大。显然,如果使得节省成本的需求和节能能源齐头并进的话,需要研究出更好的解决方案。

 

 幸运的是,Bio-IT(生物IT经理)现在有很多旧CPU集群技术可供选择。这些备选方案提供更大的可扩展性、更低的成本和更高的性价比、更好的每瓦特性能。但是没有任何一个单一的解决方案会是最好的答案。

 

 FPGA(现场可编程门阵列)

 

 FPGA在生物领域的应用已经长达十多年,这些都是配置的处理器,可以用来给处理器提供难以置信的速度提升。一些供应商比如CLC bio、Progeniq以及TimeLogic都销售可编程的、各种应用、吞吐量水平以及价格相当的生物信息学FPGA解决方案。

 

 其它厂商也曾有过开发工具的承诺,使得将应用移植到FPGA上更加简单。“Hybrid Computing”就用来形容那些部分在FPGA上进行、部分在CPU上进行的计算,可以通过USB2.0和PCI-E来连接FPGA模块,或者直接通 过处理器插座,最后一种方法能够产生非常高的吞吐量水平,比其它的方法速度提升更高。一些厂商比如Mitrionics、Impulse以及Convey 都生产这平台。The openfpga.org项目以及开放的Mitrion-C Open生物项目都可以提供加速关键的生物应用程序。

 

 个别研究人员可以调整应用程序或者增加模块,这些自动化的方法不会产生很大的加速比,这需要更多研究电子线路的人在生物信息学上花费更多的时间。

 

 使用FPGA可以提升多少性能?Pico计算公司最近将112个FPGA模块连接在了超级计算机上,可能让人印象最深的是这些怪物型的系统可以被安装在一个4U大的服务器机箱里,而且只好费300瓦的功耗。

 

 通用图形处理单元(GPGPU)

 

 图形处理单元是已经进行了高通量图形调整功能强大的处理器,允许CUDA和OpenCL这样的编程语言进行编程。在生物信息学领域,一些对口的工具显示超过三倍于CPU加速。

 

 GPGPU的特点之一是门槛较低,甚至可以在服务器里使用简单的显卡,如果需要更高的性能可以选择Tesla,这是为提高吞吐量计算考虑的设计,有些Tesla服务器都曾有过超过4万亿次计算能力的报告。

 

 不过GPU也有比较明显的缺点,比如ECC记忆的缺乏以及相对贫乏的双精度表现。

 

 Cell处理器

 

 墨丘计算机公司已经建了一系列双Cell处理器、刀片服务器、其它高吞吐量的机器,其适用的Yellow Dog Linux操作系统也被索尼PS3采用。

  曾经的世界第一超级计算机IBM“走鹃”就是用了Cell处理器,可以证明这种结构具有提高吞吐量的而价值。

 

 单指令多数据(SIMD)

 

 现代处理器的单指令多数据能力提供了一个内置的CPU加速器。

 

 云计算

 

 很多人之前认为云计算等同于网格技术,到目前为止,似乎还没有哪个公司比亚马逊拥有更多的客户。许多常见的生物数据库已经上传到了亚马逊,更便宜也更简单地使用它们,到底需要购买多少性能用于实际分析的云?Salzberg研究小组分析了三个小时的数据,包括38倍的人类基因组,以1320个CPU的集群,云服务的租用大概是85美元。

 

 “超级计算机再也不能只注重原始性能,简单的增加更多核的时代已经结束。”IBM深度计算副总裁David Turek表示,客户需要在任何地方使用超级计算机。

 

 当然,适用于生物信息学的超级计算机迟早有一天会变成混合动力的机器,用户随意利用浮点图像处理、FPGA的整合能力等。