8 月 8 日消息,一直以来,“深度学习”作为人工智能的重要组成之一,因其具有与人脑相仿的工作原理,被微软、Facebook、亚马逊和谷歌这几家科技巨头关注。而 IBM 使用的深度学习系统消化数据所需要的时间已经从数天缩短至几个小时。
IBM 研究所研究员和系统加速及记忆主管希拉里·亨特(Hillery Hunter)表示,这一效率的提升将有助于放射学家更快、更准确地找到病变部位,并读取大量医学图像。
截至目前,深度学习主要是在单一服务器上运行的,因为在不同计算机之间移动大量数据的过程过于复杂,而且,在大量不同的服务器和处理器之间保持数据同步也是一大难点。
IBM 在今日宣布,已经开发出一款软件够将这些任务分配到 64 台服务器。据悉,这些服务器总搭载有 256 个处理器,这也就意味着在速度上取得明显的提升。值得一提的是,凡是拥有 IBM Power 系统服务器的用户,或者其他想要测试的技术人员,都能享受这项技术。
IBM 采用 64 个自主开发的 Power 8 服务器,并使用 NVLink 与特尔微处理器和英伟达图形处理器相连接,促进两种芯片之间的数据流传输。
亨特近一步表示,如果流量管理不当,一些处理器就会闲置。每个处理器都有自己的数据集,同时还需要来自其他处理器的数据,以获得更大的图像。如果处理器不同步,它们就学不到任何东西。
亨利想法是提高深度学习模式的速度,以此提高它的工作效率。例如,深度学习从一个带有 8 个处理器的服务器扩展到 64 个,每个服务器有 8 个处理器,可以将性能提高 50-60 倍。
IBM 还称,该系统通过由加州大学伯克利分校创建的“咖啡因”深度学习框架,在 256 个处理器之间实现了 95%的扩展效率,超越 Facebook 人工智能研究公司创造的 89%扩展效率。
在图像识别方面,IBM 系统使用“咖啡因”框架,7 个小时内识别了 750 万张图片,准确率达到了 33.8%,击败了微软 29.8%的记录。
IBM 表示,不仅是“咖啡因”框架,谷歌的 TensorFlow 框架也可以在这种新技术上运行。莫海德说,值得注意的是,IBM 在运用自己在高性能计算方面的专业知识的同时,还应用了 Tensorflow 和“咖啡因”这种外部资源,这种做法有助于提升该项目的深度学习能力。