Our Blog

[1]张博文, 2016.03.29, IBM新概念芯片:AI训练速度提升30000倍, 查看详情
发布人总结: 这种名为RPU的芯片主要利用了深度学习等算法的两个特点:本地性以及并行性。为此ROU借助了下一代非易失性内存(NVM)技术的概念,把算法用到的权重值存储在本地,从而把训练过程中的数据移动最小化。与传统CPU相比,这种芯片可以将深度神经网络的训练速度提高至原来的30000倍.
[2]齐世雄, 2016.03.29, NVIDIA将于4月的GTC 2016图形技术大会上首次公开展示接近最终版的“Pascal”架构显卡, 查看详情
发布人总结: NVIDIA Pascal GP100 GPU Expected To Feature 12 TFLOPs of Single Precision Compute, 4 TFLOPs of Double   Precision Compute Performance.
[3]王小鹭, 2016.03.29,中科院计算所陈云霁、陈天石课题组提出的寒武纪神经网络处理器, 查看详情
发布人总结:DianNao对神经网络进行分块处理,将不同类型的数据块存放在不同的片上RAM中,并建立理论模型来刻画RAM与RAM、RAM与运算部件、RAM与内存之间搬运次数,进而优化神经网络运算所需的数据搬运次数。DaDianNao在DianNao的基础上进一步扩大了处理器的规模,包含16个处理器核和更大的片上存储,并支持多处理器芯片间直接高速互连,避免了高昂的内存访问开销.
[4]谭伟, 2016.04.27,显卡尺寸减半?AMD黑科技HBM详细解析, 查看详情
发布人总结: HBM,高带宽存储,实现方式是芯片堆栈。也就是从原先的平铺方式更改为罗列在一起,可以让存储芯片与核心距离拉近,开启更高的总线位宽,简化通信过程,降低功耗, 可使显卡的面积缩减一半。
[5]曹蓉, 2016.04.28,AMD 和异构系统架构 (HSA), 查看详情
发布人总结: HSA 可以将 CPU、GPU 以及各种其他处理单元的独特功能无缝地集成到一个单独的芯片上,称之为 APU。通过利用 GPU 内在的巨大潜力,HSA 不单能够提升性能,还可以将性能(以及耗电比)推向一个全新水平,这将从根本上改变我们与设备交互的方式。
[6] 王小鹭, 2016.04.28, IBM 发布首个类脑超级计算平台 IBM TrueNorth。查看详情
发布人总结:IBM 日前发布了一款用于深度学习的类脑超级计算平台 IBM TrueNorth,其处理能力相当于 1600 万个神经元和 40 亿个神经键,消耗的能量只需 2.5 瓦。一台 TrueNorth 处理器由 54 亿个连结晶体管组成,构成了包含100万个数字神经元阵列,这些神经元又可通过 2.56 亿个电突触彼此通信。超过 4 亿比特的本地存储单位(100KB每核)存储突触和神经元参数。在 0.8 伏电压下,一台实时运行的 TrueNorth 处理器功耗仅为 70 毫瓦,每秒可执行 46 千兆突触运算。

Comments are closed.