芯动力:自主创新 专注于国产化GP-GPU芯片设计与开发
珠海市芯动力科技有限公司成立于2017年,总部位于广东省珠海市,目前在深圳、西安、美国均设有研发中心;是一家专注于高性能及高通用型芯片设计研发为主的高精技术科技公司。
据了解,公司核心成员具有资深的半导体从业背景,平均行业工作年限超过十五年,均来自于英特尔,高通,德州仪器,联发科等国内外知名企业;其中研发人员占比80.65%,具有本科学历占比63%,硕士及以上学历占比35%。
基于深厚的技术积累和完善的人才储备,芯动力核心成员研究并提出了在并行计算的领域里的可重构并行处理器架构(Reconfigurable Parallel Processor)。该架构不去涉及通用计算领域,而是专注于并行计算领域。可以用基于CUDA的高级语言进行原代码编程,利用自有的指令集作为底层汇编,使得在高性能计算领域内最广泛使用的语言进行支持。
具体来看,RPP创新架构主要具备三大优势:一是更强的处理能力。RPP设计的计算中心用芯片可以达到目前最先进处理器10倍的处理能力。英伟达最新推出的GPGPU,GP100是目前芯片面积最大,计算能力最强的芯片。它已达到了600平方毫米芯片面积,300W功率。RPP的设计目标是10倍于GP100的计算能力,降低服务器的成本且提高服务器性能。
二是更短的处理迟延。RPP的计算方法和GPGPU的计算架构非常不同,这样的架构使得计算的处理时延低,并使得计算平台能够应用在实时的处理计算之中。这在要求低迟延的系统,比如通讯系统中可以得到良好的应用。
三是低功耗。在许多系统之中,低功耗成为了主要的性能指标,比如说手机,平板电脑等,电池的寿命往往非常有限,低功耗而高性能的计算,成为了必需。而在计算中心之中,服务器的功耗是散热的主要部分。1/10的功耗,将意味着1/10的电费。这意味着大大降低运营成本。
总的来说,这款芯片可以帮助客户加快Time to Market的步伐,降低他们的开发周期和产品成本,实现低成本及快速的迁移。
据悉,目前以RPP技术研发的第一代RPP-R8芯片已经成功流片,基于全新自研架构,RPP-R8是一款为并行计算设计的高端通用异构芯片。
RPP-R8芯片专注于并行计算领域。用基于CUDA的高级语言进行应用代码编程,通过自有的指令集和开发工具进行深度优化性能,在高性能计算领域内RPP-R8可以得到最广泛使用的编程语言的支持。与GP-GPU相比,RPP-R8具有更高的计算密度。利用架构的优越性,可以达到更高的计算能力,从而降低服务器的成本,达到更低的功耗。非常适合于高密度数据量的计算应用场景。
RPP-R8芯片的技术指标主要包括:
1.支持FP16/FP32/INT8等精度算力,算力达到960TOPS@INT8,30TFLOPs@FP32,480TFLOPs@FP16;
2.支持PCIe Gen4,PCIe 带宽双向 64GB/s;
3.芯片面积600mm2,300W,RPP核心数20个,计算单元数量640个,核心频率 1.5GHz。
4.支持主流深度学习网络框架和主流深度神经网络模型,支持任何英伟达支持的深度学习网络模型,包含 CNN,Transformer 等;剪枝、量化后模型压缩比与国际先进水平相当,准确率下降 1%以内,支持 64 路数视频解码。编程语言:CUDA 语言兼容,推理平台:Tensor RT 兼容;机器视觉算法:支持Open CV。
值得一提的是,这款产品已经可以对标英伟达主流边缘服务器JetsonXavier芯片产品。
|