深思创芯的Abacus架构,采用稀疏量化共享技术,结合内存Super Fetch技术,实现更高效的硬件加速。
2016年,一场机器人围剿真人的棋盘,让“人工智能”热度持续至今,不同的是,坐而论道、单谈概念的风口已过,人们的关注点早已转到了AI芯片的实际应用之中。随着包括谷歌、Facebook、微软以及百度、阿里、腾讯在内的互联网巨头相继入局,预计到2020年AI芯片全球市场规模将超过100亿美元,其中中国的市场规模近25亿美元,增长非常迅猛。目前,越来越多初创公司也纷纷加入竞争。但无论是AI还是AI芯片,只有实现从云端走向终端,才能真正赋予“万物智能”。
图片来源:谢孟欢拍摄
36氪四川关注到的深思创芯,聚焦于“智能识别”和“物端计算”芯片技术,着力推动人工智能-强人工智能终端设备的发展。相较于“纸面上”的概念,在经过数次迭代之后,当前,深思创芯基于深度学习的芯片Abucus Vi-SS6500F的量产显得更接地气。
深思创芯的Abacus架构,采用稀疏量化共享技术,结合内存Super Fetch技术,实现更高效的硬件加速。其中稀疏量化共享技术是利用参数的稀疏性进行量化和共享处理,提高计算核心的复用率,减少数据传输量,降低数据带宽需求,实现整体芯片加速,能有效应对当前AI加速器所面临的内存瓶颈。
基于55nm工艺平台,Abucus Vi-SS6500F无论在性价比还是在成本回收周期测算上都具有优势,而跳出实验室Demo局限,在对低功耗并不苛求的众多非便携式应用领域是批量商用的合理选择。
Abucus Vi-SS6500F芯片(来源:深思创芯)
具体来说,深思芯片的物端处理图像特征,将降低云端计算压力,平衡云端设备损耗和后期换代代价,降低系统成本。结合神经网络算法,系统应用场景包括活体判断、智能交通、姿态识别、夜间辅助等。深思创芯CEO俞德军博士透露,Abucus Vi-SS6500F应用于智能安防和驾驶辅助两大场景,基于芯片进行模组化开发和生产,从而市场化。与此同时,深思创芯第二代Abucus Vi-SS6800S架构设计也已经完成,预计今年第四季度进行流片,其性能较一代芯片将至少有8倍以上的提升,应用范围更广。
不可否认的是,基于高投入、长周期的行业特殊性,当前,AI芯片行业高度全球化并且头部效应明显。同赛道中,与深思创芯类似的还有其他数家AI芯片公司,有的主要聚焦云服务器,利用芯片为云端推理提供强大的运算能力支撑;有的聚焦于自动驾驶领域,为未来实现真正自动驾驶这个目标提供足够性能的硬件支持。对于深思创芯来说,具备专业的芯片研发血统并经历多次迭代而日趋成熟和完善的硬件研发优势是其核心壁垒。值得注意的是,深思创芯在存内计算神经网络芯片方向也早已布局,芯片采用22nm FD-SOI工艺,算力性能获得数量级的提升,算力功耗比超过30T/W,单核功耗低于62mW,预计将于今年Q3流片,而深思创芯第三代百万神经元、1亿个突触规模量级的类脑芯片也将于今年Q4流片,与相关医学医疗单位的合作已经展开。
有别于不少顺着风口而起的AI创业公司,深思创芯是经历了从基础研究到商用化转化开发过程的芯片公司,不少工程师都曾供职于各大知名芯片公司,团队基础扎实,研发能力强。当前,深思创芯正计划开启A轮融资。
原创文章,作者:孟欢酱@36氪四川。