Maxim Integrated发布了首款搭载专用片上人工智能加速器的SoC。MAX78000设备使用内部开发的卷积神经网络(CNN)加速器IP,可以实现30个左右的GOP,超低功耗。计算人脸识别、关键词识别等运行应用的功耗水平就足够了,以满足电池供电的可穿戴设备和物联网设备的紧张预算。

马克西姆生产微控制器已经有20多年的历史,但该公司近年来我国一直以来专注于可穿戴电子设备和物联网系统设备。Maxim集成管理公司micro、安全和软件业务部门的执行独立董事Kris Ardis说,Maxim推出的一款基于人工进行智能加速器可能让学生一些相关行业企业观察家感到自己意外,但不应该也是如此。

“我们疯狂地专注于能源,并试图延长设备的电池寿命,”阿迪斯说EE次. “我们也有很多经验,在加密块之类的东西上投入真正复杂的专用硬件,这些东西会让那些复杂的数学方程运行得更快,能耗更低。”

亚的斯亚贝巴描述了五年前一场内部的“快乐时光”自主机器人比赛是如何成为该公司对机器学习兴趣的跳板的。马克西姆在达拉斯办公室的工程师(Adis是一家经验丰富的达拉斯半导体公司,于2001年被马克西姆收购)将建造自己的机器人在木制迷宫中竞争。机器学习已经成为一个充满激情的项目,一个臭鼬芯片,现在是一个生产芯片。今天机器学习团队分达拉斯和伊斯坦布尔。

双核
MAX78000的CNN加速器由两个微控制器内核补充,它们控制系统并获取CNN加速器的进出数据(它们不涉及神经网络计算)。一个是Arm Cortex-M4F,另一个是低功耗RISC-V核的Maxim实现。阿迪斯说,使用RISC-V核的原因不仅仅是财务上的。

MAX78000采用Arm Cortex-M4F内核、功率优化的RISC-V内核和内部开发的CNN加速器(图片:Maxim)

“我们希望客户开始编程的 m4f,因为他们可能是原型与摄像机或音频芯片,”阿迪斯说。”但是当他们真的想要挤出能量的时候,risc-v 是正确的核心。它可以用低功耗的方式处理事情。我们使用的另一个东西是,有时数据需要一些修改... 你可能想要改变恩迪尼斯,使图像黑白,或类似的东西。我们考虑过在这种情况下设计硬件,但希望太大了,所以我们安装了最低功耗的处理器来帮助数据按摩。”

CNN加速器
Maxim的CNN加速器有64个并行处理器,每个处理器都有一个池单元和一个带有专用权重内存的卷积引擎。四个处理器共享一个数据存储器,16个处理器组共享公共控制。支持的操作包括一维和二维卷积,芯片支持1、2、4和8位权值(1位权值,或二值化神经网络在一些对能源极其敏感的应用中越来越受欢迎)。

总体设计方法是尽量减少企业数据进行移动和内存访问,以节约能源。其他节能功能主要包括选择运行发展速度较慢,在较低的电流,如果我们目前的预算紧张。

该芯片有512kb的闪存用于网络输入,而CNN加速器的加权内存为442kb(这与处理引擎交错,因此用户不可用)。

该加速器针对 CNN 进行了优化,CNN 目前用于图像处理应用程序,但还可以通过将输入数据转换为图像来支持非图像应用。Maxim 使用此技术处理心率和血压等数据,也可用于关键字识别等音频应用。

Maxim的软件工具在机器学习和嵌入式开发之间架起了一座桥梁。它与pytorch和tensorflow一起构建与芯片限制兼容的文件。在配置权重并将其加载到CNN之前,它还将神经网络转换为C代码。

MAX78000的刀具流。Maxim的合成工具创建在设备上运行的C代码(图片:Maxim)

微焦耳
根据Ardis的说法,该设备足够灵活,可以运行整个应用程序,也可以根据应用程序充当AI协处理器。它有足够的冲力来处理图像处理,包括目标检测和分类或面部识别,音频应用,如关键字识别和噪声消除,以及时间序列数据处理,如心率或预测性维护应用。

运行Maxim面部识别演示的MAX78000评估套件(图片:Maxim)

在内部测试中,Maxim在基于Cortex-M4F和MAX78000的功率优化Arm微控制器上运行相同的神经网络。与Cortex M4F上的软件解决方案相比,MAX78000将MNIST数据集上的图像分类能量减少了1100倍,速度加快了400倍。在关键词识别方面,MAX78000比Cortex M4F低600倍,快200倍。

Maxim在MAX78000上运行了作为一个通过面部进行识别技术演示,它收集数据图像信息并在中国大约14毫秒内运行分析推理,每次推理能力消耗400?J(大部分企业能量由图像处理捕获消耗)。在侦听20个不同关键字的关键字定位系统演示上,MAX78000可以在2.0毫秒内运行逻辑推理,消耗140?J。

路线图
阿迪斯说,MAX78000有望成为内置Maxim CNN加速器的芯片家族中的第一款。

"我们的下一个芯片将有一个更大的加速器,"他说。我们将尝试在芯片中获取高性能的图像处理,甚至视频处理。我们将继续添加客户想要的功能,可能是一些我们现在不支持的运营商...无论最新和最先进的激活功能是什么。"

通过将CNN加速器与Maxim的可穿戴、工业和金融终端微控制器业务的现有IP相结合,可以构建更多特定于应用的SOC。例如,ARDIS提出了一种带有人脸识别的认证徽章,它也需要NFC功能,或者更小的CNN加速器、蓝牙功能和更小的物联网传感器节点内存。

Max78000带有8x8mm bga 包,现在可以使用了,还有一个评估套件。一个4x4mm 的晶圆级封装版本很快就会上市。


推荐

物联网的按钮革命将会持续下去