我的位置:首页 > 资讯>软件

云天励飞发布边缘AI芯片DeepEye1000:算力2.0Tops

时间:2019-11-14 19:30:56 来源:互联网 作者: 神秘的大神 字体:

  2019 年 11 月 13 日,第 21 届中国国际高新技术成果交易会(简称“高交会”)在深圳举行,云天励飞在高交会期间举办了“不忘初芯——云天励飞全球首款 5AIoT 芯片发布会”,正式发布了自主可控的针对边缘设备的神经网络处理器芯片——云天初芯 DeepEye1000、以及芯片即服务——人工智能“星云”生态战略。

  边缘端人工智能芯片 DeepEye1000

  据介绍,云天励飞副总裁、芯片产品线负责人李爱军介绍,云天初芯 TMDeepEye1000 是一颗自主可控的“中国芯”,内置自主产权的神经网络处理器,支持灵活可编程计算流,搭载云天励飞自主研发的深度定制指令集,可以实现高性能、低功耗的 CNN 网络模型推理计算加速,满足视觉 AI 算法实时性处理的性能要求。

  该芯片专注边缘和端侧视觉应用,基于多核异构并行计算架构设计,内置四核神经网络处理器,可支持 INT16 / INT12 / INT8 混合精度量化数据,采用存算融合体系架构和可重构计算阵列,可以灵活、高效的执行各种深度学习算法模型的推理计算,峰值算力达 2.0Tops。其中,神经网络处理器支持深度定制指令集,定制指令多达 160 条以上,支持主流神经网络模型。神经网络处理器采用可重构计算阵列,支持灵活可编程计算流,计算效率超过 99%,同时采用存算融合体系架构,使得 DDR 存储访问带宽下降 77%,功耗下降 60%。

  在 CPU 方面,云天初芯 DeepEye1000 采用阿里平头哥玄铁 810 嵌入式处理器,工作频率达到 1.2GHz,处理器采用 RISC 指令架构,双发射 10 级流水线,性能高于 2.5 DMIPS/MHz。

  此外该芯片还集成了双核视觉 DSP 处理器,内置硬件加速运算子 ACC,支持超过 20 个高效算子,每秒可跟踪 1200 张人脸。DeepEye1000 还拥有强大的视频处理能力,支持H.264 和H.265 解码,可支持 4K@30fps 视频、4 路高清视频并行的实时分析。

  在芯片制程方面,云天初芯 DeepEye1000 采用了成熟的 22nm FD-SOI 工艺,该工艺主要针对快速发展的主流移动、IoT 物联网、RF 射频和网络市场,可提供比肩 FinFET 技术的性能,能效则媲美 28nm 工艺,而且成本更低。

  为了提高芯片的易用性,云天励飞还打造了 DETVM 开源开放工具链,该工具链兼容 TVM 开源生态,支持丰富的算法框架,一键实现量化编译和部署,让算法移植更便捷。

  此外,云天初芯还在高交会现场展示了基于 DeepEye1000 的加速卡。

  李爱军表示,随着 5G 时代的到来,万物互联成为可能,海量数据的产生在给网络带来巨大压力的同时,也进一步把算力的需求推到了边缘端。云天初芯 TMDeepEye1000 正是为了应对这一需求而生的,它具备高灵活、高能效、低能耗等优势,未来将能够在智能安防、新商业、智慧交通、智能制造、智慧仓储、智能家居、机器人、智能超算等多个行业及领域应用。

  云天励飞“星云”开放 AI 生态

  在发布会上,云天励飞还发布了芯片即服务-人工智能“星云”生态战略,携手海康威视、优必选科技、深圳超算中心、阿里巴巴平头哥、TCL、京东、深圳巴士集团、迈德威视等 8 家首批合作伙伴,共同开启“星云”生态,加速 AI 向产业渗透。

  云天励飞首席科学家王孝宇博士在会上提出了“双 11 开放 AI 生态计划”,他表示,云天励飞过去 5 年投入 1 亿美金的研发成果,将共享给合作伙伴,致力于帮助合作伙伴解决 AI 开发周期长、投入大的问题, “我们将本着降低 AI 门槛的目标,为合作伙伴提供‘双 11’的 AI 开发能力,也就是说,我们将帮助合作伙伴在 1 周完成硬件、1 周适配算法、1 周对接服务,最终在 1 个月内完成 AI 能力的从无到有。”

  关于如何落地“双 11 开放 AI 生态计划”,王孝宇博士表示,云天励飞将共享自己的技术能力,在硬件开发方面,云天励飞将针对神经网络高度优化进行算力开放;在 AI 算法方面,云天励飞将通过 Arctern 算法平台实现算法共享;在产业化服务方面,云天励飞将通过商簿云进行服务赋能,其中 SIK 将助力合作伙伴在 1 周内获得 AI 业务能力;在算法定制方面,云天励飞将携手深圳超算,通过今年 4 月发布的 AIOS 进行一站式算法生成,将 AI 算法定制成本降至 1 万元。