你所在的位置: 首页 > 正文

网易易盾AI工程师出席全球计算机多媒体顶会ICME 2019 展示int8量化新算法

2019-08-05 点击:576

上周,世界顶级计算机多媒体会议ICME 2019(国际多媒体和博览会)在上海圆满结束。网易易盾深度学习高级研发工程师姚义武应邀参加此次会议,展示网易一顿在深度卷积神经网络中的int8量化算法。最新研究成果。

img_pic_1563420814_0.png

ICME签到

ICME由IEEE计算机学会,电路与系统学会,通信学会和信号处理学会联合组织。它已于2000年举行,已连续举办19年。它是计算机多媒体领域最重要的国际会议之一。 ICME是最近多媒体领域研究成果的学术研究的旗舰论坛。它也是业界展示最新产品或系统的平台,涵盖文本分析,图形,视频,语音和音频多媒体数据处理,传输,分析和应用等主题。

在此次会议上,网易一顿深度学习高级研发工程师姚义武发表了题为《Efficient Implementation of Convolutional Neural Networks with End to End Integer Only Dataflow》的学术论文,展示了一种新的int8量化算法,有助于构建端到端的纯整数算术路径。

姚义武说Int8量化由于其低精度损失而具有4倍压缩比,并且与现有的整数运算单元兼容。它已在业界广泛使用,包括TensorFlow-Lite和TensorRT中涉及的int8量化算法。

他指出TensorFlow-Lite中的in8量化属于线性量化方法,但是为了执行量化卷积或矩阵乘法运算,有必要提供额外的浮点乘法因子,因此构造的量化网络不是纯整数运算路径和量化算法需要大量训练才能恢复精度损失。

“TensorRT中的线性int8量化方法可以在NVIDIA平台上提供高吞吐量和低延迟推理性能。深度网络的权重以非阈值方式映射到int8间隔,激活输出根据int8量化。实现相对简单。但是,当前层的整数结果需要恢复到浮点实数才能传递到下一层,因此不可能构造一个端点到端点。结束纯整数运算路径。“

ICQ 2019中提出的姚义武新的int8量化算法有助于构建端到端的纯整数运算路径,统一表示层的设计简化了网络结构的拓扑设计,因此非常适合现有的硬件平台,包括CPU。通用计算平台,例如/GPU/FPGA。另外,所提出的int8量化算法在复杂分类网络和目标检测模型上获得接近TensorRT的推理精度,工业应用潜力相对较大。

“应用于Yidun的内容安全图像识别,可以在保证商业模式准确性的前提下,显着降低服务的响应时间。”姚义武进一步阐述了int8量化算法在网易一盾业务中的应用潜力。

参与评审的第三方专家对网易一顿的研究成果进行了评论,认为该方法可以保持较高的准确率,有效地解决了TensorRT的问题。另一位专家进一步指出,int8量化新算法可以简化CNN中的操作,使精度损失看起来微不足道。

据报道,姚义武是网易一墩实验室的成员。在2018年,该实验室还开发了一种自编码神经网络,可有效融合多视图多模态特征信息的准确度,NMI,纯度,ARI。与其他性能指标相比,目前国际先进的多视图多模态信息融合技术具有显着的领先优势。

网易一盾实验室成立于2016年,隶属于网易安全部。它目前拥有数十名AI算法专家,安全研究人员和政策研究人员。该实验室目前专注于探索人工智能技术在安全领域的应用,以及安全相关法规,社会责任和其他研究。

深圳新闻网 版权所有© www.u4321.cn 技术支持:深圳新闻网 | 网站地图