YOLOv4 NCNN 量化模型和实时推理_资讯

YOLOv4 NCNN 量化模型和实时推理

创始人

2024-02-18 21:49:30

0次

又搬来了大佬的啊膜拜大佬

2021年5月7日，腾讯优图实验室正式推出了ncnn新版本，这一版本的贡献毫无疑问，又是对arm系列的端侧推理一大推动，先剖出nihui大佬博客上关于新版ncnn的优化点：继续保持优秀的接口稳定性和兼容性

API接口完全不变
量化校准table完全不变
int8模型量化流程完全不变（重点是这个！！！之前对tensorflow框架一直不感冒，很大一部分源于tensorflow每更新一次版本，就杀死一片上一版本的接口，可能上了2.0以后这种情况好了很多，不过依旧训练是torch用的更多）

ncnn int8量化工具(ncnn2table)新特性

支持 kl aciq easyquant 三种量化策略
支持多输入的模型量化
支持RGB/RGBA/BGR/BGRA/GRAY输入的模型量化
大幅改善多线程效率
离线进行(反量化-激活-量化)->(requantize)融合，实现端到端量化推理

二、新版ncnn的int8量化初探

趁着这股热风，赶紧试下新版ncnn量化版int8（更重要的原因是月底要中期答辩了，毕设还没搞完，赶紧跑跑大佬的库，顺带嫖一波）

2.1 安装编译ncnn

在跑库前先安装编译好需要的环境，安装和编译过程可以看另一条博客：https://zhuanlan.zhihu.com/p/368653551

2.2 yolov4-tiny量化int8

在量化前，先不要着急，我们先看看ncnn的wiki，看下量化前需要做什么工作：

https//github.com/Tencent/ncnn/wiki/quantized-int8-inference

wiki中：为了支持int8模型在移动设备上的部署，我们提供了通用的训练后量化工具，可以将float32模型转换为int8模型。

也就是说，在进行量化前，我们需要yolov4-tiny.bin和yolov4-tiny.param这两个权重文件，因为想快速测试int8版本的性能，这里就不把yolov4-tiny.weights转yolov4-tiny.bin和yolov4-tiny.param的步骤写出来了，大家上model.zoo去嫖下这两个opt文件

地址：https://github.com/nihui/ncnn-assets/tree/master/models

接着，按照步骤使用编译好的ncnn对两个模型进行优化：

./ncnnoptimize yolov4-tiny.param yolov4-tiny.bin yolov4-tiny-opt.param yolov4-tiny.bin 0

如果是直接上model.zoo下的两个opt文件，可以跳过这一步。

下载校准表图像

先下载官方给出的1000张ImageNet图像，很多同学没有梯子，下载慢，可以用下这个链接：

https://download.csdn.net/download/weixin_45829462/18704213

这里给大家设置的是免费下载，如果后续被官方修改了下载积分，那就么得办法啦（好人的微笑.jpg）

ImageNet图像下载

制作校准表文件

linux下，切换到和images同个文件夹的根目录下，直接

find images/ -type f > imagelist.txt

windows下，打开Git Bash（没有的同学自行百度安装，这个工具是真的好用），切换到切换到和images同个文件夹的根目录下，也是直接上面的命令行：大佬这里竟然是windows环境

生成图片名列表文件命令

生成所需的list.txt列表，格式如下：

图片名列表文件预览

接着继续输入命令：

./ncnn2table yolov4-tiny-opt.param yolov4-tiny-opt.bin imagelist.txt yolov4-tiny.table mean=[104,117,123] norm=[0.017,0.017,0.017] shape=[224,224,3] pixel=BGR thread=8 method=kl

其中，上述所包含变量含义如下：

mean平均值和norm范数是你传递给Mat::substract_mean_normalize()的值，shape形状是模型的斑点形状

pixel是模型的像素格式，图像像素将在Extractor::input()之前转换为这种类型 thread线程是可用于并行推理的CPU线程数（这个要根据自己电脑或者板子的性能自己定义）量化方法是训练后量化算法，目前支持kl和aciq

量化模型

./ncnn2int8 yolov4-tiny-opt.param yolov4-tiny-opt.bin yolov4-tiny-int8.param yolov4-tiny-int8.bin yolov4-tiny.table

直接一步走，所有量化的工具在ncnn\build-vs2019\tools\quantize文件夹下

量化工具所在目录

找不到的读者请看下自己编译过程是不是有误，正常编译下是会有这些量化文件的运行成功后会生成两个int8的文件，分别是：

生成的量化模型

对比一下原来的两个opt模型，小了整整一倍!

三、新版ncnn的int8量化再探

量化出了int8模型仅仅是成功了一半，有模型但是内部参数全都错乱的情况也不是没见过。。。

调用int8模型进行推理

打开vs2019，建立新的工程，配置的步骤我在上一篇博客已经详细说过了，再狗头翻出来祭给大家：

https://zhuanlan.zhihu.com/p/368653551

大家直接去ncnn\example文件夹下copy一下yolov4.cpp的代码（一个字！嫖！）

这个没太看懂

int main(int argc, char** argv){    cv::Mat frame;    std::vector

YOLOv4 NCNN 量化模型和实时推理

2.1 安装编译ncnn

2.2 yolov4-tiny量化int8

相关内容

热门资讯