使用 C++ 部署深度学习模型快速上手方案-六虎

本文将从获取一个训练好的shufflenet_v2模型出发，解说怎么使用 MegEngine Lite 的 C++ 接口将其部署到 CPU（Linux x86 / Android Arm）环境下运转。首要分为以下小节：

导出已经训练好的模型
编写 Inference 代码
编译 MegEngine Lite
编译 Inference 代码
履行 Inference 文件，验证成果

拜见：

MegEngine Lite 还能够通过 Python 接口进行使用, 使用方便但有局限性。

导出已经训练好的模型

请参考获得用于 MegEngine Lite 推理的模型。

编写 Inference 代码

首要创立一个main.cpp, 在这个文件中将直接调用 MegEngine Lite 的接口运转shufflenet_v2.mge模型，输入数据input_tensor是随机生成的，所以不用在乎核算成果。

#include <iostream>
#include "lite/network.h"
using namespace lite;
int main(int argc, char** argv) {
    std::cout << " Usage: ./demo_deploy model_name" << std::endl;
    if (argc != 2) {
        std::cout << " Wrong argument" << std::endl;
        return 0;
    }
    std::string model_path = argv[1];
    //! create and load the network
    std::shared_ptr<lite::Network> network = std::make_shared<Network>();
    //! load the model
    network->load_model(model_path);
    //! get the input tensor of the network with name "data"
    std::shared_ptr<Tensor> input_tensor = network->get_io_tensor("data");
    //! fill the rand data to input tensor
    srand(static_cast<unsigned>(time(NULL)));
    size_t length =
            input_tensor->get_tensor_total_size_in_byte() / sizeof(float);
    float* in_data_ptr = static_cast<float*>(input_tensor->get_memory_ptr());
    for (size_t i = 0; i < length; i++) {
        in_data_ptr[i] =
                static_cast<float>(rand()) / (static_cast<float>(RAND_MAX));
    }
    //! forward
    network->forward();
    network->wait();
    //! get the inference output tensor of index 0
    std::shared_ptr<Tensor> output_tensor = network->get_output_tensor(0);
    float* predict_ptr = static_cast<float*>(output_tensor->get_memory_ptr());
    float sum = 0.0f, max = predict_ptr[0];
    for (size_t i = 0; i < 1000; i++) {
        sum += predict_ptr[i];
        if (predict_ptr[i] > max) {
            max = predict_ptr[i];
        }
    }
    std::cout << "The output SUM is " << sum << ", Max is " << max << std::endl;
}

上面代码首要完结了几个步骤，包括：

创立默认装备的 Network；
载入模型，MegEngine Lite 将读取并解析模型文件，并创立核算图；
通过输入 Tensor 的姓名获取模型的输入 Tensor, 并设置随机数作为输入数据；
履行 Inference 逻辑;
获取模型输出 Tensor, 并处理输出数据。

至此完结了一个shufflenet_v2模型的推理进程的 C++ 代码编写。

但在真正运转这段代码之前，还需要编译该 C++ 源文件，并链接 MegEngine Lite 库文件。 ⬇️ ⬇️ ⬇️

编译 MegEngine Lite

注解

这一步的目的是获得 MegEngine Lite 的静态链接库和动态链接库，供咱们上面代码编译时分进行链接；编译的进程和从源码编译 MegEngine中的介绍是共同的。
下面将演示在 Linux x86 下使用动态链接，Android Arm 上使用静态链接的流程：

首要需要 Clone 整个 MegEngine 工程，并进入到 MegEngine 的根目录：

git clone --depth=1 git@github.com:MegEngine/MegEngine.git
cd MegEngine

环境预备 & 履行编译：

Linux x86

预备编译依靠的子模块：

./third_party/prepare.sh

装置英特尔数学核心库（MKL）:

./third_party/install-mkl.sh

本机编译 MegEngine Lite:

scripts/cmake-build/host_build.sh

Android Arm

预备编译依靠的子模块：

./third_party/prepare.sh

从安卓官网下载 NDK 并解压到某途径，并将改途径设置为NDK_ROOT环境变量：

export NDK_ROOT=/path/to/ndk

交叉编译 MegEngine Lite:

scripts/cmake-build/cross_build_android_arm_inference.sh

编译完结之后 MegEngine Lite 库和头文件途径 /path/to/megenginelite-lib

Linux x86:build_dir/host/MGE_WITH_CUDA_OFF/MGE_INFERENCE_ONLY_ON/Release/install/lite/
Android Arm:build_dir/android/arm64-v8a/Release/install/lite/

编译 Inference 代码

有了上一步得到的 MegEngine Lite 库文件，咱们就能够在编译 Inference 代码的时分进行动态链接或静态链接。下面分别用 Linux x86 和 Android Arm 来展示两种链接方式，演示编译 Inference 代码的步骤：

Linux x86 动态链接编译

依据本身环境挑选编译器（这儿使用的是 clang++, 也能够用 g++），动态链接liblite_shared.so文件：

export LITE_INSTALL_DIR=/path/to/megenginelite-lib #上一步中编译生成的库文件装置途径
export LD_LIBRARY_PATH=$LITE_INSTALL_DIR/lib/x86_64/:$LD_LIBRARY_PATH

clang++ -o demo_deploy \
  -I$LITE_INSTALL_DIR/include main.cpp \
  -llite_shared -L$LITE_INSTALL_DIR/lib/x86_64

编译完结之后，就得到了可履行文件demo_deploy.

Android Arm 静态链接编译

Android Arm 编译为交叉编译（在 Linux 主机上编译 Android Arm 中运转的可履行程序）。

以链接 MegEngine Lite 的静态库作为示例，需要保证 NDK 环境预备完结，

export LITE_INSTALL_DIR=/path/to/megenginelite-lib #上一步中编译生成的库文件装置途径
export PATH=${NDK_ROOT}/toolchains/llvm/prebuilt/linux-x86_64/bin/:$PATH
export CXX=aarch64-linux-android21-clang++

${CXX} -llog -lz -s \
  -I${LITE_INSTALL_PATH}/include main.cpp \
  ${LITE_INSTALL_PATH}/lib/aarch64/liblite_static_all_in_one.a \
  -o demo_deploy

编译完结之后，需要将demo_deploy和模型文件shufflenet_v2.mge拷贝到 Android Arm 机器上。

履行 Inference 文件，验证成果

最终履行编译好的文件，就能够看到推理成果：

./demo_deploy shufflenet_v2.mge

这样就快速完结了 X86 和 Arm 上简略的 demo部署。

在本例中，最终核算成果能够看到：通过softmax之后，输出的成果中sum=1, 符合softmax的输出特色。

附

GitHub：MegEngine 旷视天元（欢迎 star~

Gitee：MegEngine/MegEngine

MegEngine 官网：MegEngine-深度学习，简略开发

欢迎加入 MegEngine 技术交流 QQ 群：1029741705

使用 C++ 部署深度学习模型快速上手方案

导出已经训练好的模型

编写 Inference 代码

编译 MegEngine Lite

编译 Inference 代码

Linux x86 动态链接编译

Android Arm 静态链接编译

履行 Inference 文件，验证成果

附

相关文章

ChatGPT4通道开放接入基于OPEN AI 平台你的任何APP 可一键接入AI 智能

存储拆分后，如何解决唯一主键问题？

开源狂潮让巨头惨败！谷歌内部文件曝光：我们和OpenAI都没有护城河

如何在业务开发中使用适配器模式？

作者信息