文章詳情頁

PyTorch模型轉(zhuǎn)TensorRT是怎么實(shí)現(xiàn)的?

瀏覽：11日期：2022-06-16 14:07:02

轉(zhuǎn)換步驟概覽準(zhǔn)備好模型定義文件（.py文件）準(zhǔn)備好訓(xùn)練完成的權(quán)重文件（.pth或.pth.tar）安裝onnx和onnxruntime 將訓(xùn)練好的模型轉(zhuǎn)換為.onnx格式安裝tensorRT環(huán)境參數(shù)

ubuntu-18.04PyTorch-1.8.1onnx-1.9.0onnxruntime-1.7.2cuda-11.1cudnn-8.2.0TensorRT-7.2.3.4PyTorch轉(zhuǎn)ONNX

Step1：安裝ONNX和ONNXRUNTIME

網(wǎng)上找到的安裝方式是通過pip

pip install onnxpip install onnxruntime

如果使用的是Anaconda環(huán)境，conda安裝也是可以的。

conda install -c conda-forge onnxconda install -c conda-forge onnxruntime

Step2：安裝netron

netron是用于可視化網(wǎng)絡(luò)結(jié)構(gòu)的，便于debug。

pip install netron

Step3 PyTorch轉(zhuǎn)ONNx

安裝完成后，可以根據(jù)下面code進(jìn)行轉(zhuǎn)換。

#--*-- coding:utf-8 --*--import onnx # 注意這里導(dǎo)入onnx時(shí)必須在torch導(dǎo)入之前，否則會(huì)出現(xiàn)segmentation faultimport torchimport torchvision from model import Netmodel= Net(args).cuda()#初始化模型checkpoint = torch.load(checkpoint_path)net.load_state_dict(checkpoint[’state_dict’])#載入訓(xùn)練好的權(quán)重文件print ('Model and weights LOADED successfully')export_onnx_file = ’./net.onnx’x = torch.onnx.export(net,torch.randn(1,1,224,224,device=’cuda’), #根據(jù)輸入要求初始化一個(gè)dummy inputexport_onnx_file,verbose=False, #是否以字符串形式顯示計(jì)算圖input_names = ['inputs']+['params_%d'%i for i in range(120)],#輸入節(jié)點(diǎn)的名稱，這里也可以給一個(gè)list，list中名稱分別對(duì)應(yīng)每一層可學(xué)習(xí)的參數(shù)，便于后續(xù)查詢output_names = ['outputs'],# 輸出節(jié)點(diǎn)的名稱opset_version = 10,#onnx 支持采用的operator set, 應(yīng)該和pytorch版本相關(guān)do_constant_folding = True,dynamic_axes = {'inputs':{0:'batch_size'}, 2:'h', 3:'w'}, 'outputs':{0: 'batch_size'},})net = onnx.load(’./erfnet.onnx’) #加載onnx 計(jì)算圖onnx.checker.check_model(net) # 檢查文件模型是否正確onnx.helper.printable_graph(net.graph) #輸出onnx的計(jì)算圖

dynamic_axes用于指定輸入、輸出中的可變維度。輸入輸出的batch_size在這里都設(shè)為了可變，輸入的第2和第3維也設(shè)置為了可變。

Step 4：驗(yàn)證ONNX模型

下面可視化onnx模型，同時(shí)測試模型是否正確運(yùn)行

import netronimport onnxruntimeimport numpy as npfrom PIL import Imageimport cv2netron.start(’./net.onnx’)test_image = np.asarray(Image.open(test_image_path).convert(’L’),dtype=’float32’) /255.test_image = cv2.resize(np.array(test_image),(224,224),interpolation = cv2.INTER_CUBIC)test_image = test_image[np.newaxis,np.newaxis,:,:]session = onnxruntime.InferenceSession(’./net.onnx’)outputs = session.run(None, {'inputs': test_image})print(len(outputs))print(outputs[0].shape)#根據(jù)需要處理一下outputs[0],并可視化一下結(jié)果，看看結(jié)果是否正常ONNX轉(zhuǎn)TensorRT

Step1：從NVIDIA下載TensorRT下載安裝包 https://developer.nvidia.com/tensorrt

根據(jù)自己的cuda版本選擇，我選擇的是TensorRT 7.2.3，下載到本地。

cd download_pathdpkg -i nv-tensorrt-repo-ubuntu1804-cuda11.1-trt7.2.3.4-ga-20210226_1-1_amd64.debsudo apt-get updatesudo apt-get install tensorrt

查了一下NVIDIA的官方安裝教程https://docs.nvidia.com/deeplearning/tensorrt/quick-start-guide/index.html#install，由于可能需要調(diào)用TensorRT Python API，我們還需要先安裝PyCUDA。這邊先插入一下PyCUDA的安裝。

pip install ’pycuda<2021.1’

遇到任何問題，請(qǐng)參考官方說明 https://wiki.tiker.net/PyCuda/Installation/Linux/#step-1-download-and-unpack-pycuda如果使用的是Python 3.X，再執(zhí)行一下以下安裝。

sudo apt-get install python3-libnvinfer-dev