Triton Inference Server 环境配置
创始人
2024-02-24 02:45:16
0

本人环境

Ubuntu18.04,3090显卡,显卡驱动版本510.85.02,cuda版本11.6,docker版本20.10.12(注意:docker一定要通过apt安装,用snap安装会报错)

安装步骤

1. 根据驱动版本和cuda版本下载对应版本的Triton Docker 镜像,版本对应关系参照:Release Notes :: NVIDIA Deep Learning Triton Inference Server Documentation

执行以下命令, 注意将“22.01”换成你自己对应的版本。

$ docker pull nvcr.io/nvidia/tritonserver:22.01-py3

2. 下载模型库例程,注意将“22.01”换成你自己对应的版本。

$ git clone -b r22.01 https://github.com/triton-inference-server/server.git
$ cd server/docs/examples
$ ./fetch_models.sh

3. 从 NGC Triton 容器中启动 triton

注意${PWD}/model_repository:/models是将当前路径下的model_repository文件夹挂载到容器的/model路径下,所以该命令要在路径 server/docs/examples下执行。注意将“22.01”换成你自己对应的版本。

$ cd server/docs/examples
$ sudo docker run --gpus=0 --rm --net=host -v ${PWD}/model_repository:/models nvcr.io/nvidia/tritonserver:22.01-py3 tritonserver --model-repository=/models

执行成功出现如下图所示结果:

4. 新建一个命令控制台,从 NGC Triton SDK 容器启动 image_client 示例 

注意将“22.01”换成你自己对应的版本。

$ sudo docker run -it --rm --net=host nvcr.io/nvidia/tritonserver:22.01-py3-sdk

执行成功后进入容器,然后再运行以下命令:

$ /workspace/install/bin/image_client -m densenet_onnx -c 3 -s INCEPTION /workspace/images/mug.jpg

执行成功后结果如下图所示:

 

相关内容

热门资讯

最高法院:既有虚假宣传,又有商... 最高法院:虚假宣传与商业诋毁构成竞合,如何处理? 经营者作虚假或者误导性宣传,同时损害竞争对手商誉的...
以色列与哈马斯均被指“消极拖延... 【环球时报驻美国特约记者 丁亮 环球时报特约记者 陈葭】美国阿克西奥斯新闻网援引白宫消息人士的话披露...
实现政策范围内分娩个人“无自付... 12月19日,省医保局发布消息,我省通过提高保障水平、优化经办服务,切实减轻参保职工生育医疗负担,2...
响应河南微短剧政策 大象新闻要... 你日常刷到的短剧,很可能不仅是“河南制造”,更是“大象出品”。 在短剧行业深耕两年多,大象新闻已悄然...
【追踪】河南方城县一民办小学1... 界面新闻记者 | 张旭 界面新闻编辑 | 刘海川 历经两次延期开庭,2025年12月19日上午,...
多件法律案将提请全国人大常委会... 12月19日,全国人大常委会法制工作委员会举行发言人记者会介绍,十四届全国人大常委会第十九次会议将于...
汇源再发声明:已提起诉讼,要求... 北京汇源食品饮料有限公司(以下简称“北京汇源”)重整一案,受到社会各界的广泛关注。重整方案实施以来,...
俄外交部发言人:日方不负责任的... 俄罗斯外交部发言人扎哈罗娃18日表示,俄方始终关注日方加速重新军国主义化的危险性,其国防开支急剧增长...
支持家庭适老化改造 政策再加力 央视网消息:近日,多部门联合出台《关于增强消费品供需适配性进一步促进消费的实施方案》,明确提出:“优...