pushd "%~dp0"
dir /b %SystemRoot%\servicing\Packages\*Hyper-V*.mum >hyper-v.txt
for /f %%i in ('findstr /i . hyper-v.txt 2^>nul') do dism /online /norestart /add-package:"%SystemRoot%\servicing\Packages\%%i"
del hyper-v.txt
Dism /online /enable-feature /featurename:Microsoft-Hyper-V-All /LimitAccess /ALL

再将txt更名为Hyper-V.cmd，右键管理员运行这个文件。

再次通过控制面板控->程序->程序和功能，点击“启用和关闭Windows功能”，你会发现此时已经安装成功了。

最后，就是要开启Hyper-v。然后重启电脑即可。

2. Docker的下载与安装

2.1 Docker的下载

我查看了一些博客与视频，在Windows中下载什么样的Docker是众说纷纭，我直接采用最暴力、最直接的方式，去官网下载。

2.2 Docker的安装

双击安装包，进行无脑安装。

双击桌面上的Docker快捷方式，运行docker。再通过win+R开启终端命令，输入

docker version

出现下面的信息，证明安装成功。

接着下来，你自己点击软件的sign in，去注册一个账号即可。

4. TensorFlow-Serving 安装

4.1 简介

TensorFlow Serving是google开源的一个适用于部署机器学习的模型。它提供与TensorFlow模型的开箱即用型集成，可以轻松扩展以应用其他类型的模型和数据，同时保留相同的服务架构和API。主要作用如下：

1、提供gRPC和RESTful API服务；

2、支持热更新；

3、支持多模型部署。

TensorFlow提供了Docker、APT和源码编译三种安装方式，我后期要进行项目的部署，因此采用Docker安装。

Docker Hub上存在多个版本的tensorflow serving docker镜像，除tensorflow版本不同外，存在三种镜像版本号，分别为：

latest：带有编译好的Tensorflow Serving的原始镜像，无法进行任何修改
latest-devel：devel指的是development，可开启镜像容器bash修改配置，然后使用docker commit制作新镜像
latest-devel-gpu：GPU版本的latest-devel

4.2 拉取tensorflow serving镜像文件

在windows下，通过win+R启动终端命令，输入下面代码，来去TensorFlow Serving镜像文件。

docker pull tensorflow/serving

通过下面的命令查看镜像

docker images

可以看到，TensorFlow Serving镜像我们已经拉取下来了。

4.3 从GitHub获取服务仓库

在命令行中输入：

git clone https://github.com/tensorflow/serving

就可以在命令运行时的当前目录下（本文是C:\Users\dell）找到serving这个文件夹。

4.4 启动服务

输入下面命令，启动镜像文件：

docker run -p 8501:8501 --mount type=bind,source=C:/Users/dell/serving/tensorflow_serving/servables/tensorflow/testdata/saved_model_half_plus_two_cpu,target=/models/half_plus_two -e MODEL_NAME=half_plus_two -t tensorflow/serving '&'

说明：

docker run：用镜像创建一个容器

-p 8501:8501 指要映射的端口，将容器8501端口映射到系统8501端口，8501是tensorflow-serving的http服务端口，用于提供RESTful服务。

--mount：表示要进行挂载。

source：模型的绝对路径，要到模型目录本版号的上一级。

target：模型挂载到docker容器中的目录

mount是将宿主机的路径source挂载到容器的target下。source的参数是存放在宿主机上的模型文件，包含一个.pb文件和一个variables文件夹。如果是部署自己的模型就需要在原模型文件夹下新建一个以数字命名的文件夹，如1，并将模.pb文件和variables文件夹放到文件夹1中。容器内部会根据绑定的路径读取模型文件。

-e：用于传递环境变量，这里是MODEL_NAME=half_plus_two，此处是模型的别名。

-t：指定挂载到的目标容器

注意：这里一定要记住MODEL_NAME的名字

运行后，得到：

同时，在Docker desktop上Containers上，也会新增一个服务。

注意：如果你的输入命令启动不了时，尝试去重新开启Hyper-v（见1.2章）。我是这么解决的。

4.5 测试

方法一：

还是通过Win+R，启动终端命令，输入下面命令，进行测试。

curl -XPOST http://localhost:8501/v1/models/half_plus_two:predict -d "{\"instances\":[1.0, 2.0, 5.0]}"

得到如下结果：

其实，官方的模型是一个线性函数y=0.5x+2。

方法二：

利用pycharm进行测试，创建test.py文件


import json
import requests
 
url = 'http://localhost:8501/v1/models/half_plus_two:predict'
data = {"instances": [1.0, 2.0, 5.0]}
r = requests.post(url, json.dumps(data))
print(r)
print(r.text)
print(r.content)

运行后得到的结果如下：

4.6 报错

进行预测时，输入请求命令时，可能会报错。

报错1

"error": "Servable not found for request: Latest(half_plus_two)"

这个问题是使用grpc与tfserve通信时，MODEL_NAME与request.model_spec.name不一致问题。

request.model_spec.name就是http://localhost:8501/v1/models/half_plus_two:predict中的模型名字。

报错2

curl: (7) Failed to connect to localhost port 8501: Connection refused

因为你本地端口号不对，查看一下你运行镜像时，映射的本地端口号是什么多少。

docker run -p 8501:8501 --mount type=bind,source=C:/Users/dell/serving/tensorflow_serving/servables/tensorflow/testdata/saved_model_half_plus_two_cpu,target=/models/half_plus_two -e MODEL_NAME=half_plus_two -t tensorflow/serving '&'

5. 部署自己的模型

5.1 放置pb文件

这里我们可以这么理解，由于我们要在TensorFlow Serving模型下进行部署，因此，我们需要将我们的文件放置到TensorFlow Serving仓库里。

其中，testdata之后的文件都是我自己创建的。

5.2 启动服务

这里和上面有些不同，你需要将路径换成你自己模型的路径才可以。

docker run -p 8501:8501 --mount type=bind,source=C:/Users/dell/serving/tensorflow_serving/servables/tensorflow/testdata/my_model/NR_DenseNet,target=/models/NR_DenseNet -e MODEL_NAME=NR_DenseNet -t tensorflow/serving '&'

根据你的情况，自行修改。

运行后，得到：

运行后，和上面一致，在Docker desktop上Containers上，也会新增一个服务。

5.3 进行测试

首先，要查看一下你的模型是否挂载起来。

curl http://localhost:8501/v1/models/NR_DenseNet

接着，通过 saved_model_cli 来看一下你的模型信息。

saved_model_cli show -dir C:/Users/dell/serving/tensorflow_serving/servables/tensorflow/testdata/my_model/NR_DenseNet/0001 --all

这里，你要记住你的input，output，model name信息。

接下来写一个request请求。


import json
import requests
 
# json传输数据是不认numpy的arrary格式，必须tolist转一下
x = x.tolist()
x1 = x1.tolist()
# 进行预测
url = 'http://localhost:8501/v1/models/NR_DenseNet:predict'
data = {"signature":"serving_default", "inputs": {"in1":x, "in2":x1}}
r = requests.post(url, json.dumps(data))
output1 = json.loads(r.text)["outputs"]["out1"]
output2 = json.loads(r.text)["outputs"]["out2"]
# 最大的元素就是预测类别，即概率最大的类别。
result = []
for i in range(0,len(output2)):
    a = np.argmax(output2[i])
    result.append(a)
output2=result
print(output1)
print(output2)