赞
踩
在通讯录 1.0 版本中,将实现以下功能:
- 对⼀个联系人的信息使用 PB 进行序列化,并将结果打印出来。
- 对序列化后的内容使用 PB 进行反序列,解析出联系人信息并打印出来。
- 联系人包含以下信息:姓名、年龄。
我们为通讯录 1.0 新建文件:contacts.proto
向文件添加注释,可使用:// 或者 /* ... */
Protocol Buffers 语言版本 3,简称 proto3,是 .proto 文件最新的语法版本。proto3 简化了 Protocol Buffers 语言,既易于使用,又可以在更⼴泛的编程语⾔中使⽤。它允许我们使用 Java、C++、Python 等多种语言生成 protocol buffer 代码。
在 .proto 文件中,要使用 syntax = "proto3"; 来指定文件语法为 proto3,并且必须写在除去注释内容的第一行。如果没有指定,编译器会使用 proto2 语法。
在通讯录 1.0 的 contacts.proto 文件中,可以为文件指定 proto3 语法,内容如下:
package 是一个可选的声明符,能表示 .proto 文件的命名空间,在项目中要有唯一性。它的作用是为了避免我们定义的消息出现冲突。
在通讯录 1.0 的 contacts.proto 文件中,可以声明其命名空间,内容如下:
消息(message) :要定义的结构化对象,我们可以给这个结构化对象中定义其对应的属性内容。
在网络传输中,我们需要为传输双方定制协议。定制协议说白了就是定义结构体或者结构化数据,比如,TCP,UDP 报文就是结构化的。再比如将数据持久化存储到数据库时,会将一系列元数据统一用对象组织起来,再进行存储。
所以,ProtoBuf 就是以 message 的方式来支持我们定制协议字段,后期帮助我们形成类和方法来使用。在通讯录 1.0 中,我们就需要为联系人定义一个 message。
.proto 文件中定义一个消息类型的格式为:
- message 消息类型名{
- }
-
- 消息类型命名规范:使⽤驼峰命名法,⾸字⺟⼤写。
为 contacts.proto(通讯录 1.0)新增联系人 message,内容如下:
在 message 中可以定义其属性字段,字段定义格式为:字段类型 字段名 = 字段唯一编号;
- 字段名称命名规范:全小写字母,多个字母之间⽤ _ 连接。
- 字段类型分为:标量数据类型和特殊类型(包括枚举、其他消息类型等)。
- 字段唯⼀编号:用来标识字段,⼀旦开始使用就不能够再改变。
下面这个表格展示了定义于消息体中的标量数据类型,以及编译 .proto 文件之后自动生成的类中与之对应的字段类型。在这里展示了与 C++ 语言对应的类型。
[1] 变长编码是指:经过 protobuf 编码后,原本 4 字节或 8 字节的数可能会被变为其他字节数。
更新 contacts.proto(通讯录 1.0),新增姓名、年龄字段:
在这里还要特别说明一下字段唯一编号的范围:1 ~ 536,870,911(2^29 - 1),其中 19000 ~ 19999 不可用。19000 ~ 19999 不可用是因为:在 Protobuf 协议的实现中,对这些数进行了预留。如果非要在 .proto 文件中使用这些预留标识号,例如将 name 字段的编号设置为 19000,编译时就会报警:
值得一提的是,范围为 1 ~ 15 的字段编号需要一个字节进行编码,16 ~ 2047 内的数字需要两个字节进行编码。编码后的字节不仅只包含了编号,还包含了字段类型。所以,1 ~ 15 要用来标记出现非常频繁的字段,要为将来有可能添加的、频繁出现的字段预留一些出来。
编译命令行格式为:protoc [--proto_path=IMPORT_PATH] --cpp_out=DST_DIR path/to/file.proto
编译 contacts.proto 文件命令如下:
通过上图可以看到:编译 contacts.proto 文件后,会生成所选择语言的代码,我们选择的是 C++,所以编译后生成了两个文件:contacts.pb.h 和 contacts.pb.cc。
对于编译生成的 C++ 代码,包含了以下内容:
contacts.pb.h 部分代码展示:
contacts.pb.cc 中的代码就是对类声明⽅法的⼀些实现(展示部分):
在消息类的父类 MessageLite 中,提供了读写消息实例的方法,包括序列化方法和反序列化方法。
代码书写完成后,编译 main.cc,生成可执行程序 TestProtoBuf:
执行 TestProtoBuf ,可以看见 people 经过序列化和反序列化后的结果:
由于 ProtoBuf 是把联系人对象序列化成了二进制序列,这里用 string 来作为接收二进制序列的容器,所以在终端打印的时候会有换行等一些乱码显示。相对于 xml 和 JSON 来说,因为被编码成二进制,破解成本增大,所以 ProtoBuf 编码是相对安全的。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。