python解析protobuf文件

proto_parser

a python compiler for protobuf

github: https://github.com/LiuRoy/proto_parser

安装使用

下载代码进入目录之后执行:

pyton setup.py install

当前支持直接读取proto文件构造客户端,使用方法参考example/client.py

import grpc
from protoparser import make_client

client = make_client('./helloworld.proto')

channel = grpc.insecure_channel('localhost:50051')
stub = client.GreeterStub(channel)
response = stub.SayHello(client.HelloRequest(name='abc'))
print("Greeter client received: " + response.name)

代码讲解

本人接触到的rpc通信协议有thrift和protobuf,两者很类似。虽然原生的thrift和protobuf编译器针对不同语言都只能将接口文件转换为可以使用的中间文件,但不同于其他静态语言,python的动态类型可以很方便的将接口文件直接加载使用,例如thrift的python第三方库thriftpy,使用起来比原生库要方便很多。但个人觉得thriftpy自己造轮子的成分过多,client、servier以及底层的通信实现全部重写了一套,不是很确定能否和原生框架无缝对接。参考thriftpy,自己也实现了一个简单的protobuf编译器,解析生成的结果也尽量用原生对象。

左边是官方提供的protobuf使用流程,具体参考链接http://www.grpc.io/docs/quickstart/python.html,可以看出每次修改完protobuf文件都需要用protobuf compiler重新生成中间文件,使用上不是很友好,期望的目标是右边那样,只需要重启一下进程就可以了。

使用流程

词法分析

详见文件lexer.py,直接使用第三方库ply做的词法解析。词法分析算法上很复杂,但是使用起来却很直观,就是将输入文本按照自定义的规则解析为一个一个的符号。详细内容可以参考lex文档

语法分析

详见文件grammar.py,也是直接使用的第三方库ply做的语法分析,具体的文法参考的thriftpy,thriftpy的语法解析用到了很多全局变量,虽然实现简单而且好理解,最大的缺陷就是不是线程安全,不能支持多线程,所以具体的实现上做了一些调整。调整内容有一下:

  • 语法上为proto3的子集,protoparser解析没有问题的接口文件原生编译器一定能解析,反之不一定
  • enum packed singular import reserved option oneof等关键词不支持,因为用不上,所以也就懒得实现
  • 不支持在message仲嵌套定义message,但是可以使用已经定义的message类型
  • 因为是在最后做的符号检查,支持用到的符号在后面定义

没有编译基础的童鞋阅读ply的yacc文档可能比较迷茫,建议看一下编译原理仲关于语法分析相关的概念和算法,在此推荐胡伦均的编译原理,每一个概念都会给很多例子解释,很适合入门学习。至于轮子哥推荐的parsing techniques以及龙虎鲸书,可以作为进阶学习使用。

ply的语法分析使用了LRLR算法,这是一种至下而上的分析法,也就是从给定的输入串开始,根据文法规则逐步进行归约,直至归约到文法开始的符号,或者说从语法树的末端开始,步步向上归约,直至根节点的分析方法。自定义的函数也是在对应的文法归约的时候执行,理解了这一点对使用ply很重要,定义好文法之后,按照文法一步一步实现归约函数,写语法解析也是一件很有意思的事情。

类型转换

详见objects.py和parser.py,自己实现的语法解析直接解析为原生的对象,而是按照自己的文法逻辑先解析成objects.py仲定义的类型,然后在parser.py仲做了一些转换,由于没有相关的文档,实在是不清楚原生对象的使用方法,所以盲人摸象般的写了最简单类型的转关规则。本来以为python动态类型用起来很美好,但是真的大量使用的时候,不仅不好调试,而且连自己也看不懂写了啥玩意儿。欢迎有兴趣的同伴提修改建议。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 224,764评论 6 522
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 96,235评论 3 402
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 171,965评论 0 366
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 60,984评论 1 300
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 69,984评论 6 399
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 53,471评论 1 314
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 41,844评论 3 428
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 40,818评论 0 279
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 47,359评论 1 324
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 39,385评论 3 346
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 41,515评论 1 354
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 37,114评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,836评论 3 338
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 33,291评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 34,422评论 1 275
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 50,064评论 3 381
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 46,581评论 2 365

推荐阅读更多精彩内容

  • 发现 关注 消息 iOS 第三方库、插件、知名博客总结 作者大灰狼的小绵羊哥哥关注 2017.06.26 09:4...
    肇东周阅读 12,136评论 4 61
  • WebSocket-Swift Starscream的使用 WebSocket 是 HTML5 一种新的协议。它实...
    香橙柚子阅读 23,963评论 8 183
  • 经历漫长的连续八天早起工作后 终于迎来了工作后的第一个新年假期。 也让人可以有时间好好反省这半年多 工作半年 很多...
    L1Shan阅读 224评论 0 0
  • 这是一篇开放式的文章,我想到哪儿写到哪儿,请忽略逻辑。 文中所呈现的案例都是真实事件,分析内容皆为原创,仅代表个人...
    面团妮妮阅读 5,216评论 0 4
  • 1夜色将至 傍晚,夕照渐隐。昏暗的套房里,秋泽从浴室中走出来,他只在腰间围了条浴巾,头上未干的水珠落在地毯上,留下...
    服部美伢阅读 507评论 1 4