从零开始的异世界python全栈

吾生也有涯,而知也无涯。以有涯随无涯,殆已!已而为知者,殆而已矣!

1994年4月20日,中国第一根64K国际专线接入国际互联网,说“想要世界的宝藏么?如果想要的话,那就去网上找吧,我把所有的一切都放在那里。”于是,水木清华、搜狐、网易,等等、等等,掀起了中国互联网的热潮,大互联网时代就此展开。
我的上一篇文章How to build?写于三月之前,介绍如何零基础开始学习PYTHON,那时候我入职两月,现在还差一月转为正式员工,值此机会,从技术角度剖析一下助理PYTHON工程师的工作,也让这篇文章作为入门者的技术指南,如果你能在每一项技术能力前面打勾,你一定是一名成熟的python web工程师!

工作范畴

  • 具备将产品经理的产品理念快速、有效的转化为产品价值的全部技术能力
  • 对于产品的生命周期有一定认识,并能够因此来控制自己代码的复杂性
  • 有开放式工作环境的素质意识,具备持续“学习”的学习能力

工作1:技术能力


1.1 基本能力

软件工程,是个很有意思的名字。十八世纪,欧洲创造了“工程”一次,本来含义是有关兵器制造、具有军事目的的各项劳作,后扩展到许多领域,如建筑屋宇、制造机器、架桥修路等。软件·工程并无二致,甚至不需要车床吊车等物理硬件,只要会想(敢于类比与联想,读史使人明智)、会写(运用编辑器输入代码,vim是不错的选择)、会问(灵活的使用Google,科学上网)、会生活(与同事搞好关系,办公室至少9小时呢)。

当一个程序员,不仅仅是实现功能代码,还要有一点美感,就像建房子。如果封装不优雅,房子外表很难看;如果接口不优雅,房门都很难进;如果抽象层不优雅,房子根本没法装修。有一点对“美感”的追求,对工程的敬畏之心,就像电锯惊魂中的工程工具(杀人的美学),会让我们的工作事半功倍。


1.2 运维能力

说到运维,就是一种管理的能力,管理计算机系统,管理数据库,管理应用配置,让一切都流程化、标准化并自动化。

  • 计算系统。基于kubernetes写dockerfile,基于成熟的docker系统创建、销毁容器。DOCKER让系统自动化
    任何系统问题都能用“重启”的方式解决,如果不行,那就重启两次。云是大势,所以只要我们能弄出最基本的系统image,比如macOS、阿里云,那么作为程序员的我们就能够一展身手。
    当然,理解操作系统是很有必要的,不要浪费或过度使用机器性能,注重sql语句的优化,进程的使用
  • 数据库。DBA让数据库自动化
  • 应用配置。CMDB让应用自动化
  • 生产环境。我们要学会利用以上,必要时候开发以上,学会起docker,学会和DBA沟通,学会起CMDB,以及学会管理自己的生产环境!
    • 基本cmd命令,比如yum,mkdir,touch,cd,rm,>,grep,ps,top,w,nohup,set,crontab等等;
    • 基本编辑器vim,会配置使用vim(用vundle来管理插件),或者基本ide atom;
    • 基本解释器,python环境管理pipenv,pipenv installpipenv shell
    • 基本代码管理git,pull,push,checkout,rebase
    • 基本数据库管理,mongo,mysql, els的启用,migrate,export,import
    • 基本业务管理,能够预估开发feature的时间,能够管理开发的轻重缓急,能够对业务细节反复推敲
    • 基本个人管理,能够健康,能够“有爱”

就个人或小组开发而言,掌握以上应该能让你非常舒服地做一个开发工程师,所谓工欲善其事,必先利其器。


1.3 PYTHON能力

说到PYTHON,很多人都会写,语言很简单,但工程师之间工资又各有不同,这是为什么呢?为了回答这个问题,不妨上拉勾网搜索了一下“金主”们对工程师的要求。
搜索词为'python',筛选为工资‘25k-50k’以及‘50k以上’,我随机选取了第一页的两个公司

初级玩家

中级玩家

可是看出,对于‘初级玩家’公司主要看你“会不会”,也就是0和1的区别;而对于‘中级玩家’公司主要看中你“会不会分析,能不能优化”,也就是1和10的区别;至于‘高级玩家’,我想只会PYTHON是不行的。那么我的这篇文章,一方面总结一下我半年的学习成果,希望能够把知识从0到1真正落到实处,便于以后从1到10不断进步;另一方面,借着分享交流的互联网,希望各位同行能够指出我工作学习中的短板,帮助我不断改进。

1.3.1 Clean Code

我在上篇文章中推荐在HackerRank做完全部python习题,并且在LeetCode上继续训练。不断刷题能极大的增强我们写单个函数、算法的能力,训练我们的思维能力,但对我们写"工程项目"却鲜有帮助。因为每一题的context都不一样,容易养成重复造轮子、代码不整洁的坏习惯,在我入职的第一个月,因为坏习惯被反复批评,之后我仔细读了《Clean Code》一书,情况有所好转。所以,请务必注意代码的测试、抽象层、命名规范、参数、Exception等。
训练方法:《Clean Code》,要有好代码的smell
训练成果:厉害的程序员写出机器能读懂的代码,好的程序员写出人能读懂的代码。

# 保龄球积分,从第0轮到第10轮,已知每一轮的击倒情况,求总分
def score_frame(frame=10):
    score = 0
    ordinal_ball = 0
    for current_frame in range(frame):
        if is_strike(ordinal_ball):
            score += 10 + next_two_balls_for_strike()
            ordinal_ball += 1
        elif is_spare(ordinal_ball):
            score += 10 + next_ball_for_spare()
            ordinal_ball += 2
        else:
            score += two_balls_in_frame()
            ordinal_ball += 2
    return score
Clean code is simple and direct. Clean code reads like well-written prose. Clean code never obscures the designer’s intent but rather is full of crisp abstractions and straightforward lines of control.
1.3.2 Flask

整洁代码是基础中的基础,接下来掌握的是web框架。要想熟练使用Flask,知识上要求对网络会话层、表示层和应用层有了解,从Client端输入URI并发送请求的一瞬间,网络通过自上而下的OSI结构,传输层(TCP)--- 网络层(IP) --- 数据链路层 --- 物理层, 路由(识别IP),然后,Server端与之建立TCP连接,拿到request对象,梳理业务逻辑,返回response对象,经过同样的一系列过程到Client端接受数据(如果是浏览器则会渲染页面)。这背后所有的事情,就是一个web工程师的工作所在。
训练方法:《Flask Web开发,基于python的web开发实战》,上篇文章已经推荐过了
训练成果:能够独立编写并部署一个满足业务需求的web应用


FLASK框架可以简单至此,但面对更大的需求,还望多思量。
from flask import Flask, request, jsonify
from models import get_question_analysis

app = Flask(__name__)

@app.route('/', methods=['GET'])
def index():
    return 'hello world'

@app.route('/api', methods=['POST'])
def api():
    data = request.get_json()
    question = data['question']
    question_analysis = get_question_analysis(question)
    return jsonify(question_analysis)

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=5000, debug=False)
1.3.3 AioHttp

一步通,则步步通,能够学会一个框架,其他的框架就不难了。Flask的底层是werkzeuk,基于CGI(通用网关接口,Common Gateway Interface)的WSGI在业务受到了异步的挑战,ASGI应运而生。AioHttp的框架,支持python asycio,能极大的提高API的性能(与flask框架下API性能的差异,请移步我的测试文章)。
训练方法:AioHttp GitAsyncio Doc,永远不要忘记源码和doc
训练成果:能够独立编写并部署一个满足业务需求的web应用,理解并掌握python的异步语法

from aiohttp import web
from models import get_question_analysis

async def index(request):
    return web.Response(text='Hello World')

async def api(request):
    data = await request.json()
    question = data['question']
    question_analysis = await get_question_analysis(question)
    return web.json_response(question_analysis)

app = web.Application()
app.add_routes([web.get('/', index),
                web.post('/api', api)])

if __name__ == '__main__':
    web.run_app(app, host='0.0.0.0', port=5000)

Parallelism introduces new challenges in writing correct code, particularly in the presence of shared, mutable state.

1.3.4 MONGO

对于一个助理工程师,不懂框架,你也能形成生产力,可以做一个写数据库增删改查的cool boy。如果一个工程师不会操作数据库,那就连“删库跑路”的“黑暗森林威慑”都建立不起来...所以无论怎样,这个得会。我们有两种操作mongodb的方式,一种是ODM(Object-Document Mapper),如mongoengine;另一种则是超有名的pymongo。
训练方法:MongoEngine文档,PyMongo文档
训练成果:熟练对mongo表进行增删改查,能够对mongo表查询进行一定程度的优化

# 更改user_info这张表中的user_id为‘test’的年龄为22
# mongoengine
from mongoengine import Document, connect
from config import MONGO_URI

connect(host=MONGO_URI, alias='default')

class UserInfo(Document):
    user_id = StringField(required=True)
    age = IntField()

UserInfo.objects.get(user_id='test').update(age=22)


# pymongo
from config import MONGO_URI, DB
from pymongo import MongoClient

client = MongoClient(MONGO_URI)
collection = client[DB]['user_info']

collection.update({'user_id': 'test'}, {'age': 22})

简单分析一下二者的优缺点:

  • mongoengine允许我们定义一套模式,然后把所有的值都匹配到我们定义的schema上,这种schema更加清楚和明确,个人感觉比字典更容易操作,用dot notation更像OOP,而pymong返回的是一个dict,操作时困难的多,很多时候有点丑
  • mongoengine相当于在你和pymongo之间加了map层,所以会对性能有微乎其微的影响,在进行很简单的查询时显得有些没有必要
1.3.5 MYSQL

noSQL和SQL的取舍总是要不断斟酌。操作mysql我们也有两种方式,ORM的sqlalchemy,以及pymysql
训练方法:SqlAlchemy文档,PyMySql文档
训练成果:熟练对mysql表进行增删改查,能够对mysql表查询进行一定程度的优化

# 向user_info这张表中存入一条姓名为‘test’,年龄为22的数据
from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.orm import sessionmaker
from sqlalchemy.ext.declarative import declarative_base
from config import MYSQL_URI

Base = declarative_base()
engine = create_engine(MYSQL_URI, echo=False)
Session = sessionmaker(bind=engine)
session = Session()

class UserInfo(Base):
    __tablename__ = 'user_info'
    user_id = Column(String(80), nullable=False)
    age = Column(Integer(), nullable=True)

session.add(UserInfo('test', 22))
session.commit()

ORM的用途非常非常广,使用起来很优雅,但如同flask框架一般,深入探究它的使用方法和场景需要大量的篇幅,会在以后的文章中继续分享,希望感兴趣的同学自行探索,也可以在评论区有更多交流。

1.3.6 Abstraction

Computer programs consist of instructions to either: Compute some value Or Carry out some action

有了框架和数据库,剩下的就是“操作”了,也就是业务逻辑的编写。如果使用命令式编程,实现业务不是一件困难的事情,那么代码的区别就彰显了工程师们的抽象水平。百多行的函数;没有层次感的代码;命名不规范的代码;概率编程;google编程,等等,不一而足。优秀的工程师,对抽象一定有自己的理解!
训练方法:多想,多看
训练成果:至少能够从“只看到了”函数,到“看到了”项目,从细节到系统

# 表示有理数,并计算其平方
# 表示方法
def rational(n, d):
    return [n, d]

def numerator(x):
    return x[0]

def denominator(x):
    return x[1]

# 操作方法
def square_rational(x):
    return mul_rational(x, x)

def square_rational_violation_once(x):
    return rational(numerator(x) * numerator(x), denominator(x) * denominator(x))

def square_rational_violation_twice(x):
    return [x[0] * x[0], x[1] * x[1]]

# 表示方法 2
def rational(n, d):
    def get(index):
        if index == 0:
            return n
        elif index == 1:
            return d
    return get

def numerator(x):
    return x(0)

def denominator(x):
    return x(1)
Isolate the parts of a program that deal with how data are represendted from the parts that deal with how data are manipulated

用了一个简单的例子来解释表示层和操作层(完全不一样的表示层,但是操作层却完全一样),庞大的系统必然存在着细小的抽象。我们只要能够掌握抽象的方法,再配合leetcode中的算法知识,那么所有的业务逻辑必然迎刃而解。

1.3.7 lib/site-packages

框架 -> 数据库 -> 抽象,我把技术内容分成了这三块,那其实还有一些边角料。python为人称道的就是大量好用的包,所以python工程师经常被说成调包的。在工作中当然也会直接调包,比如smtp和beautifulsoup,这两个太常见了。

import requests
from bs4 import BeautifulSoup

url_head = '//www.greatytc.com/u/1f167239855b'
HTML = requests.get(url_head).text
soup = BeautifulSoup(HTML, 'lxml')
soup.find_all()
1.3.8 widgets

最后的最后,在项目开发的过程中,一定会和公司业务有联系,也一定会发生很多bug,更会有一些奇奇怪怪的需求。为了应对各种各样的事情,python工程师集成了大量好用的工具,比如elastic-search,sentry,kafka, memcache等等,这种Client/Server的构架很好用,也是微服务的雏形。


The client/server model is appropriate for service-oriented situations.
1.3.9 behave && selenium

OK,做完所有工作,临近上线,我的PM一定会在旁边大喊三声:测试!测试!测试!自动化测试是所有稳定系统的标配,unittests和doc tests不必多提,这里介绍一种BDD工具,behave和selenium。

功能: 自动测试
    场景: 页面点击
        假如 我在登陆页面
        当 输入账号、密码并点击登陆
        那么 我在个人主页

from behave import given, when, then
from selenium import webdiver

driver = webdrivear.Chrome(driver_path, chrome_options=chrome_options)

@given('我在登陆页面')
def login_in(context):
    driver.get(login_url)
    assert is_at_page(LOGIN_PAGE)

@when('输入账号、密码并点击登陆')
def send_key(context):
    driver.find_element_by_id(ACCOUNT).send_keys(KEYS)
    dirver.find_element_by_id(CONFIRM).click()

@then('我在个人主页')
    assert is_at_page(HOME_PAGE)

如果你觉得测试没有必要,那你一定没有写过测试!

1.3.10 CI && CD

OK,顺利通过测试,合并到master,此时应该有一套能够自动集成、自动部署的机制,用python起一个监控master分支的服务,一出现合并操作,就使用ssh协议重启原服务。

至此,整套python web开发后端流程的技术要点都清晰了,希望以后能够继续成长、分享,也希望阅读到这里的伙伴多多交流、给予指导。


1.4 前端能力

互联网行业注重T型人才的培养,所谓的T型人才就是横向了解,纵向发展,所以web开发往往看重全栈的能力。

  • HTML。标记性语言,就用jinja模版吧。
{% import "bootstrap/wtf.html" as wtf %}
{{ wtf.quick_form(form) }}
  • CSS。样式语言,就用bootstrap吧。
    {% extends 'bootstrap/base.html %}

  • JS。动态交互,就用ajax吧。

$("#botton").on("click",function(){
    $.ajax({
            url: 'http://www.baidu.com',
            type: 'GET',
            success: function(data){
            };
        })
    })

如果你不满足于如此简单的前端知识,也可以主动将vue框架融合到我们的页面中。前端语言还是有很多奇技淫巧,好看的页面比后端开发更容易获得成就感。


1.5 数据能力
All models are wrong, some are useful.

但凡python工程师,大都会一点数据分析。那我感觉呢,有数据比没数据强,用数据驱动的PM比只有PM驱动靠谱。

  • 数据提取。
    1. 从杂乱的打点数据中,用技术取出结构化的数据
  • 数据分析和挖掘。
    1. 可以用random forest分析feature
    2. 可以用OLS直接预测模型
    3. 还有一些教育上的模型如BKT,IRT
  • 数据驱动。
    1. 可视化模型结果,并写分析报告
  • 数据理解
    • 以上所有技术都可以很快学会,无外乎调包调参,但理解和分析才是重点
    • 在不能独立、全方面分析问题时,建议先养成科学的思维习惯(不要连贝叶斯都没搞明白就妄图进军数据分析...)

工作2:架构能力

我经验较少,这部分的理解还需要不断加强,所言也不过拾人牙慧,暂且一放(代码的经验、不一样的设计模式、业务生命周期的理解能力)


工作3:学习能力

  • Junior Programmer,想从码农成长为工程师,要进步!
  • 工作中有很多可以学习的点,优化一段代码、发布一个发送邮件的package、上coursera课程,要学习!
  • 学习和工作是很辛苦的,写了一天代码头昏脑胀,还要再看两个小时英文文档,要勇敢!

终于在周一发版了,本来告诉自己每周日要发布一篇文章的,最近熬夜看TI,时间和精力完全跟不上。算是全面总结了工作中的一些事情吧,比较基础,深入钻研也有些东西,嗯,共勉,加油!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,504评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,434评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,089评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,378评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,472评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,506评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,519评论 3 413
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,292评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,738评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,022评论 2 329
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,194评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,873评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,536评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,162评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,413评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,075评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,080评论 2 352

推荐阅读更多精彩内容