python3并发编程基础

技术交流QQ群:1027579432,欢迎你的加入!

1.基本概念

  • 1.串行与并行
    • a.串行:比喻是一个人在同一时间段只能干一件事,如只能吃完饭后再玩手机
    • b.并行:比喻是一个人在同一时间段可以干很多事,如一边吃饭一边玩手机
  • 2.在python中,多线程与协程虽然严格上来说是串行,但是却比一般串行程序执行效率高很多。一般的串行程序,在程序阻塞时,只能干等着,不能做其他事情。比如,开始播放电视剧前,必须看完广告才能观看电视剧,这个等待时间我们却不能做其他的事。这种做法效率很低,不合理。虽然多线程和协程已经很智能,但不够高效,最高效的应该是一心多用,同时做多件事情,这是多进程做的事情。
  • 3.多线程:交替执行,另一种意义上的串行


    多线程.png
  • 4.多线程:并行执行,真正意义上的并发


    多进程.png

2.单线程VS多线程VS多进程

开始对比之前,首先定义四种类型的场景: CPU计算密集型、磁盘IO密集型、 网络IO密集型、模拟IO密集型

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Date    : 2019-01-21 09:45:56
# @Author  : cdl (1217096231@qq.com)
# @Link    : https://github.com/cdlwhm1217096231/python3_spider
# @Version : $Id$

"""
线程全局解释器锁(Global Interpreter Lock),即Python为了保证线程安全而采取的独立线程运行的限制,说白了就是一个核只能在同一时间运行一个线程.对于io密集型任务,python的多线程起到作用,但对于cpu密集型任务,python的多线程几乎占不到任何优势,还有可能因为争夺资源而变慢。
解决办法:多进程或协程(协程也只是单CPU,但是能减小切换代价提升性能).
"""
# 单线程VS多线程VS多进程
"""
开始对比之前,首先定义四种类型的场景: CPU计算密集型、磁盘IO密集型、 网络IO密集型、模拟IO密集型
"""


# CPU计算密集型
def count(x=1, y=1):
    # 使程序完成150万计算
    c = 0
    while c < 500000:
        c += 1
        x += x
        y += y


#  磁盘读写IO密集型
def io_disk():
    with open("file.txt", 'w') as f:
        for x in range(500000):
            f.write("python_learning\n")


# 网络IO密集型
import requests
header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36"
}
url = "https://www.tieba.com/"


def io_web():
    try:
        response = requests.get(url, header=header)
        html = response.text
    except Exception as e:
        return {"error": e}


import time
# 模拟IO密集型


def io_simulation():
    time.sleep(2)


# 比较的指标是:时间,时间花费越少,说明效率越高
from functools import wraps


def timer(model):
    def wrapper(func):
        def decorator(*args, **kwargs):
            type = kwargs.setdefault('type', None)
            t1 = time.time()
            func(*args, **kwargs)  # 被装饰函数
            t2 = time.time()
            cost_time = t2 - t1
            print("{}-{}花费时间:{}s".format(model, type, cost_time))
        return decorator
    return wrapper

# 单线程
# 被装饰函数


@timer("单线程")
def single_thread(func, type=""):
    for i in range(10):
        func()



# 单线程
single_thread(count, type="CPU计算密集型")
single_thread(io_disk, type="磁盘IO密集型")
single_thread(io_web, type="网络IO密集型")
single_thread(io_simulation, type="模拟IO密集型")


# 多线程
# 被装饰函数
from threading import Thread


@timer("多线程")
def multi_thread(func, type=''):
    thread_list = []
    for i in range(10):
        t = Thread(target=func, args=())
        thread_list.append(t)
        t.start()
    e = len(thread_list)
    while True:
        for thred in thread_list:
            if not thred.is_alive():
                e -= 1
        if e <= 0:
            break


# 多线程
multi_thread(count, type="CPU计算密集型")
multi_thread(io_disk, type="磁盘IO密集型")
multi_thread(io_web, type="网络IO密集型")
multi_thread(io_simulation, type="模拟IO密集型")


# 多进程
# 被修饰函数
from multiprocessing import Process


@timer("多线程")
def multi_process(func, type=""):
    process_list = []
    for x in range(10):
        p = Process(target=func, args=())
        process_list.append(p)
        p.start()
    e = process_list.__len__()

    while True:
        for pr in process_list:
            if not pr.is_alive():
                e -= 1
        if e <= 0:
            break

# 多进程
multi_process(count, type="CPU计算密集型")
multi_process(io_disk, type="磁盘IO密集型")
multi_process(io_web, type="网络IO密集型")
multi_process(io_simulation, type="模拟IO密集型")

由于自己的电脑是单核CPU,故多进程结果无法展示,请读者见谅,谢谢!


结果.png

3.结论

  • 1.对于CPU密集型任务,多线程与单线程对比时,不仅没有优势,还由于要不断的加锁与释放GIL全局锁,切换线程而浪费大量时间,效率低;多进程,由于是多个cpu同时进行计算,效率成倍增加。
  • 2.对于IO密集型任务(磁盘IO、网络IO、数据库IO等),计算量小,主要是IO等待时间的浪费,多线程对比单线程也没能体现很大的优势,这是由于上述的IO任务不够繁杂,所以优势不明显。
  • 3.模拟IO密集型任务,用sleep来模型IO等待时间,为了体现多线程的优势。单个线程需要每个线程都要sleep(2),10个线程就要20秒;而对线程,在sleep(2)时,会切换到其他线程,使得10个线程同时sleep(2),最终10个线程只需要2秒。
  • 4.单线程总是最慢,多进程总是最快。多线程适合在IO密集任务下使用(如网络爬虫、网站开发等),多进程适合在对CPU计算要求较高的任务下使用(如数据分析、机器学习等);多进程虽然总是最快,但不一定是最优的选择,因为它需要CPU资源支持下才能体现优势。

4.参考文章

python编程时光
win7系统,笔记本电脑查看是几核CPU方法

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,817评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,329评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,354评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,498评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,600评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,829评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,979评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,722评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,189评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,519评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,654评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,329评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,940评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,762评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,993评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,382评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,543评论 2 349

推荐阅读更多精彩内容

  • 必备的理论基础 1.操作系统作用: 隐藏丑陋复杂的硬件接口,提供良好的抽象接口。 管理调度进程,并将多个进程对硬件...
    drfung阅读 3,530评论 0 5
  • 一. 操作系统概念 操作系统位于底层硬件与应用软件之间的一层.工作方式: 向下管理硬件,向上提供接口.操作系统进行...
    月亮是我踢弯得阅读 5,959评论 3 28
  • 并发:就是cpu不断的切换,看起来程序是同时程运行的程序是由cpu来执行的,当程序遇到IO阻塞或者运行时间过长或者...
    张大志的博客阅读 368评论 0 1
  • 1. cpu通过时间片分配算法来循环执行任务,当前任务执行一个时间片后会切换到下一任务。但是,再切换之前会保存上一...
    冰与河豚鱼阅读 658评论 0 0
  • 2019 08 25 影评:海边的曼彻斯特 应该比较少有人会花两个小时看这样一部漫长、平静、压抑的电影吧。应该很少...
    Mr__Ray阅读 447评论 0 1