所谓蒙特卡罗模拟即使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。
这么讲有点抽象,我们来看一个例子:
比如说我们要求圆形的面积,如果不用圆的面积公式的话,我们可以怎么做呢?
利用蒙特卡罗模拟的指导思想,我们可以先在图示的正方形范围内随机生成大量的点,那么
正方形面积圆形中的点数/正方形内的总点数= 圆形面积*
这个主要用到了numpy模块中的np.random.uniform()函数来生成均匀分布的随机数。
今天的重点不在这里,我们看下一个题目:
排队问题
假设:1. 两场电影结束时间相隔较长,互不影响;
- 每场电影结束之后会有20个人想上厕所;
- 这20个人会在0到10分钟之内全部到达厕所(第3,4条使用了均匀分布,追求严谨的简友们可以用正态分布);
- 每个人上厕所时间在1-3分钟之间(时间设定得比较长,你们就当我在模拟女厕所就好)。
- 首先模拟最简单的情况,也就是厕所只有一个位置,不考虑两人共用的情况则每人必须等上一人出恭完毕方可进行。
分析:对于每个人都有如下几个参数:
- 到达时间
- 等待时间
- 开始上厕所时间
- 结束时间
代码也十分简单,首先要随机生成到达时间(多谢@zony2016的提醒,到达时间需要进行一下排序,方可确定排队的先后顺序)和上厕所耗时:
arrivingtime = np.random.uniform(0,10,size = 20)
arrivingtime.sort()
working = np.random.uniform(1,3,size = 20)
再初始化一下几个数组:
startingtime = [0 for i in range(20)]
finishtime = [0 for i in range(20)]
waitingtime = [0 for i in range(20)]
emptytime = [0 for i in range(20)]
第一人比较特别,单独处理一下:
startingtime[0] = arrivingtime[0]
finishtime[0] = startingtime[0] + working[0]
waitingtime[0] = startingtime[0]-arrivingtime[0]
第二个以后就可以用循环了:
for i in range(1,len(arrivingtime)):
if finishtime[i-1] > arrivingtime[i]:#如果下一个到了这个人还没有结束
startingtime[i] = finishtime[i-1]#没结束的话要等上一人结束之后方可开始
else:
startingtime[i] = arrivingtime[i]
emptytime[i] = startingtime[i] - finishtime[i-1]
然后计算一下每人的等待时间:
for i in range(1,len(arrivingtime)):
if finishtime[i-1] > arrivingtime[i]:
startingtime[i] = finishtime[i-1]
else:
startingtime[i] = arrivingtime[i]
emptytime[i] = startingtime[i] - finishtime[i-1]
finishtime[i] = startingtime[i] + working[i]
waitingtime[i] = startingtime[i] - arrivingtime[i]
print(waitingtime[i])
print("average waiting time is %f" % np.mean(waitingtime))
模拟五次的结果如下:
14.72/12.52/13.52/16.51/18.81
上个厕所要等十多分钟?很明显无法满足需求,那么增加一个位置呢,效果会如何?
我们将循环部分改成这样(这个循环要从i=2开始,即从第三个人开始循环,前两个人都需要预先进行计算处理):
startingtime[1] = arrivingtime[1]
finishtime[1] = startingtime[1] + working[1]
waitingtime[1] = startingtime[1] - arrivingtime[1]
for i in range(2,len(arrivingtime)):
if finishtime[i-1] > arrivingtime[i] and finishtime[i-2] > arrivingtime[i]:
startingtime[i] = min(finishtime[i-1],finishtime[i-2])
else:
startingtime[i] = arrivingtime[i]
emptytime[i] = startingtime[i] - finishtime[i-1]
再模拟五次的结果如下:
6.26 / 5.47 / 5.62 / 3.07 / 4.78
效果还是比较明显的!两个位置还是不够满足需求,再加两个吧?
4个位置的模拟结果:
0.52/0.72/2.54/0.46/0.64
基本能满足需求了。那么看完电影为何还是要排队上厕所呢???
因为出来得太着急了啊,彩蛋还没放呢。
我们假设大家都急急忙忙出来上厕所的情形,把到达时间缩短到3分钟以内:
arriving = np.random.uniform(0,3,size = 20)
模拟结果如下:
5.22/5.91/5.37/5.67/6.27
看,又变成了好几分钟。
所以呢,这篇文章的中心思想就是:
呼吁大家看电影一定要看彩蛋,看完彩蛋出来上厕所也不用排队了。
从模拟实验的结果可以看到,用Python模拟这种排队问题是游刃有余的。
我认为这个模型还可以做如下完善:
- 到达时间和上厕所耗时不可能是均匀分布,应该按正态分布更加合理;
- 没有考虑到有上大号的情况;
- 把上厕所的总人数定在了20,而没有用随机数模拟上厕所的总人数。
最后谢谢@Hello_edda的指正