【技术·分享】优化算法为理性决策赋能系列之二:柜机规格最优推荐

作者:金钊、姜东晓

回溯系列一“选址应用”中,我们提到宏观和微观两个场景,宏观选址找到备选小区后,微观选址会对小区内部柜机的点位和规格进行决策。本期来介绍微观选址决策之一,柜机规格最优推荐模型。该模型通过机器学习 + 运筹规划的组合,为每个新小区的规格投放做出有限信息下尽可能更优的建议。

一、业务描述

1.1 规格推荐任务重要性

微观选址聚焦在小区内部,它由一系列决策组成,其中之一就是优势点位被选择后合适的规格建议。规格作为柜机自身最重要的变量,极大影响了一个小区潜在需求变现的程度。规格过大或过小,都会直接导致收益的损失。想象一下,一个件量特别多的小区只投放了较少的格口,白白损失了应有的收益,而一个件量较少的小区投放较多的格口,周转率也只能一直在低位徘徊,投资回报率不佳。

目前这一决策过程是由运营人员在单个备选小区进行详细的件量评估后,再上报总部来确定的。我们希望能将这一过程模型化、规模化、标准化,意义在于如果小区件量评估方式是统一的,那我们就可以将其合理地自动化,而把运营人员从这件事情中解放出来,让他们将精力投入到更需要人的智慧的生产活动中。

所以我们对规格推荐进行了仿真。如下图所示,当向阳光棕榈园小区投放柜机时,系统会根据小区的画像特征,如周边包裹量、楼宇性质、是否可上刊、户数、人数、栋数等13个指标预估出此小区可能的日均派件量为115件,再给出具体的规格建议如投放1台一拖五可以满足这个日均派件量,不会太大也不会太小。

同时,再展示出3个和阳光棕榈园最相似的已投放过柜机的小区,包括它们近一年的日均件量和柜机规格,来佐证我们规格建议的合理性和解释性,并且可以对历史投放规格做出识别和纠正。


1.2 处理上的难点

过去的投放规格的参考意义有待商榷。

由于画像特征的不明晰、数据的欠缺以及人类决策的主观性,导致件量评估决策过程比较困难。

即使评估出了件量,也存在多种规格的组合可以满足这个件量,该如何决定最优组合。


二、技术实现

2.1 机器学习模型预测小区派件量

有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征提取是机器学习建模的第一步,也是最关键的一步。

我们从OA系统的全国柜机表日志中,提取了柜机所在小区的画像信息;并且从数据仓库的全国柜机日kpi日志中,构造了小区的营收环境数据。将这两方面的数据进行整合,作为模型的训练数据存储起来。


之后,我们以上面提取的数据作为特征向量,以小区的日均派件量作为标签,用三层MLP回归模型来进行训练。这里为什么采用三层MLP呢?原因有两个:

(1) OA系统最终可用的小区样本只有13000+个,并且小区特征只有16个,数据量不大,特征维度不高,所以没有必要采用深度神经网络;

(2) Universal Approximation Theorem (Hornik et al., 1989;Cybenko, 1989) 定理表明:前馈神经网络,只需具备单层隐含层和有限个神经单元,就能以任意精度拟合任意复杂度的函数。但在实际工作上,深的还是更好,所以这里采用了两层隐藏层。


2.2 运筹规划模型求出最优规格

在预测出小区的日均派件量之后,该怎么决定投放柜机的规格呢?

这个问题就属于运筹学的范畴了。更具体一点,我们要决定的,是要投放多少主柜(m)和副柜(s),使其在满足一定条件的情况下,达到目标函数的最优值。

因为不能给出诸如0.7个主柜、3.5个副柜这样的建议,所以这是一个整数规划问题。目标函数是投放成本最小。约束条件暂时有两个:a)满足最优周转率;b)副柜和主柜的比值不能超过最大值12。具体的运筹优化模型如下图所示:


2.3 K-Means聚类模型筛选相似小区

在预测出A小区的日均派件量,并给出最优的柜机规格之后,我们接下来要做的是找到A小区的相似小区,看看这些相似小区的件量和规格是怎样的,来验证前两步结果的可信度。

这里我们采用的是两层筛选方案:

 (1) 召回:将全量小区进行K-Means聚类。当查找相似小区时,第一步只需计算A小区与K个中心点的距离,确定A小区属于哪一类,以降低计算复杂度;

 (2) 精排:确定A小区属于哪一类之后,就要计算其和这类小区中所有样本的距离,以精确筛选出top3的相似小区。

通过两层筛选方案,我们实现了快速、精确查找相似小区的功能。此方案具有向后兼容性,即如果未来训练数据增大,我们可以增加K的值,来维持相似小区检索模块的运行速度。

三、总结

我们通过将机器学习 + 运筹规划模型相结合的方式,完成了小区派件量预测及柜机规格拆分,实现了微观选址中一个复杂的决策过程--柜机规格推荐。该模型的数理化、自动化、标准化将客观规律从主观活动中提炼出来,为这一决策活动未来的智能化创造了可能。

运筹规划模型不光能解决如选址这样传统的全局优化问题,也可以与其他学科交叉,完成很多有趣有用的决策过程。接下来我们会再介绍一种通过交通工程 + 运筹规划的方式对海量快递员GPS轨迹数据进行可视化的路网匹配模型,证明了运筹模型在其他领域应用的潜力。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355