本章主要介绍了三种在工业界和美团应用十分广泛的模型-逻辑回归、场感知因子分解机、梯度提升树。
1、逻辑回归
关于逻辑回归的原理,想必大家都很清楚了,可以参考文章://www.greatytc.com/p/e8dca5613da6
接下来,介绍下逻辑回归的主要应用。逻辑回归常用于疾病自助诊断、经济预测、点击率预测等领域。逻辑回归适合用来学习需要大规模训练的样本和特征,对于广告十亿量级的特征和亿量级的特征来说,逻辑回归有着天然的优势,因而逻辑回归在工业界获得了广泛的关注。
逻辑回归的缺点是:需要大量的特征组合和离散的工作来增加特征的表达性,模型表达能力弱,比较容易欠拟合。
2、场感知因子分解机
逻辑回归无法学习到特征间的组合关系,因此我们有了因子分解机FM和场感知因子分解机FFM。
有关FM模型,参考://www.greatytc.com/p/152ae633fb00
有关FFM模型,参考://www.greatytc.com/p/781cde3d5f3d
接下来,介绍下场感知因子分解机的主要应用。FFM模型可以自动做特征组合和处理高维稀疏特征,因而它在处理大量离散特征问题上往往有比较好的效果。但要注意对连续特征做归一化或者离散化。
3、梯度提升树
梯度提升树即GBDT、XGBoost和LightGBM等模型,可以参考://www.greatytc.com/p/f73a80c22198