Tag Archives: 算法

机器学习算法线上部署方法

我们经常会碰到一个问题:用了复杂的GBDT或者xgboost大大提升了模型效果,可是在上线的时候又犯难了,工程师说这个模型太复杂了,我没法上线,满足不了工程的要求,你帮我转换成LR吧,直接套用一个公式就好了,速度飞速,肯定满足工程要求。这个时候你又屁颠屁颠用回了LR,重新训练了一下模型,心里默骂千百遍:工程能力真弱。

这些疑问,我们以前碰到过,通过不断的摸索,试验出了不同的复杂机器学习的上线方法,来满足不同场景的需求。在这里把实践经验整理分享,希望对大家有所帮助。(我们的实践经验更多是倾向于业务模型的上线流程,广告和推荐级别的部署请自行绕道)。

首先在训练模型的工具上,一般三个模型训练工具,Spark、R、Python。这三种工具各有千秋,以后有时间,我写一下三种工具的使用心得。针对不同的模型使用场景,为了满足不同的线上应用的要求,会用不同的上线方法:

阅读全文

微分享预告 | 携程是如何做用户画像的

图片1

对携程来说,你是“大方”的么?

“用户影响力”是什么概念,如何识别“高影响力用户”?

如何知道用户出行偏好,比如喜欢 “温泉游”“亲子游”“大床房”“高星级”“商务舱”?

携程“用户画像”的架构是怎样的,如何实现“用户画像”的流计算,如何实现实时服务的高可用且可降级,如何实现离线异步服务的高效率?

如果你对上述问题感兴趣,就让老司机带你认识一下“大数据”背景下的“用户画像”吧~

阅读全文

Copyright © 1999 - 2014 Ctrip. Powered by WordPress.