Tag Archives: 机器学习

去哪儿酒店算法服务平台

【作者简介】张中原,2011年加入去哪儿网,先后从事交易系统、酒店数据、公司基础平台与组件、存储和监控等相关工作,曾长期担任应届生技术培训和指导。技术涉猎广泛、代码洁癖、关注工程师开发效率和质量,系统设计和易用性,代码的实际效益。本文来自张中原在“携程技术沙龙——云海机器学习Meetup”上的分享。

下载PPT请直接拖到文章底部。

张中原_2

阅读全文

携程酒店浏览客户流失概率预测

【作者简介】陈无忌,就读于中国科学技术大学计算机学院,15 级硕士研究生。研究方向机器学习、大数据、智能交通等。在校期间多次参加大数据竞赛,在携程云海平台比赛中,两次和队伍一起获得第一名。本文来自陈无忌在“携程技术沙龙——云海机器学习Meetup”上的分享。

下载PPT请直接拖到文章底部。

陈无忌_1

阅读全文

沙龙报名| 云海机器学习Meetup,4月22日上海

微信

机器学习是一门让计算机在非精确编程下进行活动的科学,计算机科学家认为机器学习是人工智能研究的核心内容,统计学家认为机器学习是统计学习的延伸。

在大数据盛行的今天,机器学习促进了车辆无人驾驶、高效语音识别、精确网络搜索及人类基因组认知的大力发展。

机器学习几乎无孔不入,你可能已经在不知不觉的情况下使用过无数次,对于机器学习的初学者或者进阶者,还存在很多类似的疑问。例如:如何构建合理的特征工程,组合、分解、选择数据,从而使得正确理论带来应用的合理性;如何有效解决算法所带来的过拟合、维度灾等问题;如何评估所构建的算法的可靠性,以及解释算法的真实性。

携程技术沙龙此次的云海机器学习Meetup,将通过最真实的案例,从模型调优、特征转换和评估等多角度、多维度呈现机器学习在不同领域方面的应用。

云龙风虎,海纳百川,在这个春暖花开的4月,让我们和各位爱学习的小伙伴们一起来探讨机器学习技术,互相交流,共同进步。 阅读全文

机器学习算法线上部署方法

我们经常会碰到一个问题:用了复杂的GBDT或者xgboost大大提升了模型效果,可是在上线的时候又犯难了,工程师说这个模型太复杂了,我没法上线,满足不了工程的要求,你帮我转换成LR吧,直接套用一个公式就好了,速度飞速,肯定满足工程要求。这个时候你又屁颠屁颠用回了LR,重新训练了一下模型,心里默骂千百遍:工程能力真弱。

这些疑问,我们以前碰到过,通过不断的摸索,试验出了不同的复杂机器学习的上线方法,来满足不同场景的需求。在这里把实践经验整理分享,希望对大家有所帮助。(我们的实践经验更多是倾向于业务模型的上线流程,广告和推荐级别的部署请自行绕道)。

首先在训练模型的工具上,一般三个模型训练工具,Spark、R、Python。这三种工具各有千秋,以后有时间,我写一下三种工具的使用心得。针对不同的模型使用场景,为了满足不同的线上应用的要求,会用不同的上线方法:

阅读全文

Copyright © 1999 - 2014 Ctrip. Powered by WordPress.