新闻是有分量的

申博代理网站

2019-05-01 10:34栏目:新闻
TAG:

原标题:万字干货 | 一文助你了解机器学习

本文将通过大量案例和通俗易懂的“人话”,讲述机器学习建模逻辑和使用场景,让非数据科学专业的职场人都可以快速了解机器学习是什么,能做什么,如何用!

从AlphaGo战胜李世石开始,AI迎来了新一轮爆发增长,2018年,全球人工智能市场规模达到了73.5亿美元,各个行业和领域几乎都被AI渗透,各国对AI人才的争夺也正愈演愈烈。

《中国人工智能发展报告2018》显示:专利上,中国已经成为全球人工智能专利布局最多的国家,数量略微领先于美国和日本;产业上,中国的人工智能企业数量排在全球第二,北京是全球人工智能企业最集中的城市。

全球知名创投研究机构CB Insights评选出了100家最有前途的AI公司,国内的商汤科技,旷视科技,第四范式等6家公司杀入到榜单中,同时各大互联网公司都在构建自己的AI实验室。一方面通过AI技术挖掘用户数据,通过+AI,优化现有业务,另一方面探索AI应用新场景,研发新产品,完成AI+,为企业寻找全新的增长引擎。

笔者有幸参与了一个机器学习建模实验室项目,项目的本质是抽象机器学习建模流程,将机器学习建模过程组件化,通过在画布上对组件(算子)灵活连接,让非专家用户(不会写代码,不熟悉算法模型和调参的产品经理,市场运营,行政财务等职场人)可以快速搭建机器学习模型,实现业务预测,极大降低机器学习应用门槛。

通过近十个月的学习和实践,笔者对机器学习有了初步理解,本文将通过大量案例和通俗易懂的“人话”,讲述机器学习建模逻辑和使用场景,让非数据科学专业的职场人都可以快速了解机器学习是什么,能做什么,如何用!

本文共分为四个部分:

  • 第一部分、介绍关于AI的常见误区,回答机器学习是什么,可以用来做什么,怎么用;
  • 第二分部、介绍机器学习为业务赋能的6个步骤,及非专家用户的应用难点和解决方案;
  • 第三部分、通过案例介绍二分类,聚类和回归模型如何应用;
  • 第四部分、介绍机器学习模型的主要应用场景和立项模板。
一、关于AI的几个误区 1. 只有那些科技公司才能应用AI技术?

这一轮AI的火爆始于AlphaGo战胜李世石,随后,智慧城市,智慧生活,智慧办公和智慧医疗等概念可谓是铺天盖地,在各种媒体上能看到各种AI的高大上应用场景,如阿里的鹿班系统双十一时每秒设计8000张海报,无人驾驶汽车在部分城市指定路段上路测试,机器人索菲亚获得了沙特“公民”身份,滴滴利用AI模型预测城市不同位置用车需求,AI读片进入各大医院辅助医生判断癌症,各种报道 让一些非AI相关领域从业者感觉其过于高大上,似乎离自己很远。

但笔者认为AI的价值不仅于此,各行各业其实都可以利用AI技术优化现有服务流程,提升效率。

笔者结合自身理解,举一些机器学习在非互联网公司中的常见应用场景。

  • 会员智能化应用:基于历史数据对会员精准营销,挖掘用户潜在消费需求,个性化优惠券下发,流失预警,新会员转化路径个性化配置等
  • 商品智能化应用:预测未来X时间内销售量,库存量,订单量,关联销售,优化供应链,预测市场容量,新品定价,设定折扣策略和作弊检测。
  • 异常分析:订单异常分析,用户异常分析,机械故障预测,羊毛党分析,动态预警分析等。

除了上述场景外,只要业务需求可以抽象成分类预测问题,数值预测问题,都可以考虑利用机器学习辅助决策。

2. 使用AI技术必须掌握数学和python?

DT(Data technology)时代到来,企业在互联网+的过程中积累了大量的数据,而AI技术就是帮助企业将这些数据有效利用起来的重要工具。

《中国ICT人才生态白皮书》显示:到2018年底,我国人工智能人才缺口将突破100万,到2020年,这个数字将攀升到226万, 笔者认为,这个数字描述的是AI应用型人才,也就是知道如何利用AI技术优化现有业务的职场人,非人工智能从业者都会对其产生恐惧。

当我提到AI一般人闹钟都会出现两幅画面,如下所示:

写代码和复杂的数学公式领AI看起来门槛高不可攀,但是为了降低建模门槛,国内外大量公司都推出了自己的组件建模平台,可以通过简单拖拽无需编写代码,而负责的数学公式被封装成算子组件。国外的亚马逊AWS,微软的AZURE,R2.ai,国内的阿里PI,第四范式的先知平台都是类似产品。