微信号:ecshujufenxi

介绍:专注大数据,移动/互联网,IT科技,电子商务,数据分析/挖掘等领域的综合信息服务与分享平台.合作|约稿请加qq:365242293

解决现实世界问题的四大机器学习策略

2018-11-06 08:05 品觉

解决现实世界问题的四大机器学习策略

原文: Four machine learning strategies for solvingreal-world problems

来: https://blogs.sas.com/content/subconsciousmusings/2018/10/17/four-machine-learning-strategies-for-solving-real-world-problems/


导读:

有的在线学习算法还会“适应”,即随时调整模型,跟随或追踪数据的变化。具体而言,它们会逐渐“遗忘”过时数据,从而适用于环境/模型随时变动的应用程序。


原文翻译:

机器学习有四种广受认可的形式:监督式、无监督式、半监督式和强化式。在研究文献中,这些形式得到了深入的探讨。它们也被纳入了大多数机器学习算法的入门课程。下表对这四种形式作了总结。

Style of   Learning

Definition

Characteristic

Examples

Supervised

Supervised learning algorithms make predictions based  on a set of examples.

Data has known labels.

Insurance underwriting and fraud

Unsupervised

With unsupervised learning, there is a focus on finding  patterns and gaining insight from data.

Labels or output are unknown.

Customer clustering and market basket analysis

Semi-supervised

With semi-supervised learning, you use unlabeled  examples with a small amount of labeled data to improve the learning  accuracy.

Labels or output are known for a subset of data.

Medical predictions where tests and expert diagnoses  are expensive and only part of the population receives them.

Reinforcement

Reinforcement learning analyzes and optimizes the  behavior of an agent based on the feedback from the environment.

Focus on making decisions based on previous experience.

Robotics, gaming, navigation, complex decision problems  and reward systems.


但一个并不广为人知的概念是机器学习策略,即以创造性的方式,运用基本的机器学习算法,解决现实世界问题。我对这些策略产生了浓厚的兴趣。在这篇文章中,我将探讨四种策略:在线学习、迁移学习、集成学习和深度学习。好在,这四项策略适用于表格中任意一种机器学习形式。


一、在线学习

在线学习使用瞬息万变的数据。这类模型跟着数据及时更新,并不存储先前的数据。有的在线学习算法还会“适应”,即随时调整模型,跟随或追踪数据的变化。具体而言,它们会逐渐“遗忘”过时数据,从而适用于环境/模型随时变动的应用程序。批量(或离线)学习使用静态的数据,可以充当在线学习的热身。在批量学习中,模型一次性完成所有数据的学习。很多在线学习算法使用一个批量/离线算法(以一小批数据为基础),为模型作启动前的热身。这种做法可以显著加快算法的收敛(convergence)速度。


二、迁移学习

迁移学习将一个领域的知识应用到另一个领域。它将旧的数据、模型和参数用于新问题的解决,对于机器学习模型的终身学习而言至关重要。迁移学习是人与生俱来的能力。举个例子,我们会将已经掌握的语言知识(词汇、语法等),应用到新语言的学习中。两种语言越是接近,知识迁移就越简单。


三、集成学习

单学习器模型只用一个学习器(算法),而集成学习使用多个学习器。一般的集成算法包含梯度提升、引导聚集、决策森林、堆栈集成和超级学习器。集成学习可以结合相对较弱(很多情况下,预测精度只略高于随机猜测)的学习器,产生强大、准确的模型。


四、深度学习

深度学习包含多个层,可以学习数据的层级化或多尺度特征。与之相对的是“浅层学习”,即简单地运用普通的机器学习建模算法。通常,浅层学习离不开特征工程(feature engineering),以保障输入以适当的形式呈现给模型,而深度学习在训练时,就自然而然地学会了这些特征。

 

在用机器学习算法解决日常业务难题时,机器学习策略是我们要考虑的又一个方面。

「完」


本次转自:品觉 微信公众号(pinjueche.com)

车品觉简介

畅销书《决战大数据》作者;国信优易数据研究院院长;红杉资本中国基金专家合伙人;浙江大学管理学院客席教授;全国信标委员;数据标准工作组副组长;美丽心灵基金会桑珠利民基金副主席。

原阿里巴巴集团副总裁,首任阿里数据委员会会长现担任中国信息协会大数据分会副会长、中国计算机学会大数据专家委员会副主任、粤港信息化专家委员、中国计算数学学会第九届理事、清华大学教育指导委员(大数据项目)、浙江大学管理学院客席教授等职。

版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。

关联阅读

原创系列文章:

1:从0开始搭建自己的数据运营指标体系(概括篇)

2 :从0开始搭建自己的数据运营指标体系(定位篇)

3 :从0开始搭建自己的数据运营体系(业务理解篇)

4 :数据指标的构建流程与逻辑

5 :系列 :从数据指标到数据运营指标体系

6:   实战 :为自己的公号搭建一个数据运营指标体系

7:  从0开始搭建自己的数据运营指标体系(运营活动分析)

数据运营 关联文章阅读:  

运营入门,从0到1搭建数据分析知识体系    

推荐 :数据分析师与运营协作的9个好习惯

干货 :手把手教你搭建数据化用户运营体系

推荐 :最用心的运营数据指标解读

干货 : 如何构建数据运营指标体系

从零开始,构建数据化运营体系

干货 :解读产品、运营和数据三个基友关系

干货 :从0到1搭建数据运营体系

数据分析、数据产品 关联文章阅读:

干货 :数据分析团队的搭建和思考

关于用户画像那些事,看这一文章就够了

数据分析师必需具备的10种分析思维。

如何构建大数据层级体系,看这一文章就够了

干货 : 聚焦于用户行为分析的数据产品

如何构建大数据层级体系,看这一文章就够了

80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系

从底层到应用,那些数据人的必备技能

读懂用户运营体系:用户分层和分群

做运营必须掌握的数据分析思维,你还敢说不会做数据分析

合作请加qq:365242293  


更多相关知识请回复:“ 月光宝盒 ”;

数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

 
数据分析 更多文章 2018最炙手可热的行业--大数据就业方向和学习路线图详解! 33种经典图表类型总结,轻松玩转数据可视化 掌握这25条小贴士,快速提升数据可视化能力! 推荐 :数据产品管理的现状 干货&神图 :数据分析师的完整流程与知识结构体系
猜您喜欢 就!在!刚!刚!Elasticsearch顶尖高手系列:高手进阶篇(最新第二版)全新升级啦! 带你开发一款给Apk中自动注入代码工具icodetools(开凿篇) 老西医和老码农的中年危机 程序 bug 导致了天大的损失,要枪毙程序猿吗? 2016年7月6日,今日全球能源资讯