微信号:infoqchina

介绍:有内容的技术社区媒体

如何成为机器学习工程师?培训推荐

2017-09-16 09:00 QCon

对很多人来说,“机器学习”这个词既让人倍感兴奋,又觉得高深莫测。毕竟,几乎所有巨头——从国外的 Google、Facebook、Apple、Amazon 到国内的 BAT、华为、美团、今日头条等,都在争相进军这一领域。机器学习技术也渗入到生活的方方面面,从新闻资讯应用里推送的文章,逛淘宝时的物品推荐到无人驾驶汽车等,无一不用到机器学习技术。

对机器学习感兴趣的人也日益增加,很多工程师正在考虑一个机器学习工程师的职业生涯问题。想要成为机器学习工程师,那你需要具备以下技能:计算机基础和编程、概率统计、数据建模和评估、应用机器算法和库、软件工程和系统设计等知识,其中数据分析、建模和评估方面的技能至关重要,毕竟大数据和机器学习有着不可切割的关系。

大数据和机器学习

在大数据领域中,机器学习几乎无处不在,即便我们没有特意引用它们,它们也经常出现在大数据应用中,例如:搜索、推荐、预测和数据挖掘等。随着互联网的高速发展,数据量不断爆发式增长,数据维度越来越丰富,这也为机器学习的发展和应用提供了良好的土壤,机器学习的良好成果也反向让数据产生更大的价值,成为真正的“大数据”,两者相辅相成,相互促进,让数据越来越智能。

随着大数据技术的发展以及数据产品的应用和推广,尤其是在工业和互联网领域,企业使用机器学习来提升收入或是降低成本的方式愈加有效。这其中,预防欺诈、定位电子广告的目标客户、内容推荐、建造更好的汽车、瞄准更好的潜在市场、优化媒体改善医疗保障服务等都证明大数据机器学习的多功能性和广泛的适用性。

大家都知道,机器学习技术不仅包含高深的理论算法模型以及对数据的合理利用,同时也离不开全面的工程技术支持。因此,QCon 2017 上海站特设会前两天的深度培训——综合介绍业界先进的机器学习算法模型及应用实践,以及飞速发展的大数据实时计算技术。我们邀请的国内一线互联网技术专家们,也将通过各自在不同领域的实践分享,向大家展示如何利用【机器学习实践】和【大数据实时计算】技术的融合来引领业务发展的,并引领大家走上成为机器学习工程师之路。

深度培训
机器学习实践 10 月 15 日

本课程尝试从工程的角度阐述如何在实际的工业问题中利用数据、收集数据、训练模型进而改善实际 的业务问题。听众不仅能学习到如何使用机器学习的方法去建立预测模型,也能了解到对于 不同的业务问题如何选取具体的算法,还可以学习到如何从无到有构建产品环境的机器学习应用。

本课程的另一大特色是通过一个信用卡申请的业务问题开始,配合丰富的实验且结合实 际场景中的数据收集、特征处理、模型构建以及模型部署的整个过程。通过具体案例和实验 练习教会用户在实际业务中如何使用机器学习的构建方法。围绕各个环节,介绍和讲授如何构建机器学习系统、管道和整个机器学习的平台。

讲师介绍

张彭善,具有非常深厚的机器学习、数学、统计学功底,长期在互联网公司从事机器学习、大数据的相关研发工作,具备丰富的应用机器学习到工业场景的经验。最近五年讲师一直在第三方支付公司的风控部门从事反欺诈的工作,不仅实际工作中应用各种机器学习模型到反 欺诈的场景,提高和保障公司的支付产品正常的运转;并且基于实际经验构建基于大数据的 机器学习的管道,结合线上系统的要求构建高可用可扩展的机器学习线上系统。对于实际应用中如何使用机器学习,如何使用各种机器学习的方法和数据处理的方式,如何部署实际的 机器学习模型以及如何优化机器学习的问题有着非常深入的理解和经验。

课程收益

  1. 了解机器学习和数据科学

  2. 如何对业务问题进行数学建模

  3. 如何收集数据、设计特征进行机器学习

  4. 学习各种机器学习的算法解决实际问题并了解其应用场景

  5. 如何部署模型上线,如何开发具备产品强度的数据模型服务

  6. 如何评估机器学习模型的作用以及如何补足机器学习模型的缺点

  7. 了解深度学习发展历史、现状以及应用场景


大数据实时计算 10 月 16 日

提高计算的时效性,更快的从数据中挖掘出信息和知识就意味着能够获取更大的价值。在实时计算领域,Apache Storm、Samza、Spark Streaming、Kafka Stream、Flink 等开源流式计算引擎层出不穷,呈现百家争鸣之势。本次培训中,我们将以典型的实时处理框架为例,分享相关背景、架构设计与应用。

讲师介绍

翟佳毕业于中科院计算所,目前就职于一家下一代实时处理初创公司 Streamlio,是 streamlio 的核心创始成员之一。在此之前任职于 EMC,是北京 EMC 实时处理平台的技术负责人。主要从事实时计算和分布式存储系统的相关开发,此外也在开源项目 Apache BookKeeper, Distributedlog,DC/OS 等项目中持续贡献代码。

郭斯杰下一代实时处理初创公司 Streamlio 的联合创始人。之前就职于 Twitter,任职 Staff Software Engineer,是 Twitter message group 的技术负责人。同时也是 Apache BookKeeper 的 PMC Chair, Apache DistributedLog 的 Co-Creator。加入 Twitter 之前,就职于 Yahoo

课程大纲
  1. 大数据实时计算背景与典型应用。

  2. 常见计算框架,架构与优缺点。

  3. 典型案例与应用心得。


预约学习席位

深度培训在 QCon 大会前 2 天,10 月 15 日 -16 日在上海宝华万豪酒店举办,每天培训包括 10 小时的授课和 2 小时的提问交流。

添加 Banner 图中小助手微信,可以咨询培训大纲和更多内容,更有机会和两位老师面对面交流。

学习席位有限,点击 「 阅读原文 」即可进入大会官网,了解更多信息,点击官网“立即报名”按钮即可获取学习席位,开启成为机器学习工程之路。

 
InfoQ 更多文章 Q新闻丨WePhone 开发者自杀事件回顾;Java 将每半年发布一个版本;百度硅谷 AI&nbs 公司危机、下岗困局、不受重视,程序员该如何面对职场挫折? 微信开源PhxQueue:高可用、高可靠、高性能的分布式队列 解决分布式系统事务一致性的几种方案对比,你有更好的吗? 如何设计高可用的微服务架构?
猜您喜欢 深入分析网络编程中踩过的坑 Hadoop和Spark招聘 再谈网络爬虫中的编码识别问题 喵神 onevcat 的直播首秀 为什么R语言是当今最值得学习的数据科学语言