微信号:jason_guo_jun

介绍:分享和交流大数据领域技术,包括但不限于Storm、Spark、Hadoop等流行分布式计算系统,Kafka等分布式消息系统,PostgreSQL、MySQL等RDBMS.更多精彩好文见www.jasongj.com

机器学习(一) 从一个R语言案例学线性回归

2015-03-29 09:11 郭俊 Jason

点击上方【大数据架构】可快速关注


写在前面的话   按照正常的顺序,本文应该先讲一些线性回归的基本概念,比如什么叫线性回归,线性回规的常用解法等。但既然本文名为《从一个R语言案例学会线性回归》,那就更重视如何使用R语言去解决线性回归问题,因此本文会先讲案例。


线性回归简介

  如下图所示,如果把自变量(也叫independent variable)和因变量(也叫dependent variable)画在二维坐标上,则每条记录对应一个点。线性回规最常见的应用场景则是用一条直线去拟和已知的点,并对给定的x值预测其y值。而我们要做的就是找出一条合适的曲线,也就找出合适的斜率及纵截矩。


SSE & RMSE

  上图中的SSE指sum of squared error,也即预测值与实际值之差的平方和,可由此判断该模型的误差。但使用SSE表征模型的误差有些弊端,比如它依赖于点的个数,且不好定其单位。所以我们有另外一个值去称量模型的误差。RMSE(Root-Mean-Square Error)。


欢迎关注本公众号【大数据架构】,长按下方二维码可快速关注。


 
大数据架构 更多文章 Merge Join VS. Hash Join VS. Nested Loop (一) Kafka设计解析(一) Kafka背景及架构介绍 SQL优化(二) 快速计算Distinct Count 分布式事务(一) 两阶段提交及JTA 跟着Jason学UML(一) 类图
猜您喜欢 oracle秘境探索之11g tablespace prellocation 数学居然还可以开导人生? Java线程面试题Top50 快速了解 OpenStack 架构 iOS应用层架构之CDD(附Demo)