微信号:Rsq-9527

介绍:"R语言"交流讨论

R语言常见离散分布及相关函数

2016-09-01 16:16 笙戌公子

二项分布 
一次试验有成功和失败两个独立结果,其发生概率分别为p和1-p。则n次试验后成功发生的次数符合伯努利分布。 
f(x) = choose(n,x) * p^x * (1-p)^(n-x) 
E(X)=np; Var(x)=np(1-p) 

产生随机样本: 
rbinom(n, size, prob) 
#抛10次硬币为一次实验,做1000次实验。则n=1000,size=10。 
#prob为成功的概率 
#size=1即为伯努利试验 

密度函数: 
dbinom(x, size, prob):x发生的概率 
pbinom(q, size, prob):≤q的事件累积概率 
qbinom(p, size, prob):累积概率p对应的q 

#x、q为实验结果;p为累积概率。

##############################################################

多项分布 
一次试验有k个独立结果,其发生概率分别为p1、p2...。则n次试验后各结果发生的次数符合多项分布。 

产生随机样本: 
rmultinom(n, size, prob) 
#抛10次骰子为一次实验,做1000次实验。则n=1000,size=10。 
#prob为每个独立结果出现的概率,其总和为1。 
#结果为k×n的矩阵,k即length(prob) 

密度函数: 
dmultinom(x, size, prob) 

#x和prob是两个长度相等的向量。

##############################################################

负二项分布 
伯努利试验重复进行,成功的概率为p,直到出现r次成功。则试验失败的次数符合负二项分布。 
f(x)=choose(x+r-1, r-1) * p^r * (1-p)^x 
E(X)=r(1-p)/p; Var(x)= r(1-p)/(p^2) 

产生随机样本: 
rnbinom(n, size, prob) 
#连续抛硬币,出现5次正面为一次实验,做1000次实验。则n=1000,size=5。 
#prob为成功的概率 
#r=1即为几何分布 

密度函数: 
dnbinom(x, size, prob) 
pnbinom(q, size, prob) 

qnbinom(p, size, prob)

##############################################################

超几何分布 
从装有n个白球和m个黑球的罐子里,取k个球,其中白球的个数符合超几何分布。 
f(x) = choose(n, x) choose(m, k-x) / choose(m+n, k) 
E(x)=k*n/(m+n) 
Var(x)=(k*n/(m+n)) * (n+m-k)/(n+m-1)) * (1-n/(n+m)) 
#前几个分布都是在试验之间相互独立的基础上得来的,而超几何分布中,前一次试验会对后一次试验产生影响。 
#当n+m→∞,则超几何分布近似于二项分布。 

产生随机样本: 
rhyper(nn, m, n, k) 
#nn为实验次数,m为白球个数,n为黑球个数,k为每次实验取出小球个数。 

密度函数: 
dhyper(x, m, n, k) 
phyper(q, m, n, k) 

qhyper(p, m, n, k)

##############################################################

泊松分布: 
单位量度内某一事件的发生次数。 
p(x) = λ^x * exp(-λ)/x! 
E(x)=Var(x)=λ 

产生随机样本: 
rpois(n, λ) 

密度函数: 
dpois(x, λ) 
ppois(q, λ) 
qpois(p, λ) 


 
R语言社区 更多文章 构造拟合公式的几个技巧——R语言 MySQL索引的注意事项和优化方法 MySQL累积求和 K-近邻算法的R实现 K-近 邻 算 法 概 述 (KNN)
猜您喜欢 文章精选:数据用户需要什么数据? 腾讯大数据套件带你玩转大数据 50W+年薪,用友友金所招大牛啦! 架构变革迫在眉睫 大数据没你寸步难行 关于面试的那些事儿(1)