从几个相关的定义开始:
1.随机测试(简称测试)
对随机事件的观察称为随机实验,它有三个特点:1 .重复性,2。可观察性和3。随机性
2.随机事件(称为事件)
在随机测试中,我们不仅要观察测试过程,还要观察测试结果是否具有一定的可观察特征。例如,在掷骰子测试中,我们观察偶数点或奇数点出现的次数。
3.可能性、频率和概率
以买彩票为例,买彩票可能中奖,也可能不中奖,这就是可能性。如果不是用严格的数学定义来区分,可以算出概率,接近某个值,算出频率。两者的相关性在于概率是频率的稳定值,即进行N次抛硬币实验。当每次实验次数达到一定数量时,N次实验中面朝上的频率接近概率,该频率可以作为概率的估计。但它不等同于概率。概率是一个理想值,它有时与实际发生的情况不同。在很多题目中,都会出现“用频率来表示概率”。因此,买彩票有两种可能,即中奖或不中奖。这里,50%指的是可能性。如果赢十次的频率为0,不代表赢的概率为0。当试玩次数趋近于无穷大时,获胜的频率相当于概率。
4.随机变量及其分布
在一个随机变量中,人们不仅对特定事件发生的概率感兴趣,还关心一个与随机测试结果相关的变量。因为这个变量的值取决于测试结果,测试结果是不确定的,所以这个变量的值是不确定的。这个变量叫做随机变量。对于随机变量,人们无法准确预测确切的数值,但人们可以研究数值的统计规律性。随机变量统计规律性的完整描述是
5.离散和连续随机变量及其分布
离散随机变量的所有可能值只有有限或可数无穷大,这类似于经典概率型事件的总数。所有随机变量对应的概率分布类似于点的分布,连续随机变量的值类似于区间。因为连续随机变量获得某个值的概率可能为零,所以更多的关注值落入某个范围的概率,而不是某个点的概率。
6.平均值和期望值
平均值是已有样本的统计量,期望是概率论的一个特征,因为概率是频率随样本趋于无穷大的极限,期望是平均值随样本趋于无穷大的极限,期望是加权平均值。
比如你掷骰子六次,点数分别为2、3、4、1、5,那么平均点数为3,但是按照每个点出现概率的1/6计算出来的期望值并不是3,也就是说,如果n是无穷大,那么平均后每次测试的平均点数就会接近期望值。简而言之,平均值用于现有情况的统计分析,期望值是对未来情况的概率估计。
以上都没有
聊的概念有助于理解高中数学中常见的分布列。一.高中阶段常见的离散型分布列
1.两点分布
2.二项分布
关于上述两种分布先了解什么是伯努利试验,如下:
伯努利试验(Bernoulli experiment)是在同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验只有两种可能结果:发生或者不发生。
特点是事件A在每次试验中发生的概率均为p,且不受其他各次试验中A是否发生的影响,即每次试验结果均具有相互独立性。
进行一次伯努利试验的随机变量的分布即为两点分布,课本中对此类问题的描述不够全面,可以扩展为一类特殊的随机变量有n个不同的取值,且每个取值的可能性均相同,在这里没必要细说。
二项分布是高考中考查最多的分布类型,很多人分不清它与超几何分布的区别,先看下面课本上对二项分布的描述:

这里的“二项”可理解为两层含义,一是只有两个结果,成功失败,善恶,美丑等等,二是其符合二项式(p+q)^n展开式通项公式的形式。
二项分布中的变量为n,p,当n无穷多且p接近0.5时,二项分布的概率函数接近于正态分布,在二项分布中我们需要一个已知的事件发生的概率,如果不知道概率,很多题目中会注明可把频率当概率,上面提到了频率和概率的差别,因此若没有对应的字眼,则就不属于二项分布。
另外二项分布是一种放回的试验,因为放回,样本总数不发生变化,事件A发生的概率也没有变化,这是与超几何分布最大的区别,超几何分布是一种不放回的试验,每做一次,样本总数发生变化,事件A发生的概率每次都不同。
关于二项分布分布需要注意n次试验中恰好发生k次以及恰好第k次发生的区别。
因此一个完整的二项分布的流程如下:
1.确定出做某项事情的次数n,例如相亲10次。
2.两个确定的结果,看对眼或看不上,不存在养鱼的情况
3.每次成功的概率相同,结合自身的颜值财力等等确定出每次相亲成功的概率为20%
4.求n次试验中成功的次数,即10次相亲能有几次会让自己脱单?
3.超几何分布
超几何分布是一种不放回一次性抽取的随机变量分布类型,常伴随任取XX个的字眼,书上关于超几何分布的描述如下:

从定义中能看出如下两点:
1.变量为N(样本总数),M(次品总数),n(抽取的件数),与次品率无关
2.仅抽取一次做试验,例如n=3件,逐个确定是否为次品,因此每次都影响剩余的次品率,隐藏的p每次都变化,有一个例子最能描述超几何分布概率的变化,即俄罗斯轮盘赌,第一个人和第二个人中枪的概率绝对不同。
以上内容就能大致判断出二项分布和超几何分布的区别,由于此类问题的出题背景千差万别,因此不给出具体的案例,几乎每套试题中都会出现相应的题目,平时多留意多注意区别即可,给出一个基础性的案例,如下:
1.8个题目中甲能答对6个题目,从8个题目中任选4个进行作答,用X表示甲能答对题目的个数,求出随机变量X的数学期望。
2.这8个题目中乙也能答对6个,每次取一个题目,取出放回,以答对的频率来估计答对的概率,若连续取4次,求乙答对个数X的数学期望。
具体的不过不再给出,仔细理解其中的差别即可,这种题目无论是哪种分布都需要根据实际问题确定出所有的随机变量X的取值,不可遗漏。
至于高中阶段常见的连续型分布列的代表正态分布,考查的次数并不多,近期看有没有比较有新意的正态分布题目,攒够了再分析出来。
