在统计学及概率理论中,离散型均匀分布是离散型概率分布,其中有限个数值拥有相同的概率。离散型均匀分布的另一种说法为“有限个结果,各结果的概率均相同”。
离散型均匀分布
概率质量函数 ![Discrete uniform probability mass function for n=5](//upload.wikimedia.org/wikipedia/commons/thumb/6/6f/DUniform_distribution_PDF.png/325px-DUniform_distribution_PDF.png) n=5 where n=b-a+1 |
累积分布函数 ![Discrete uniform cumulative mass function for n=5](//upload.wikimedia.org/wikipedia/commons/thumb/c/c3/DUniform_distribution_CDF.png/325px-DUniform_distribution_CDF.png) |
参数 |
![{\displaystyle a\in (...,-2,-1,0,1,2,...)\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/64aaf366195efe4e542cc339a1c873bbe40e7a5b)
![{\displaystyle b\in (...,-2,-1,0,1,2,...)\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/29b4fcf5969f848f66e69d308b89b977d499e733)
![{\displaystyle n=b-a+1\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/37f7c435cbb8585d7847d0f70a6762f59811cb3f) |
---|
值域 |
![{\displaystyle k\in \{a,a+1,...,b-1,b\}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b362c6c529f9b9150c10d73b0ff70363b44b93f5) |
---|
概率质量函数 |
![{\displaystyle {\begin{matrix}{\frac {1}{n}}&{\mbox{for }}a\leq k\leq b\ \\0&{\mbox{otherwise }}\end{matrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/715fbb411ecaab4a69ec3aefc92c151747b113bc) |
---|
累积分布函数 |
![{\displaystyle {\begin{matrix}0&{\mbox{for }}k<a\\{\frac {k-a+1}{n}}&{\mbox{for }}a\leq k\leq b\\1&{\mbox{for }}k>b\end{matrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/251cebef62e6c0b04945bfd56c25285e917621b4) |
---|
期望 |
![{\displaystyle {\frac {a+b}{2}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/624d7fda7043e152affce9651f48c57b5b7d312a) |
---|
中位数 |
![{\displaystyle {\frac {a+b}{2}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/624d7fda7043e152affce9651f48c57b5b7d312a) |
---|
众数 |
N/A |
---|
方差 |
![{\displaystyle {\frac {n^{2}-1}{12}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/380e594b1fd09857b8934a8c3503bf2b12d24faf) |
---|
偏度 |
![{\displaystyle 0\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/db4b06f9315849466a0502680377e30a9da8a1b5) |
---|
峰度 |
![{\displaystyle -{\frac {6(n^{2}+1)}{5(n^{2}-1)}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/59d98fa702583a36ae69e3e46e9e22c7d684f2f0) |
---|
熵 |
![{\displaystyle \ln(n)\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/088a1e7ec29ce858570f7df4fab6b66c30ff25a5) |
---|
矩生成函数 |
![{\displaystyle {\frac {e^{at}-e^{(b+1)t}}{n(1-e^{t})}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7178154884e03f88b2d4255bb883fcdca1350416) |
---|
特征函数 |
![{\displaystyle {\frac {e^{iat}-e^{i(b+1)t}}{n(1-e^{it})}},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7930277f9ad4811b8ec11f277b37b758f7277b8b) |
---|
像均匀的骰子就是离散型均匀分布的例子,可能的值为1, 2, 3, 4, 5, 6,而每一个数字的概率都是1/6。但若同时丢二个均匀骰子,将其值相加,就不是离散型均匀分布了,因为各个和的概率不同。
离散型均匀分布常用来描述结果为数字的分布,不过离散型均匀分布也可以描述结果是有限集合的分布。例如随机置换就是由已知长度的置换中均匀随机产生的组合,而均匀生成树是由给定的树中均匀随机产生的生成树。
离散型均匀分布在本质上是非参数(non-parametric)的。不过要表示其值很容易,就用[a,b]之间的所有整数即可,因此a和b就是离散型均匀分布的主要参数(也常常改为考虑区间[1,n],只保留一个参数n)。若用这种表示法,针对任意k ∈ [a,b]的累积分布函数(CDF)为
![{\displaystyle F(k;a,b)={\frac {\lfloor k\rfloor -a+1}{b-a+1}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ca39cc71fd41495a748cc207b58ebfac455897d3)
我们将会讨论德国坦克问题的例子,将最大值估计应用于二战期间德国坦克产量的估计。
设k 个观测值的样本是从一下整数的均匀分布中获得的:
而问题就是估计未知的最大 N。
最大值的均匀最小方差无偏 (UMVU) 估计量为下列式子: 其中 m 是样本最大值,k 是样本大小,而且无放回抽样。 这可被看作为最大间距估计的一个非常简单的例子。
这个式子也有一个变样版本:
该式中的标准差被大约表示为 ,也就是样本之间差距的平均大小,与 作比较。
样本最大值是总体最大值的最大似然估计,然而,该方法存在偏差。
若样本没有编号但可被识别或标记,则可透过捕获再捕获方法以估计族群规模。
有关均匀分布随机排列的固定点数量的概率分布的说明,请参阅主条目。