置信概率与置信区间(confidence interval)以及在物理实验中的应
前言:想必带火在做物理实验的时候遇到过这个.对于没学概率论的hxd看懂需要一些前置知识,比如一些常见分布的表达式,常用的微积分知识,期望,方差的定义之类的(不过没学的应该也不会点开看吧). 一、定义: Definition 1 采样分布 Sampling Distribution 有一系列随机变量\textbf{X}=(X_1,X_2,\dots,X_n),\\它们能生成一个包含未知参数\theta分布T,T=r(X_1,X_2,\dots,X_n,\theta).\\ 对于给定的\theta,我们称此时的T为T的采样分布。 Definition 2 卡方分布 The Chi-Square Distributions 卡方分布是一种特殊的分布(我们称卡方分布为伽马分布族中的一个子集)。 它可以用来描述一个正态分布采样的采样方差。 2.1 pdf,mean,varience 0\\ &0,otherwise\\ E(X)&=m\\ Var(X)&=2m\\ \end{align*}">对于正整数m,我们称\Gamma(\frac{m}2,\frac12)为具有m个自由度的\mathcal{X}^2分布。\\ 对于随机变量X\sim\mathcal{X}^2,它的pdf如下:\\ \begin{align*} f(x)&=\frac1{2^{m/2}\Gamma(m/2)}x^{m/2-1}e^{-x/2},x>0\\ &0,otherwise\\ E(X)&=m\\ Var(X)&=2m\\ \end{align*} 2.2 some qualities 2.2.1 对于iid的变量(X_i)_{i=1}^n,X_i\sim \mathcal{X}^2(m_i),Y=\sum_{i=1}^nX_i,\\那么Y服从自由度为\sum_{i=1}^nm_i的卡方分布 2.2.2 X\sim N(0,1),Y=X^2\sim \mathcal{X}^2(1)\\ 证明:对Y的cdf求导,易证. 2.2.3 由性质2.2.1和2.2.2,我们得到推论: 对于iid的随机变量(X_i)_{i=1}^m\sim N(0,1),我们有\\ \sum_{i=1}^mX_i^2\sim\mathcal{X}^2(m) 2.2.4(重要) 对于服从正态分布N(\mu,\sigma^2)的一系列随机采样(X_i)_{i=1}^n,\\它们的采样均值(sample\ mean)\overline{X}_n=\frac{\sum X_i}{n}\\ 和采样方差(sample\ varience)S_n^2=\frac{1}{n-1}\sum(X_i-\overline{X}_n)^2\\ 是两个独立的随机变量.\\ 且它们服从以下分布:\\ \overline{X}_n\sim N(\mu,\sigma^2/n)\\ (n-1)S_n^2/\sigma^2\sim \mathcal{X}^2(n-1) 证明:正态分布的叠加,不易证但不想码. 标注:仅当采样服从正态分布时,采样均值和采样方差才相互独立. 这里的采样方差也是我们物理实验中常见的"测量值标准差"的平方(excel表格中的STDEV.J函数) 采样方差的来源是因为它是对一系列随机采样的方差的无偏估计(unbiased estimator) 要学会查卡方分布表. Definition 3 t-分布t-distributions Y和Z独立,且Y\sim \mathcal{X}^2(m),Z\sim N(0,1)\\ X=\frac{Z}{(Y/m)^{\frac {1} {2}}}\\ 我们称X为自由度为m的t分布 当我们的采样数据服从正态分布N(\mu,\sigma^2)时\\ 我们知道,对于随机变量Z=\frac{\hat{\mu}-\mu}{\sigma/\sqrt{n}},Z服从标准正态分布(见CLT相关的章节)\\ 倘若我们不知道该正态分布的方差,\\那我们可以把Z中的\sigma替换为估计值(sample\ varience).\\ 此时,我们称该随机变量Z服从自由度为n-1的t分布. 标注:t分布的好处在于即使我们不知道原分布的方差和期望,我们依然可以对该期望作出估计. 3.1 pdf,mean p(x)=\frac{\Gamma(\frac{m+1}2)}{(m\pi)^{\frac12}\Gamma(\frac{m}2)}(1+\frac{x^2}{m})^{-(m+1)/2},-\infty 当m1时,由于对称性,t分布的期望为0 3.2 我们易知 U=\frac{n^{\frac12}(\overline{X}_n-\mu)}{(\frac{S_n^2}{n-1})^{\frac12}} \\ U服从t分布 Definition 4 F-分布 F-Distributions 有Y,W两个随机变量应用概率论,均服从卡方分布,且自由度为m和n,\\我们定义一个新的随机变量X,满足:\\ X=\frac{Y/m}{W/n},\\ 那么我们称X服从自由度为m和n的F分布 3.1 pdf,moments 0\\ 0,otherwise">对于自由度为m和n,的F分布\\ f_X(x)=\frac{\Gamma(\frac12(m+n))m^{m/2}n^{n/2}}{\Gamma(\frac12 m)\Gamma(\frac12n)}\cdot \frac{x^{(m/2)-1}}{(mx+n)^{(m+n)/2}},x>0\\ 0,otherwise \ 证明:换元法求联合分布,易证。 E(X^k)=(\frac{n}{m})^kE(U^k)E(V^{-k})\\ X=(U/m)/(V/n) Definition 5 置信区间 confidence interval 我们对随机变量X有一系列采样(X_i)_{i=1}^n,X的pdf为f(x;\theta).\\ g()为实函数\\ \alpha\in(0,1)\\ L=L(X_1,\dots,X_n)\\ U=U(X_1,\dots,X_n)\\ 是两个统计量(赋值后的估测函数) 当有:\\ \mathbf{P}_\theta(L Definition 6 单边置信区间 one-sided confidence interval g(\theta))\geq1-\alpha\\ ">与置信区间类似,我们有两个单边置信区间\\ (L,\infty),(-\infty,U),满足:\\ \mathbf{P}(Lg(\theta))\geq1-\alpha\\ 二、运用 Example 1 正态分布均值的置信区间 confidence intervals for the mean of a Normal Distribution 1.1 当该正态分布的方差已知时 z_{\alpha/2})=\alpha/2">我们对服从正态分布的N(\mu,\sigma^2)的随机变量X进行n次随机采样\\(X_i)_{i=1}^n,\sigma已知\\ 对于\alpha\in(0,1),服从以下定义的区间(L,U)即位\mu 的置信区间:\\ L=\overline{X}_n-z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\\ U=\overline{X}_n+z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\\ z_{\alpha/2}的值满足\mathbf{P}(X>z_{\alpha/2})=\alpha/2 证明:显然 1.2 当该正态分布方差未知时 t_{\alpha/2,n-1})=\alpha/2">我们对服从正态分布的N(\mu,\sigma^2)的随机变量X进行n次随机采样\\(X_i)_{i=1}^n,\sigma未知\\ 对于\alpha\in(0,1),服从以下定义的区间(L,U)即位\mu 的置信区间:\\ L=\overline{X}_n-t_{\alpha/2,n-1}\frac{S_n}{\sqrt{n}}\\ U=\overline{X}_n+t_{\alpha/2,n-1}\frac{S_n}{\sqrt{n}}\\ 对于服从t分布且自由度为n-1的随机变量,t_{\alpha/2,n-1}的取值如下:\\ \mathbf{P}(X>t_{\alpha/2,n-1})=\alpha/2 证明:显然 1.3 考虑单边置信区间且方差未知时 L=\overline{X}_n-t_{\alpha,n-1}\frac{S_n}{\sqrt{n}}\\ U=\overline{X}_n+t_{\alpha,n-1}\frac{S_n}{\sqrt{n}}\\ Example 2 正态分布方差的置信区间 confidence intervals for the varience of a Normal Distribution 类似的,\\ L=\frac{(n-1)S_n^2}{\mathcal{X}_{\alpha/2,n-1}^2}\\ U=\frac{(n-1)S_n^2}{\mathcal{X}_{1-\alpha/2,n-1}^2}\\ 注意,由于卡方分布并不是关于x=0轴对称的分布(定义域为0到正无穷),因此并不能完全照抄Example 1中的写法。 证明:利用 (n-1)\frac{S_n^2}{\sigma^2}\sim \mathcal{X}^2(n-1) 易得 Example 3 估测两个正态分布的样本均值之差时(方差已知) X\sim N(\mu_1,\sigma_1^2)\\ Y\sim N(\mu_2,\sigma_2^2)\\ 对X做n次采样(X_i)_{i=1}^n,对Y做m次采样(Y_i)_{i=1}^m\\ 有:\\ \mathbf{P}(L (编辑:92站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |