置信概率与置信区间（confidence interval）以及在物理实验中的应

发布时间：2022-12-20 17:08:32 所属栏目：应用来源：转载

导读： 前言：想必带火在做物理实验的时候遇到过这个.对于没学概率论的hxd看懂需要一些前置知识,比如一些常见分布的表达式,常用的微积分知识,期望,方差的定义之类的(不过没学的应该也不会点开看吧

前言：想必带火在做物理实验的时候遇到过这个.对于没学概率论的hxd看懂需要一些前置知识,比如一些常见分布的表达式,常用的微积分知识,期望,方差的定义之类的(不过没学的应该也不会点开看吧).

一、定义：

Definition 1 采样分布 Sampling Distribution

有一系列随机变量\textbf{X}=(X_1,X_2,\dots,X_n),\\它们能生成一个包含未知参数\theta分布T,T=r(X_1,X_2,\dots,X_n,\theta).\\ 对于给定的\theta,我们称此时的T为T的采样分布。

Definition 2 卡方分布 The Chi-Square Distributions

卡方分布是一种特殊的分布（我们称卡方分布为伽马分布族中的一个子集）。

它可以用来描述一个正态分布采样的采样方差。

2.1 pdf,mean,varience

0\\ &0,otherwise\\ E(X)&=m\\ Var(X)&=2m\\ \end{align*}">对于正整数m，我们称\Gamma（\frac{m}2,\frac12）为具有m个自由度的\mathcal{X}^2分布。\\ 对于随机变量X\sim\mathcal{X}^2,它的pdf如下：\\ \begin{align*} f（x）&=\frac1{2^{m/2}\Gamma(m/2)}x^{m/2-1}e^{-x/2},x>0\\ &0,otherwise\\ E(X)&=m\\ Var(X)&=2m\\ \end{align*}

2.2 some qualities

2.2.1

对于iid的变量(X_i)_{i=1}^n,X_i\sim \mathcal{X}^2(m_i),Y=\sum_{i=1}^nX_i,\\那么Y服从自由度为\sum_{i=1}^nm_i的卡方分布

2.2.2

X\sim N(0,1),Y=X^2\sim \mathcal{X}^2(1)\\

证明：对Y的cdf求导，易证.

2.2.3

由性质2.2.1和2.2.2，我们得到推论：

对于iid的随机变量(X_i)_{i=1}^m\sim N(0,1),我们有\\ \sum_{i=1}^mX_i^2\sim\mathcal{X}^2(m)

2.2.4（重要）

对于服从正态分布N(\mu,\sigma^2)的一系列随机采样(X_i)_{i=1}^n,\\它们的采样均值(sample\ mean)\overline{X}_n=\frac{\sum X_i}{n}\\ 和采样方差(sample\ varience)S_n^2=\frac{1}{n-1}\sum(X_i-\overline{X}_n)^2\\ 是两个独立的随机变量.\\ 且它们服从以下分布:\\ \overline{X}_n\sim N(\mu,\sigma^2/n)\\ (n-1)S_n^2/\sigma^2\sim \mathcal{X}^2(n-1)

证明:正态分布的叠加,不易证但不想码.

标注:仅当采样服从正态分布时,采样均值和采样方差才相互独立.

这里的采样方差也是我们物理实验中常见的"测量值标准差"的平方(excel表格中的STDEV.J函数)

采样方差的来源是因为它是对一系列随机采样的方差的无偏估计(unbiased estimator)

要学会查卡方分布表.

Definition 3 t-分布t-distributions

Y和Z独立,且Y\sim \mathcal{X}^2(m),Z\sim N(0,1)\\ X=\frac{Z}{(Y/m)^{\frac {1} {2}}}\\ 我们称X为自由度为m的t分布

当我们的采样数据服从正态分布N(\mu,\sigma^2)时\\ 我们知道,对于随机变量Z=\frac{\hat{\mu}-\mu}{\sigma/\sqrt{n}},Z服从标准正态分布(见CLT相关的章节)\\ 倘若我们不知道该正态分布的方差,\\那我们可以把Z中的\sigma替换为估计值(sample\ varience).\\ 此时,我们称该随机变量Z服从自由度为n-1的t分布.

标注:t分布的好处在于即使我们不知道原分布的方差和期望,我们依然可以对该期望作出估计.

3.1 pdf,mean

p(x)=\frac{\Gamma(\frac{m+1}2)}{(m\pi)^{\frac12}\Gamma(\frac{m}2)}(1+\frac{x^2}{m})^{-(m+1)/2},-\infty

当m1时,由于对称性,t分布的期望为0

3.2

我们易知

U=\frac{n^{\frac12}(\overline{X}_n-\mu)}{(\frac{S_n^2}{n-1})^{\frac12}} \\ U服从t分布

Definition 4 F-分布 F-Distributions

有Y,W两个随机变量应用概率论，均服从卡方分布，且自由度为m和n，\\我们定义一个新的随机变量X，满足：\\ X=\frac{Y/m}{W/n},\\ 那么我们称X服从自由度为m和n的F分布

3.1 pdf，moments

0\\ 0,otherwise">对于自由度为m和n，的F分布\\ f_X(x)=\frac{\Gamma(\frac12(m+n))m^{m/2}n^{n/2}}{\Gamma(\frac12 m)\Gamma(\frac12n)}\cdot \frac{x^{(m/2)-1}}{(mx+n)^{(m+n)/2}},x>0\\ 0,otherwise \

证明：换元法求联合分布，易证。

E(X^k)=(\frac{n}{m})^kE(U^k)E(V^{-k})\\ X=(U/m)/(V/n)

Definition 5 置信区间 confidence interval

我们对随机变量X有一系列采样(X_i)_{i=1}^n,X的pdf为f(x;\theta).\\ g（）为实函数\\ \alpha\in(0,1)\\ L=L(X_1,\dots,X_n)\\ U=U(X_1,\dots,X_n)\\ 是两个统计量（赋值后的估测函数）当有：\\ \mathbf{P}_\theta(L

Definition 6 单边置信区间 one-sided confidence interval

g(\theta))\geq1-\alpha\\ ">与置信区间类似，我们有两个单边置信区间\\ (L,\infty),(-\infty,U),满足：\\ \mathbf{P}(Lg(\theta))\geq1-\alpha\\

二、运用

Example 1 正态分布均值的置信区间 confidence intervals for the mean of a Normal Distribution

1.1 当该正态分布的方差已知时

z_{\alpha/2})=\alpha/2">我们对服从正态分布的N(\mu,\sigma^2)的随机变量X进行n次随机采样\\(X_i)_{i=1}^n,\sigma已知\\ 对于\alpha\in(0,1),服从以下定义的区间(L,U)即位\mu 的置信区间：\\ L=\overline{X}_n-z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\\ U=\overline{X}_n+z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\\ z_{\alpha/2}的值满足\mathbf{P}(X>z_{\alpha/2})=\alpha/2

证明：显然

1.2 当该正态分布方差未知时

t_{\alpha/2,n-1})=\alpha/2">我们对服从正态分布的N(\mu,\sigma^2)的随机变量X进行n次随机采样\\(X_i)_{i=1}^n,\sigma未知\\ 对于\alpha\in(0,1),服从以下定义的区间(L,U)即位\mu 的置信区间：\\ L=\overline{X}_n-t_{\alpha/2,n-1}\frac{S_n}{\sqrt{n}}\\ U=\overline{X}_n+t_{\alpha/2,n-1}\frac{S_n}{\sqrt{n}}\\ 对于服从t分布且自由度为n-1的随机变量，t_{\alpha/2,n-1}的取值如下：\\ \mathbf{P}(X>t_{\alpha/2,n-1})=\alpha/2

证明：显然

1.3 考虑单边置信区间且方差未知时

L=\overline{X}_n-t_{\alpha,n-1}\frac{S_n}{\sqrt{n}}\\ U=\overline{X}_n+t_{\alpha,n-1}\frac{S_n}{\sqrt{n}}\\

Example 2 正态分布方差的置信区间 confidence intervals for the varience of a Normal Distribution

类似的，\\ L=\frac{(n-1)S_n^2}{\mathcal{X}_{\alpha/2,n-1}^2}\\ U=\frac{(n-1)S_n^2}{\mathcal{X}_{1-\alpha/2,n-1}^2}\\

注意，由于卡方分布并不是关于x=0轴对称的分布（定义域为0到正无穷），因此并不能完全照抄Example 1中的写法。

证明：利用（n-1）\frac{S_n^2}{\sigma^2}\sim \mathcal{X}^2(n-1) 易得

Example 3 估测两个正态分布的样本均值之差时(方差已知)

X\sim N(\mu_1,\sigma_1^2)\\ Y\sim N(\mu_2,\sigma_2^2)\\ 对X做n次采样(X_i)_{i=1}^n,对Y做m次采样(Y_i)_{i=1}^m\\ 有:\\ \mathbf{P}(L

（编辑：92站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!