# 随机变量与误差

绝对误差 Δx=xx0\Delta x=x-x_0你以为的(测量值)减去真实值
等精度测量和不等精度测量,这里讨论的都是等精度
相对误差 N=Δxx0N=\dfrac{\Delta x}{|x_0|}{},绝对误差除以真实值
真实值一般是不可能得到的,所以取约定真值(理论值 / 公认值),或者取多次测量的平均值 xˉ\bar x

系统误差:大小、正负有某种规律
随机误差
存在多种分布形式,一般是正态分布,它是一种连续分布
连续型随机变量的期望定义为 E(x)=+xf(x)dxE(x)=\displaystyle\int_{-\infty}^{+\infty} xf(x) {\rm d}x
连续型随机变量的方差定义为 D(x)=+[xE(x)]2f(x)dxD(x)=\displaystyle\int_{-\infty}^{+\infty} [x-E(x)]^2f(x) {\rm d}x
正态分布密度函数 f(x)=1σ2πe(xμ)22σ2f(x)=\dfrac{1}{\sigma\sqrt{2\pi}}e^{\tfrac{-(x-\mu)^2}{2\sigma^2}}{}
μ\mu 为期望(平均值),σ\sigma标准差
平均值附近的区间 (μkσ,μ+kσ)(\mu-k\sigma,\mu+k\sigma) 称为置信区间,其中 kk 为置信因子,这个区间上的概率称为置信概率;正态分布中 k=3k=3 的置信概率达到了 99.73%,可以认为这个区间以外的数据异常(3σ 原则)

有限(nn)次测量
样本平均值 xˉ=1nnxi\bar x=\dfrac 1n \sum\limits^n x_i
样本方差 Sn^2=1n1n(xixˉ)2\hat{S_n}^2=\dfrac {1}{n-1} \sum\limits^n (x_i-\bar x)^2
理解上,这个式子是 “Σ 频率 × 数据”;记真实的方差为 σ2\sigma^2,真实的平均值为 μ\mu
为什么是 n1n-1 而不是 nn这里做了详细推导。结论:除以 n1n-1 的值是 “无偏估计”,也就是说这个值将回归到真实的方差 σ2\sigma^2;而如果除以 nn,得到的结果是 n1nσ2\dfrac{n-1}{n}\sigma^2,这个数只有在 nn \to \infty 时才为真实的方差。理解上:给出的这个公式计算方差之前已经定好了样本平均值,也就是已经选定了 nn 个数,这使得只要确定 n1n-1 个数,最后一个数就已经确定了;而如果将上面的公式中 xˉ\bar x 改为真实的平均值 μ\mu,那么就要除以 nn 而不是 n1n-1,因为真实平均值并没有限定这 nn 个数,选定了 n1n-1 个数之后,最后一个数无法确定。还有一种更傻瓜式的解读,样本的方差一般是要比总体的方差要低一些,所以要除以一个较小的数使得总体方差稍微大一些。

任意一次测量的实验标准偏差 Sx=n(xixˉ)2n1{S_x}=\sqrt{\dfrac {\sum\limits^n (x_i-\bar x)^2}{n-1}}{}(贝塞尔公式)
平均值的实验标准偏差 Sxˉ=SxnS_{\bar x}=\dfrac{S_x}{\sqrt n}{}

三个 “精度”

  • 精密度 Precision 指数据比较集中
  • 准确度 Correctness 指数据平均值离真实值比较近(数据均匀分布在真实值周边)
  • 精确度 Accuracy 指精密度和准确度都很好

# 不确定度

  • A 类标准不确定度:用统计方法计算得出的不确定度
  • B 类标准不确定度:用其他方法计算得出的不确定度

对某一被测的量,做了 nn 次等精度独立测量,则:

  • 任意一次测量的 A 类标准不确定度 uA(x)=Sx=n(xixˉ)2n1u_A(x)=S_x=\sqrt{\dfrac {\sum\limits^n (x_i-\bar x)^2}{n-1}}{}
  • 平均值的 A 类标准不确定度 uA(xˉ)=Sxˉ=n(xixˉ)2n(n1)u_A(\bar x)=S_{\bar x}=\sqrt{\dfrac{\sum\limits^n (x_i-\bar x)^2}{n(n-1)}}{}
  • 记测量仪器本身的允许误差极限为 Δins\Delta_{\rm ins}{},置信因子为 kk,则 B 类标准不确定度 uB=Δinsku_B=\dfrac{\Delta_{\rm ins}}{k}{}。其中
    • 当测量误差服从均匀分布(如电子计数器的量化、仪器刻度盘示值的分辨力、平衡指示仪的调零、度盘与齿轮的空程差、数据切尾等)、置信概率取 100% 时,经计算可知 k=3k=\sqrt 3
    • Δins\Delta_{\rm ins}{} 可以近似等于最小分度值的一半

合成标准不确定度 uC=uA2+uB2u_C=\sqrt{u_A^2+u_B^2}{},若有若干组不同的 AB 类不确定度,则各自平方全部相加再开根号

# 测量结果的表示

对被测量 X,我们表示为 X=xˉ(uC)X=\bar x(u_C)(若只有一组值则 xˉ=x\bar x=x),例如 L=114.51(0.05)mmL=114.51(0.05) \rm mm,其中 114.51mm 是最佳估计值(最佳估计值带符号)

若是间接测量量,例如待测量 Φ\PhiNN 个相互独立的直接测量量的函数 Φ=F(x1,,xn)\Phi=F(x_1,\cdots,x_n),那么有标准不确定度传递公式 uC(Φ)=i=1N(Φxi)2uC2(xi)u_C(\Phi)=\sqrt{\sum\limits^N_{i=1}(\dfrac{\partial\Phi}{\partial x_i})^2u_C^2(x_i)}{},最后表示为 Φ=ϕ(uC(Φ))\Phi=\phi(u_C(\Phi))

标准相对不确定度 E=uCxE=\dfrac{u_C}x,其中 x 是最佳估计值,是一个无量纲数,一般表示成百分数

若是间接测量量,则由上面公式有 E=uC(Φ)Φ=i=1N(lnΦxi)2uC2(xi)E=\dfrac{u_C(\Phi)}{\Phi}=\sqrt{\sum\limits^N_{i=1}(\dfrac{\partial ln\Phi}{\partial x_i})^2u_C^2(x_i)}{}

# 有效数字

有效数字与单位无关,114.5mm=11.45cm=0.1145m,始终是 4 位有效数字

修约:四舍六入五凑偶。

  • ≤4 ,直接舍去
  • ≥6 ,进一
  • 若为 5
    • 当 5 后有有效数字时,进一
    • 当 5 后无有效数字时
      • 5 前为奇数时,进一凑成偶数
      • 5 前为偶数时,直接舍去

举例:保留两位小数

  • 9.8249≈9.82
  • 9.82671≈9.83
  • 9.8350≈9.84
  • 9.83501≈9.84
  • 9.8250≈9.82
  • 9.82501≈9.83

有效数字之间的运算

  • 准确值与准确值运算得准确值,可疑值与可疑值运算得可疑值
  • 准确值与可疑值运算得可疑值,进位数字视为准确值
  • 加减 保留小数点后位数最少的
  • 乘除 保留有效数字最低的
  • 乘方开方 保留精度与底数精度相同
  • 对数 保留精度比真数精度多一位(或者相同)

不确定度有效数字只能取 1-2 位,不确定度第一位个有效数字是 1 或 2 时,取两位;是 3 及以上时,取 1 位

# 数据处理

列表、作图法
逐差法(不是超级大邻差,那个只适用于计算含有 Δs\Delta s 的)
残差 e^i=yiy^i\hat e_i=y_i-\hat y_i,唯一一个 “真实的 - 你以为的”,其他的都是 “你以为的 - 真实的”

相关系数 r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r=\dfrac{\sum\limits(x_i-\bar x)(y_i-\bar y)}{\sqrt{\sum\limits(x_i-\bar x)^2}\sqrt{\sum\limits(y_i-\bar y)^2}}{}
r[1,1]r \in [-1,1],相关系数越靠近 1,越线性正相关;相关系数越靠近 - 1,越线性负相关

最小二乘法
y^=b^x+a^\hat y=\hat bx+\hat a,其中
b^=(xixˉ)(yiyˉ)(xixˉ)2\hat b=\dfrac{\sum\limits(x_i-\bar x)(y_i-\bar y)}{\sum\limits(x_i-\bar x)^2}{}
a^=yˉb^xˉ\hat a=\bar y-\hat b\bar x

相关指数 R2=1(yiy^)2(yiyˉ)2R^2=1-\dfrac{\sum\limits(y_i-\hat y)^2}{\sum\limits(y_i-\bar y)^2}{}
相关指数越大,残差平方和越小,拟合效果越好;相关指数越小,残差平方和越大,拟合效果越差