
2.2 定量分析中的误差
定量分析的核心是准确的量的概念!无论采用何种分析方法测定物质组分含量,都离不开测量某些物理量。如测量质量、体积、吸光度等。凡是测量就有误差存在。研究误差的目的是要对自己实验所得的数据进行处理,判断其最接近的值是多少,可靠性如何,正确处理实验数据,充分利用数据信息,以便得到最接近真实的最佳结果。
减小测量误差是定量分析工作的重要内容之一。
2.2.1 误差的分类及减免
根据误差产生的原因及其性质的不同,误差可分为两大类❷:系统误差和随机误差。
(1)系统误差
① 系统误差产生的原因 系统误差按照产生的原因,可以分为以下几类。
a.方法误差 由测定方法的不完善造成。如反应不完全、干扰成分的影响、指示剂选择不当等。
b.试剂误差 由试剂或蒸馏水造成。如纯度不够、带入待测组分或干扰组分等。
c.仪器误差 由测量仪器本身缺陷造成。如容量器皿刻度不准又未经校正、电子仪器“噪声”过大等。
d.操作误差 又称“主观误差”,是由操作人员主观或习惯上的原因造成的。如:称取试样时未注意防止试样吸湿;洗涤沉淀时洗涤过分或不充分;观察颜色偏深或偏浅;读取刻度值时,有时偏高或偏低;第二次读数总想与第一次读数重复等。
上述各因素中,方法误差有时不被人们察觉,带来的影响也比较大。因此,在选择方法时应特别注意。
② 系统误差的性质 系统误差是由某些固定的原因造成的,它具有重复性、单向性和可测性。
a.重复性 同一条件下,重复测定中重复地出现。
b.单向性 测定结果系统偏高或偏低。
c.可测性 误差大小基本不变,对测定结果的影响比较恒定。所以,系统误差也称为“可测误差”。
可见,系统误差总是以相同的大小和正负号重复出现,其大小可以测定出来,通过校正的方法就能将其消除。
(2)随机误差
随机误差又称“偶然误差”,它是由一些无法控制的不确定的偶然因素所致。如测量时环境温度、湿度、气压以及污染的微小波动,分析人员对各份试样处理时的微小差别等。这类误差值时大时小,时正时负,难以找到具体的原因,更无法测量它的值。但从多次测量结果的误差来看,仍然符合一定的规律。
实际工作中,随机误差与系统误差并无明显的界限,当人们对误差产生的原因尚未认识时,往往把它当作随机误差对待。
随机误差要用数理统计的方法来处理。在统计学中,通常将随机变量x取值的全体称为“总体”,而从总体中随机抽取一组测量值x1, x2, x3, …, xn称为“样本”。当测定次数无限多时,则得到随机误差的正态分布曲线(见图2.4)。图2.4中横坐标表示随机误差的值,纵坐标表示误差出现的概率大小。正态分布曲线直观地表明了在同一总体的无限多次测量中,各种可能的测量值的分布情况。
图2.4 随机误差的正态分布曲线
由正态分布曲线可以概括出随机误差分布的规律与特点:
① 对称性 大小相近的正误差和负误差出现的概率相等,误差分布曲线是对称的。
② 单峰性 小误差出现的概率大,大误差出现的概率小,很大误差出现的概率非常小。误差分布曲线只有一个峰值。
③ 有界性 误差有明显的集中趋势,即实际测量结果总是被限制在一定范围内波动。
由此可见,在消除系统误差的情况下,平行测定的次数越多,则测定值的算术平均值越接近真值,因而适当增加测定次数,取平均值表示结果,可以减少随机误差。
系统误差与随机误差的概念不同,在分析实践中除了极明显的情况外,常常难以判断和区别。任何分析结果总含有不确定度,它是系统不确定度和随机不确定度的综合结果。
表2.1所示为随机误差与系统误差的显著特征比较。
表2.1 随机误差与系统误差的显著特征比较
2.2.2 准确度与误差
理论上,试样中某一组分的含量必有一个客观存在的真实数值,即“真值❸”(µ)。在定量分析中常将以下的值当作真值来处理。
① 纯物质的理论值。
② 各国家标准机构以及相应的国际组织提供的标准物质(或标准参考物质)的证书上给出的数值。
③ 有经验的分析人员采用可靠的方法多次测量的结果的平均值,在确认消除了系统误差的前提下当作真值来处理。
(1)准确度
准确度是指测量值与真值相符合的程度。这种相符合的程度通常采用“误差”来表示。误差的大小反映了测量准确度的高低。误差的绝对值越小,结果的准确度就越高;误差的绝对值越大,结果的准确度就越低。
(2)误差
误差是指测定值(xi)与真值(µ)之差。误差的大小,可用绝对误差(Ea)和相对误差(Er)表示。
① 绝对误差 (2.2)
② 相对误差 (2.3)
建立误差概念的意义在于:当已知误差时,测量值扣除误差即为真值,这样就可以对真值进行估算了。
绝对误差和相对误差都有正值和负值。正值表示分析结果偏高,负值表示分析结果偏低。
例2.2 已知分析天平的称量误差(绝对误差)为 ±0.0001g,那么对称量得到的质量为0.2163g的试样的真实质量可为:
µ = xi – Ea = 0.2163 ± 0.0001(g)
即试样质量的真值在0.2162~0.2164g。
例2.3 分析天平称量两物体的质量各为1.6380g 和0.1637g,假定两者的真实质量分别为1.6381g和0.1638g,则两者称量的绝对误差分别为:
Ea = 1.6380 – 1.6381 = −0.0001(g)
E'a = 0.1637 – 0.1638 = −0.0001(g)
两者称量的相对误差分别为:
由此可见,绝对误差相等,相对误差并不一定相同,例2.3中第一个称量结果的相对误差为第二个称量结果相对误差的1/10。也就是说,同样的绝对误差,当被测定的量较大时,相对误差就比较小,测定的准确度就比较高。因此,用相对误差来表示各种情况下测定结果的准确度和正确性就更为确切些。但应注意,有时为了说明一些以前测定的准确度,用绝对误差更清楚。例如,分析天平称量的误差是±0.0001g,常量滴定管的读数误差是±0.01mL等,都是指绝对误差。
在实际测定中,因为误差是客观存在的,通常要在相同条件下对同一试样进行多次重复测定(即平行测定),获得一组数值不等的测定结果,试样的测定结果则用各次测定结果的平均值表示。此时,测定结果的绝对误差和相对误差分别用下式表示。
(2.4)
(2.5)
2.2.3 精密度与偏差
原始数据 是指采集到的未经整理的观测值。为了获得可靠的分析结果,一般总是在相同条件下对同一样品进行平行测定,然后取平均值。
平均值 是对数据组具有代表性的表达值。设一组平行测量值为:x1, x2, …, xn。若用平均值表示,则:
(2.6)
通常,平均值是一组平行测量值中出现可能性最大的值,因而是最可信赖和最有代表性的值,它代表了这组数据的平均水平和集中趋势,故人们常用平均值来表示分析结果。
中位数 一组平行测定的中心值亦可用中位数表示。将一组平行测定的数据按大小顺序排列,在最小值与最大值之间的中间位置上的数据称为“中位数”。当测定数据为奇数时,居中者为中位数;当测定数据为偶数时,则中间数据对的算术平均值即为中位数。
例如以下9个数据:
10.10,10.20,10.40,10.46,10.50,10.54,10.60,10.80,10.90
中位数10.50与平均值一致。
若在以上数据组中再增加一个数据12.80,即:
10.10,10.20,10.40,10.46,10.50,10.54,10.60,10.80,10.90,12.80
则中位数为,而平均值为10.73。
平均值10.73比数据组中相互靠近的三个数据10.46、10.50和10.54都大得多。可见用中位数10.52表示中心值更实际。这是因为在这个数据组中,12.80是“异常值”。在包含一个异常值的数据组中,使用中位数更有利,异常值对平均值和标准偏差影响很大,但不影响中位数。对于小的数据组用中位数比用平均值更好。
平均值虽然能够反映出一组平行测量数据的集中趋势,却不能反映出这组平行测量数据的分散程度,或者说不能反映出测量数据的精密度。
(1)精密度
精密度是指一组平行测量值之间相互接近的程度。换句话说,精密度是指在确定条件下,测量值在中心值(即平均值)附近的分散程度。
精密度的高低还常用重复性和再现性表示。
① 重现性(r) 一段短时间间隔,同一操作者,在相同条件下(仪器、实验室),采用相同试剂、相同方法获得一系列结果之间的一致程度。
② 再现性(R) 不同的操作者,在不同条件下(不同实验室、仪器、时间),采用相同试剂、相同方法获得的单个结果之间的一致程度。
可见,重复性和再现性是相似的概念,二者是对精密度的不同量度。只是涉及相同和不同的工作条件。对于给定的方法,重复性总是优于再现性。
精密度的大小常用偏差表示。偏差小,表示测定结果的重现性好,即每一测定值之间比较接近,精密度高。对n次有限测量数据,通常广泛使用以下术语来量度精密度。
(2)偏差
偏差是指个别测定结果xi与几次测定结果的平均值之间的差别,用d表示。与误差相似,偏差也有绝对偏差di 和相对偏差dr之分。
① 绝对偏差与相对偏差
a.绝对偏差 (2.7)
b.相对偏差 (2.8)
原始数据的离散即离中趋势可用以下几种方法表示。
② 平均偏差()与相对平均偏差(
)
a.平均偏差() 是绝对偏差的平均值。
(2.9)
b.相对平均偏差 (2.10)
从式(2.7)~ 式(2.10)可以看出:平行测量数据相互越接近,平均偏差或相对平均偏差就越小,说明分析的精密度越高;平行测量数据越分散,平均偏差或相对平均偏差就越大,说明分析的精密度越低。
③ 标准偏差与相对标准偏差 由于在一系列测定值中,偏差小的总是占多数,这样按总测定次数来计算平均偏差会使所得的结果偏小,大偏差值将得不到充分的反映。因此在数理统计中,一般不采用平均偏差而广泛采用标准偏差(简称标准差)来衡量数据的精密度。标准偏差是表征数据变化性最有效的量。
a.标准偏差(s) 又称均方根偏差。
(2.11)
b.相对标准偏差(RSD,%) 亦称“变异系数”(CV)。
(2.12)
由式(2.11)和式(2.12)可知,由于在计算标准偏差时是把单次测量值的偏差di 先平方再加和起来的,因而s和CV能更灵敏地反映出数据的分散程度。
④ 极差(R) 又称全距,是指在一组测量数据中,最大值(xmax)和最小值(xmin)之间的差:
(2.13)
R值越大,表明平行测量值越分散。但由于极差没有充分利用所有平行测量数据,其对测量精密度的判断精确程度较差。
例2.4 比较同一试样的两组平行测量值的精密度
第一组:10.3,9.8,9.6,10.2,10.1,10.4,10.0,9.7,10.2,9.7
第二组:10.0,10.1,9.5,10.2,9.9,9.8,10.5,9.7,10.4,9.9
解:
若仅从平均偏差和相对平均偏差来看,两组数据的精密度似乎没有差别,但如果比较标准偏差或变异系数,即可看出s1 < s2且 (CV)1 < (CV)2,即第一组数据的精密度要比第二组更好些。可见,标准偏差比平均偏差能更灵敏地反映测量数据的精密度。
2.2.4 准确度与精密度的关系
准确度和精密度是确定一种分析方法质量的最重要的标准。通常首先是计算精密度,因为只有已知随机误差的大小,才能确定系统误差(影响准确度)。对一组平行测定结果的评价,要同时考察其准确度和精密度。
图2.5为甲、乙、丙、丁四个人分析同一试样中镁含量所得结果(假设其真值为27.40%)。
图2.5表明,甲的结果准确度和精密度都好,结果可靠。乙的结果精密度好,但准确度低;丙的结果准确度和精密度都低;丁的结果精密度很差,虽然其平均值接近真值,但纯属偶然,这是大的正负误差相互抵消的结果,因而丁的分析结果也是不可靠的。
图2.5 四人分析结果比较(● 单次测量值;| 平均值)
由此可见,精密度高表示测定条件稳定,但仅仅是保证准确度高的必要条件;精密度低,说明测量结果不可靠,再考虑准确度就没有意义了。因此精密度是保证准确度的必要条件。在确认消除了系统误差的情况下,精密度的高低直接反映测定结果准确度的好坏。
综上所述:①高精密度是获得高准确度的前提或必要条件;②准确度高一定要求精密度高,但是精密度高却不一定准确度高;③消除系统误差后,精密度高,准确度也高。因此,如果一组测量数据的精密度很差,自然失去了衡量准确度的前提。
误差和偏差(准确度和精密度)是两个不同的概念。当有真值或标准值比较时,它们从两个侧面反映了分析结果的可靠性。对于含量未知的试样,仅以测定的精密度难以正确评价测定结果,因此常常同时测定一两个组成接近的标准试样检查标样测定值的精密度,并对照真值以确定其准确度,从而对试样分析结果的可靠性做出评价。
2.2.5 提高分析结果准确度的方法
准确度在定量分析测定中十分重要,因此在实际分析工作中应设法提高分析结果的准确度,尽可能减少和消除误差。可采取以下措施:
(1)选择适当的分析方法
试样中被测组分的含量情况各不相同,而各种分析方法又具有不同特点,因此必须根据被测组分相对含量的多少来选择合适的分析方法,以保证测定的准确度。一般来说,化学分析法准确度高,灵敏度低,适用于常量组分分析;仪器分析法灵敏度高,准确度低,适用于微量组分分析。例如:
① 对含铁量为20.00% 的标准样品进行铁含量分析(常量组分分析)。采用化学分析法测定相对误差为 ±0.1%,测得的铁含量范围为19.98%~20.02%;而采用仪器分析法测定,其相对误差约为 ±2%,测得的铁含量范围是19.6%~20.4%,准确度不满意。
② 对含铁量为0.0200% 的标准样品进行铁含量分析(微量组分分析)。采用化学分析法灵敏度低,无法检测;而采用仪器分析法测定相对误差约为 ±2%,测得的铁含量范围是0.0196%~0.0204%,准确度可以满足要求。
(2)检验和消除系统误差
① 对照实验 对照实验用于检验和消除方法误差,其做法一般有三种。第一种是“标准品对照”,即用新的分析方法对标准试样进行测定,将测定结果与标准值相对照。第二种是“标准方法对照”,即用国家规定的标准方法或公认成熟可靠的方法与新方法分析同一试样,然后将两个测定结果加以对照。第三种是“加标回收试验”,其方法原理是:取等量试样两份,向其中一份加入已知量的待测组分,对两份试样进行平行测定,根据两份试样测定结果,计算加入待测组分的回收率,以判断测定过程是否存在系统误差;该方法在对试样组成情况不清楚时适用。如果对照实验表明存在方法误差,则应该进一步查清原因加以校正。
另外,有时为了检查分析人员之间的操作是否存在系统误差或科学道德等方面的问题,常将一部分试样甚至标准样重复安排给不同的分析人员或送请外单位进行分析,分别称之为“内检”和“外检”。对照试验是检查测定过程中有无系统误差的最有效方法。
② 空白实验 空白实验的作用在于检验和消除由试剂、蒸馏水和器皿等引入的杂质所造成的系统误差。 它是指采用去离子水代替试样的测定。其所加试剂和操作步骤与试样测定步骤完全相同。所得结果为空白值,从试样测定结果中扣除此空白值。
③ 校准仪器和量器 校准仪器是为了消除仪器误差。在对准确度要求较高的测定进行前,先对所使用的分析天平的砝码的质量,移液管、容量瓶和滴定管等计量仪器的体积等进行校正,在测定中采用校正值(C)❹。
(3)控制测量的相对误差
任何测量仪器的测量精确度(简称精度)都是有限度的。因此在高精度测量中由此引起的误差是不可避免的。由测量精度的限制而引起的误差又称为测量的不确定性,属于随机误差,是不可避免的。
例如,滴定管读数误差,滴定管的最小刻度为0.1mL,要求测量精确到0.01mL,最后一位数字只能估计。最后一位的读数误差在正负一个单位之内,即不确定性为 ±0.01mL。在滴定过程中要获取一个体积值V(mL),需要两次读数相减。按最不利的情况考虑,两次滴定管的读数误差相叠加,则所获取的体积值的读数误差为 ±0.02mL。这个最大可能绝对误差的大小是固定的,是由滴定管本身的精度决定的,无法避免。可以设法控制体积值本身的大小而使由它引起的相对误差在所要求的 ±0.1% 之内。
由于
当相对误差Er = ±0.1%,绝对误差Ea = ±0.02mL时,
可见,只要控制滴定时所消耗的滴定剂的总体积不小于20mL,就可以保证由滴定管读数的不确定性所造成的相对误差在 ±0.1% 之内。
同理,对于测量精度为万分之一分析天平的称量误差,其测量不确定性为 ±0.1mg。在称量过程中要获取一个质量值m(mg)需要两次称量值相减,按最不利的情况考虑,两次天平的称量误差相叠加,则所获取的质量值的称量误差为 ±0.2mg。这个绝对误差的大小也是固定的,是由分析天平自身的精度决定的。
因此,为了保证天平称量不确定性造成的相对误差在±0.1%之内,必须控制所称样品的质量不小于0.2g。
(4)适当增加平行测定次数,减小随机误差
在系统误差已消除后,增加平行测定次数可以减小随机误差,从而提高测定的准确度。
需要注意的是:过分增加平行测定次数,收益并不很大,反而需消耗更多的时间和试剂。因此,一般分析实验平行测定3~4次已经足够。
综上所述,选择合适的分析方法,尽量减少测量误差,消除或校正系统误差,适当增加平行测定次数,取平均值表示测定结果(减少随机误差),杜绝过失,就可以有效提高分析结果的准确度。
误差的分类、产生原因及减免方法见表2.2。
表2.2 误差的分类、产生原因及减免方法