鄧勃
(清華大學化學系,北京 100084)
關于校正曲線建立和應用中一些問題的探討
鄧勃
(清華大學化學系,北京 100084)
大多數儀器分析方法都是相對測量方法,需建立分析信號與分析物量值之間的相關關系,因此,正確建立和應用校正曲線是儀器分析中獲得準確測定結果的基礎。詳細討論了校正曲線的建立和標定方法,校正曲線的屬性包括中心實驗點的特性、校正曲線的精密度和置信區間、動態范圍和線性范圍的確定方法等。對校正曲線的應用中常遇到的一些實際問題如測定結果精密度的計算、標準偏差有效數字的確定、測定結果的表示方式等進行了討論。
校正曲線;置信區間;線性范圍;動態范圍;有效數字
分析檢測是為科研和社會提供第一手原始數據和基礎資料的有效手段。在科學研究中,它是做出科學推論和結論的基礎;在經濟活動中,它是評定產品質量、確定產品價格和發生國際貿易爭端時進行仲裁的依據;在刑偵和司法活動中,它是做出公正結論的重要根據;在診斷疾病時,它是輔助醫生正確判斷疾病的必要資料,由此可見分析檢測數據的價值和重要性。分析檢測數據的重要性就在于它真實地反映了客觀事物的屬性,其價值取決于其可靠性,如果檢測數據不可靠,就失去了它的使用價值,甚至會誤導人們作出錯誤的結論。
在分析檢測的實踐活動中,最重要的是要采取一切措施保證所得到的數據和資料的可靠性。在儀器分析中,絕大多數分析方法都是相對測量方法,需要進行校正,建立分析信號與分析物量值(質量或濃度)之間的相關關系,即建立校正曲線。因此,正確建立和應用校正曲線是儀器分析獲得準確定量分析結果的基本前提條件。
建立校正曲線就相當于對平面上一組實驗點取平均值,使校正曲線盡可能通過最多的實驗點,且實驗點均衡地分布在校正曲線的兩側,以達到實驗點對校正曲線的偏差平方和最小。從數理統計的觀點看,就是按照最小二乘原理建立分析信號y與分析物量值(質量或濃度)x之間的回歸方程,確定校正曲線的斜率b和截距a[1-2]。

建立校正曲線應該采用多少個實驗點比較合適,這是首先要考慮的問題。現在發表的文獻中,通常都是用5個實驗點,這是合適的選擇。如果將分析物質量或濃度為零的‘空白’點參與回歸,用6個實驗點建立校正曲線更好。校正曲線的置信區間由±tα,fSE決定,其中SE是校正曲線的殘余標準偏差,tα,f是顯著性水平為α、自由度為f時的置信系數,可由統計書的t分布表中查得(見表1)。
tα,f值隨f增大而減小,當f≥3后tα,f值隨f增大而減小的速度減慢。tα,f值越大,tα,f SE越大,校正曲線的置信區間越寬,由校正曲線求得值的不確定程度越大。從控制校正曲線合適的置信區間考慮,f不要小于3,即實驗點數目n不要少于5。試驗點數目確定后,接著需要考慮實驗點的分布。有人在酸性條件下,將味精中的硫化鈉轉化為硫化氫,用硫化鈉檢測試劑吸收后用紫外可見分光光度計測定,取硫化鈉濃度分別是0、2.0、4.0、8.0和16.0μg的5個標準溶液系列建立校正曲線。按照校正曲線實驗點精密度分布(見圖1),校正曲線兩端的實驗點測量精密度差,特別是高端實驗點變化大,對校正曲線的殘余標準偏差貢獻大,對校正曲線的穩定性有著顯著的影響,當16.0μg實驗點測定值偏高或偏低,將明顯地引起校正曲線繞著中心實驗點(ˉx,ˉy)發生轉動。如果在校正曲線兩端區域分別各有兩個鄰近試驗點,按照測定值隨機波動的特性,可有效地控制校正曲線的穩定性。由此可見,按上述方式依照濃度倍數布置實驗點是很不可取的。實驗點的合理分布應該是校正曲線中央布點可稀疏些,校正曲線兩端區域實驗點布置密一些,對于5個實驗點,在校正曲線中央布一個實驗點,在靠近低端、高端各布兩個相互鄰近的實驗點。

表1 t分布表(α=0.05)Table 1 Values of t-distribution(α=0.05)
從式(1)可知,中心點(ˉx,ˉy)一定落在回歸線上,位于校正曲線中間區域(在x=ˉx附近)的實驗點的精密度相對較好,對校正曲線穩定性的影響較小。因此,在測定樣品時應盡量利用校正曲線的中央區域。
從標準溶液系列取樣建立校正曲線,對特定的一次取樣建立的校正曲線,斜率和截距是常數。由于分析信號y是隨機變量,分析物的質量或濃度x是固定變量,y與x之間是相關關系,而非數學上嚴格的函數關系,每一實驗點不一定都落在校正曲線Y=a+bx上。每一實驗點分析信號yi偏離校正曲線期望值Yi的程度,可用偏差(yi-Yi)表示,所有實驗點偏離校正曲線的程度,用校正曲線的殘余標準偏差SE表式,

SE表征了校正曲線的變動性,直接影響到校正曲線的置信區間。
分析人員都知道,如果從同一標準溶液系列多次取樣建立多條校正曲線,各條校正曲線并不都是重合的,也就是說各條校正曲線的斜率、截距未必都是相同的。斜率和截距的變動性分別用斜率、截距的標準偏差Sb、Sa表征,

對于x=x0的分析信號y0的測定誤差Sy0既受斜率b和截距a變動性的影響,又要受到測定時實驗條件隨機波動的影響。按照誤差傳遞原理,測定分析信號y0的標準偏差

式中p是對x=x0的分析信號y0的重復測定次數,如果只進行單次測定,p=1。用圖表示校正曲線各實驗點精密度,如圖1所示。

圖1 校正曲線精密度分布曲線Figure 1.Distribution of precision values of a calibration curve.
式(6)和圖1說明,①校正曲線中央的精密度優于校正曲線兩端的精密度,測定值x0偏離中心試驗點ˉx越遠,其分析信號值測定的精密度越差,因此,應盡量利用校正曲線的中央部分測定未知樣品。②增加實驗點數目n,有利于提高校正曲線的穩定性,因此,在總測定次數相同的情況下,適當增加實驗點數目n減少實驗點的重復測量次數是正確的選擇,增加實驗點的重復測量次數只能改善個別實驗點的精密度,而增加實驗點數目n則可提高校正曲線的整體穩定性;增加校正曲線低濃度和高濃度兩端實驗點的重復測量次數,提高它們的測定精密度,以改善整個校正曲線的穩定性。③將空白溶液實驗點參與回歸,增加實驗點數目,有利于提高校正曲線的穩定性。④不用零濃度點的值扣‘空白’或調節儀器零點,用截距扣空白,因位于校正曲線兩端的實驗點測定精密度較差,用零濃度點的值扣‘空白’或調節儀器零點,就是用不穩定的值作為基準,會造成校正曲線的不合理平移。合理的做法是將零濃度實驗點參與回歸,用校正曲線的截距作為空白值,因截距值是綜合了各實驗點對校正曲線的影響而得到的值,穩定性較好,用它作為空白值,可提高空白扣除的準確性。
前面提到,校正曲線的變動是不可避免的。分析人員如何對校正曲線進行標定?現在有一種做法是采用單點標定,即用重新測定一個實驗點的值對校正曲線進行標定。不管通過原點和新測定實驗點的值來標定校正曲線(即斜率重置),或者是根據新測定實驗點的值平移校正曲線,都是不甚合理的。斜率重置意味著只認可存在相對系統誤差,而忽略了固定系統誤差的存在;校正曲線平移意味著只認可存在固定系統誤差,而忽略了相對系統誤差的存在。事實上校正曲線通常既有平移又有轉動,既存在固定系統誤差又存在相對系統誤差。可能有分析人員說單點標定不好,采用兩個實驗點標定可以嗎?兩點標定建立新校正曲線,通過原有的與新的校正曲線比較,雖然可以同時檢查固定系統誤差和相對系統誤差,但仍是不可取的,其理由正如在第2節中指出的,用兩點建立校正曲線是很不穩定的。值得推薦的辦法是將原實驗點和新標定實驗點的值結合在一起重新建立校正曲線。
采用什么實驗點進行標定,分析人員習慣用建立校正曲線的原質量或原濃度實驗點重新標定校正曲線,如前述用紫外可見分光光度計測定味精中的硫化鈉,用5個實驗點中任意兩個實驗點,比方說用2.0和8.0μg標準溶液進行標定,當然是可以的,這相當于對此兩個實驗點又進行了一次或幾次重復測定,改善了它們分析信號值的精密度。如果采用1.0和12.0μg標準溶液進行標定,效果又怎樣呢?這相當于校正曲線新增加了兩個實驗點,能有效地改善新建校正曲線的穩定性,減小校正曲線的置信區間,提高了對兩端實驗點波動的控制能力。由此可見,用不同于建立校正曲線的原實驗點進行標定,比用原實驗點進行標定是更可取的。
按最小二乘原理建立的校正曲線一定是偏差平方和最小,但偏差平方和最小的校正曲線不一定是有意義的。建立的校正曲線是否有意義,用相關系數r進行相關性檢驗。校正曲線相關性檢驗如圖2所示。

圖2 校正曲線相關性檢驗示意圖Figure 2.Illustration of the correlation test for a calibration curve.



由式7可見,當y與x是嚴格的函數關系,所有實驗點都落在校正曲線上,1;當y與x之間沒有任何依賴關系時,各試驗點的分析信號值不隨分析物量值而變化,都為校正曲線是平行于x軸的水平線,==0。從實際分析觀點考慮,斜率為零的校正曲線顯然是沒有任何實際意義,只有斜率足夠大的校正曲線才有實用價值,從統計觀點考慮,只有回歸平方和夠大,相關系數大于表2中一定顯著性水平α和一定自由度f時的臨界值rα,f時校正曲線才有統計和實用意義。通過相關性檢驗的校正曲線兩端點之間所跨的分析物的量值范圍,稱為校正曲線的動態范圍(dynamic range),在該范圍內,分析信號y隨測定量值x基本呈現線性變化,校正曲線兩端區域可以有某種程度的彎曲。

表2 相關系數臨界值Table 2 Critical values of the correlation coefficien ts
相關系數rα,f與顯著性水平α與自由度f,亦即實驗點數目n有關,當試驗點數目為5(自由度為3),顯著性水平α=0.05(置信度p=1-α=0.95),相關系數為0.878的校正曲線已有統計和使用意義,即使取置信度99%,相關系數為0.969也就夠了。在一些文章甚至標準文件中,非要求相關系數達到0.999甚至0.9999,實在有點令人費解!應該指出,若不指明實驗點的數目,只規定相關系數一定要達到幾個9是不恰當的。
為什么通過相關性檢驗的校正曲線兩端點之間所跨的分析物的量值范圍,不能作為校正曲線的線性范圍呢?因為實驗點是否落在回歸線上,除了實驗誤差之外,也包括了x對y的非線性影響。當對實驗點進行了重復測定,將x對y的非線性影響與實驗誤差分辨開,用誤差效應平方和Qe去檢驗失擬平方和Qd,可以確定實驗點是否落在校正曲線上。失擬檢驗統計量

式中fd和fe分別是失擬平方和與誤差效應平方和的自由度。當計算的F實驗值大于F分布表中相應顯著性水平α和自由度fd和fe的臨界值,表明失擬情況顯著,校正曲線已有明顯彎曲。F分布表可由統計書中查到(見表3)。
通過擬合優度檢驗的校正曲線兩端點之間所跨的分析物的量值范圍,稱為校正曲線的線性范圍(linear range)。對實驗點沒有重復測量,不能得到Qe,就不能確定校正曲線的線性范圍。
由上面的討論知道,校正曲線的動態范圍與線性范圍是有區別的,不能混淆。動態范圍一般大于線性范圍,在有些情況下,動態范圍與線性范圍又是一致的。玆舉一例予以進一步說明。在氯化十四烷基二甲基芐基銨存在下,于p H=6.5用鉻天青S分光光度法測定鈧,使用的標準溶液系列見表4[3]。

表3 F檢驗臨界值表(單側,α=0.05)Table 3 Critical values of the F-tests(single side,α=0.05)

表4 鉻天青S分光光度法測定鈧的標準溶液系列Table 4 A series of standard solutions for determ ination of scandium using chrome azurol S spectraphotometry
根據表4數據,擬合的校正曲線是y=0.145+1.103x,相關系數是r=0.9534,相關系數臨界值分別是r0.05,16=0.468和r0.01,16=0.590,r大于r0.05,16和r0.01,16,表明所建立的校正曲線(圖3的虛線)是有意義的,校正曲線的動態范圍上限是0.48μg/mL。但從圖3可以看到,當鈧濃度大于0.16μg/mL后,校正曲線有明顯的向濃度軸彎曲的趨勢。由此說明,通過了相關系數檢驗的校正曲線所跨分析物量值區間內,實驗點并非一定位于直線上,擬合優度檢驗的統計量值

F>F0.05(7,9)=3.29,失擬情況是高度顯著的。如果舍棄0.16μg/mL后的實驗點,由前面幾個實驗點建立校正曲線,y=0.09513+1.873x,相關系數是r=0.9977,擬合優度檢驗的統計量值

F<F0.05(3,5)=5.41,校正曲線已不存在失擬情況。通過擬合優度檢驗的校正曲線(圖3的實線)所跨分析物量值區間內,實驗點都位于校正曲線直線上,校正曲線的線性范圍上限是0.16μg/mL。校正曲線的動態范圍遠大于線性范圍。
如果用表4中分析物濃度≤0.16μg/mL的幾個實驗點建立校正曲線,則動態范圍與線性范圍是一致的。

圖3 校正曲線的動態范圍與線性范圍Figure 3.The dynam ic and linear range of the calibration curve.
校正曲線是對一組特定的實驗點按最小二乘原理建立的,斜率和截距是常數,對不同實驗點建立的校正曲線,其斜率和截距是不同的。校正曲線外延,就意味著肯定外延點也位于校正曲線上,事實上并不是這樣,特別是高量值一端,校正曲線常常有向下彎的傾向,正如在圖3中所看到,如果將校正曲線高端由0.16μg/mL延至0.24μg/mL,傾向開始彎曲,0.24μg/mL產生的失擬平方和將達到1.53× 10-3,而0.24μg/mL以前所有各實驗點產生失擬平方和也只有2.91×10-4,可見任意外延校正曲線有可能造成校正曲線的嚴重失擬。校正曲線在低量值端,有時也出現向上彎曲的傾向,向下端外延也會造成校正曲線失擬。如果從專業知識或經驗上確知外延點仍在線性范圍內,外延也是允許的。但最好是用外延點進行實驗,予以證實。
現在還有不少文獻中,建立校正曲線時,最低實驗點分析物的量值并不在零點,而在文章中將線性范圍寫成0~x,這是不嚴肅的做法。我們知道,測定低于分析方法檢出限的量值,不能給出可靠的定量結果,因此,不能隨意將校正曲線的線性下限延至0。
在本節討論用校正曲線計算分析物量值之前,先看一個示例,用紫外分光光度法測定苯甲酸,校正曲線A=7.40+0.0733c,r=0.9989。分析樣品,6次測定平均值是8.125μg/g,單次測定標準偏差0.0848。RSD=1.04%。按照習慣的做法,大多數分析人員都是這樣報告實驗結果。如果仔細加以分析,有些問題就值得斟酌了。在此例中,測定值的標準偏差完全由6次重復測定決定,與建立的校正曲線質量無關。
分析人員知道,校正曲線是計算樣品測定量值的基礎,建立校正曲線的質量直接影響由該校正曲線計算被測定分析物量值的質量。從統計的角度考慮,建立校正曲線y=f(x)的誤差,會間接傳遞到分析樣品的量值上。由分析信號測定值y0計算x0的標準偏差為

因此,在報告樣品的測定結果時,只報告樣品p次重復測定的標準偏差,而不考慮校正曲線的標準偏差SE的影響顯然是不合理的。
在報告苯甲酸出的結果時,標準偏差0.0848,標準偏差有效數字取3位。分析人員都知道,重復測定次數越多,有效數字位數可以多取,究竟取多少位,是由標準偏差的精密度決定。標準偏差的精密度由下式計算,

式中p是重復測定次數。當p=6,Ss=0.316s,Ss/S=31.6%,就是說在十位數已是不確定了,有效數字最多只能取2位。由式(10)知道,當p≥51,Ss/S≤10%,個位數是不確定的,有效數字最多可取3位。在通常的例行分析中,只進行少數幾次重復測定,標準偏差的有效數字最多只能取2位。按照GB/T 8170-2008,數值修約規則與極限數值的表示和判定[4],凡標準中對測定值有極限值規定時,均采用全數值比較法,涉及安全性能指標和計量儀器有誤差傳遞的標準或其他重要指標,應優先采用全數值比較法,以避免通過數字修約將不合格的數據判為合格的數據。在本示例中,標準偏差取0.085。相對標準偏差取RSD=1.1%。
在苯甲酸示例中,報告結果給出的參數也不完備,沒有給出必要的參數。表述測定結果應包括5個基本參數:(1)等精度測量給出算術平均值,非等精度測量給出加權平均值,平均值表征測定值的集中趨勢;(2)等精度測量給出測定值的標準偏差或并合標準偏差及其相對標準偏差,非等精度測量給出加權標準偏差,或者給出不確定度,標準偏差、不確定度表征測定值的分散性;(3)置信程度(置信度或置信范圍),不給出置信程度不便于對測定結果進行檢驗;(4)重復測定次數,它不僅與置信系數取值有關,也表征了經濟效益;(5)測定數據的正確表示,遵守數字修約規則。
測定結果可用置信區間(式11)或不確定度(式12)的形式表示:

現在所發表的一些不確定度評定文章中,忽略了斜率和截距不確定度對總不確定度的貢獻。從統計的觀點看,校正曲線的斜率和截距隨不同批取樣是變動的,應該將其不確定度估計到總不確定度中。實踐經驗也證明,即使使用同一標準系列,不同批取樣建立的校正曲線的斜率和截距是有變化的。有時斜率和截距的不確定度在總不確定度中占有顯著的比例,如在火焰原子吸收光譜法測定銅精礦中銀,總相對標準不確定度為0.024,校正曲線擬合標準不確定度是0.021,占總相對標準不確定度96%。而在校正曲線不確定度中,斜率和截距不確定度是0.0066,占29%。由此可見,在不確定度評定中,不能忽略斜率和截距不確定度的貢獻。
正確建立和應用校正曲線是儀器分析中獲得準確測定結果的基礎。建立校正曲線實驗點的數目不少于5點,實驗點的合理分布應該是校正曲線中央布點可稀疏些,校正曲線兩端區域實驗點布置密一些,對于5個實驗點,在校正曲線中央布一個實驗點,在靠近低端、高端各布兩個相互鄰近的實驗點。校正曲線發生變動,用單點或兩個實驗點標定是不可取的,最好是將原實驗點和新標定點合并重新制作校正曲線。在總測定次數相同的情況下,適當增加實驗點數目減少每個實驗點的重復測量次數,以利于提高校正曲線的整體穩定性。
校正曲線的動態范圍與線性范圍是有區別的,不能混淆。不能隨意將校正曲線的線性范圍延至零濃度,建議用校正曲線截距而不用零濃度點的值扣‘空白’。校正曲線中央的精密度優于校正曲線的兩端的精密度,在測定樣品時應盡量利用校正曲線的中央區域。由校正曲線計算樣品中分析物的測定量值,不能只由分析物的重復測定次數計算測定量值的標準偏差,還應該考慮校正曲線標準偏差對測定值標準偏差的影響。在報告測定結果應給出測定值的置信區間或不確定度,在評定不確定度時應考慮校正曲線的斜率和截距變動性對總不確定度的貢獻。在表述測定結果時,必須遵守有效數字的修約規則,在通常例行分析中,重復測定次數較少,標準偏差的有效數字最多只能取2位,相對標準偏差的修約,只進不舍,不允許通過數字修約將不合格的數據判為合格的數據。
[1]鄧勃.分析測試數據的統計處理方法[M].北京:清華大學出版社,1995,24:105-118,308-312.
[2]Massart D L,et al.Chemometrics:a textbook[M].Oxford:Elsevier,1988:75-92.
[3]鄭用熙,編著.分析化學中的統計方法[M].北京:科學出版社,1986:220-258.
[4]中國國家標準化研究院.GB/T 8170-2008數值修約規則與極限數值的表示和判定[S].北京:中國標準出版社,2008.
The Discussion on Some Problems with Construction and Application of Calibration Curve
DENG Bo
(Chem istry department,Tsinghua University,Beijing100084,China)
Most of the instrumental analysismethods are relative measurements and they require to establish some relationships between signals and quantity of analytes in order to obtain exact resultsof determination.Thus,constructing a right calibration curve is the basis to obtain accurate results from an instrumental analysis.In this paper,the construction,standardization and p ropertiesof calibration curves including the characteristic of central experimental point,p recision,confidence interval,dynamic and linear range of a calibration curve,etc.were introduced in detail.Some p ractical p roblem s concerning with the app licationsof calibration curves,such as calculation of p recision,determination of the significant figure of standard deviation as well as exp ression of determination results,etc.were discussed.
calibration curve;confidence interval;linear range;dynam ic range;significant figure
O657
A
2095-1035(2011)03-0001-07
10.3969/j.issn.2095-1035.2011.03.0001
2011-02-11
2011-03-12
鄧勃,男,教授,主要從事光譜分析。E-mail:dengbo@mail.tsinghua.edu.cn