袁哲誠,王寬亮,陸李威,徐哲真,許 飛,羅鍛斌
(華東理工大學 理學院 物理系,上海 200237)
美國物理學家密立根利用自己設計制作的儀器,通過對帶電微小油滴電量的準確測量,證實了油滴電荷量的不連續(xù)性,即所有電荷量均為元電荷的整數(shù)倍,同時通過實驗確定了元電荷的量值. 密立根在油滴實驗中采用宏觀的力學模式(油滴的受力分析)來研究微觀世界的量子特性(電荷的不連續(xù)性),相關物理量的數(shù)量級跨度達到1020,數(shù)據的精確與結果的穩(wěn)定令人震撼. 密立根油滴實驗中所包含的實驗構思與實驗技巧,也堪稱近代物理實驗的經典. 目前,密立根油滴實驗已經成為很多高校大學物理實驗的必做經典實驗[1-3].
密立根在油滴實驗中通過求各油滴電荷值的最大公約數(shù)的方法來確定油滴的電荷數(shù). 但在實驗教學過程中,由于所得到的油滴的電量并非整數(shù)而且有測量誤差,因此直接計算少量油滴電荷量的最大公約數(shù)是不現(xiàn)實的做法. 目前大學物理實驗中密立根油滴實驗的數(shù)據處理,主要是采用“倒過來驗證”的方法,即用公認的電子電荷e=1.602×10-19C去除實驗測得的電荷量q,得到接近于某一整數(shù)的數(shù)值,這個整數(shù)就是油滴所帶的元電荷的數(shù)目n,再用n去除實驗測得的電荷量q,即得到電子的電荷e[1-3]. 這種方法可較快地處理數(shù)據,是實驗教學中應用較普遍的方法,但其顛倒了因果關系,學生無法體會到實驗設計的目的和意義. 用這種方法處理數(shù)據,只能作為實驗驗證,而且在實驗中不宜選用帶電量比較多的油滴. 正因為如此,密立根油滴教學實驗中的數(shù)據處理問題是實驗教學研究關注的問題之一[4-14]. 除了“倒過來驗證”法, 還有最小速度差值法[4]、油滴電量逐次相減法[5-6]、油滴電量平均值逐次相減法[7]、平衡電壓與下落時間隱函數(shù)關系法和電量概率統(tǒng)計直方圖法等數(shù)據處理方法[8-13]. 上述方法針對特定的數(shù)據量有各自的優(yōu)點. 通過對大量油滴電荷數(shù)據的概率統(tǒng)計[9-10]發(fā)現(xiàn),這些處理方法中,對電荷間隔的取值均沒有明確的依據和說明,而且不同電荷分布區(qū)域的峰值的取值均采用簡單的取平均值方法.
針對這些問題,在大量油滴電量數(shù)據的基礎上,先利用極端數(shù)據剔除法找到最佳的電荷量分割區(qū)間,然后再用聚類分析方法確定不同電荷量區(qū)間實驗數(shù)據分布的中心. 利用上述數(shù)據處理方法,可以得到比較好的元電荷的量值.

利用此方法對實驗所得到的1 016個數(shù)據進行處理,最終計算得到合適的油滴電荷量取值間隔為0.029×10-19C. 這一間隔依賴于實驗中所用的油滴數(shù)和油滴所帶的電荷量. 參考文獻[9-10]中用了取值間隔為0.02×10-19C,但未說明取此值的緣由,而且不同的油滴數(shù)和油滴電量取相同的間隔是不合理的. 用油滴電荷量取值間隔為0.029×10-19C這一數(shù)值整理油滴數(shù)的分布,結果如圖1所示.
從圖1可以看到,圖中有比較明顯的5個峰值區(qū)域,各峰的順序和參量如表1所示,表中i為(由原點起)峰的序號,qi為峰頂對應電荷量,N為油滴出現(xiàn)次數(shù).

表1 油滴電荷分布統(tǒng)計

圖2 元電荷個數(shù)與油滴電荷量的關系圖
從表1中數(shù)據可以估算,相鄰峰值電荷量之差應為元電荷,由于所帶電量必為元電荷的整數(shù)倍,直接對表1數(shù)據進行線性擬合,得到結果如圖2所示. 直線的斜率1.525×10-19C即為元電荷的值,與公認值e=1.60×10-19C的相對偏差為4.7%.
上述方法是直接取各數(shù)據局域區(qū)域的峰值來計算元電荷,因而帶有一定主觀性. 為了充分利用大量的數(shù)據,同時給出合理的尋找數(shù)據分布中心的方法,嘗試利用聚類分析對上述數(shù)據進行重新處理.
聚類分析是一種常用的無監(jiān)督學習的機器學習方法,它可以將線性可分的數(shù)據劃分成指定數(shù)量的目標類別. 而密立根油滴實驗的數(shù)據是一維線性可分并且無監(jiān)督的,所以嘗試利用聚類分析中最常用的k-means聚類分析[15]將數(shù)據進行分割,從而對包含不同元電荷的數(shù)據進行了區(qū)別和分類,同時也選取聚類中心作為該類所帶元電荷的值.
在圖1中可發(fā)現(xiàn)數(shù)據普遍集中在2×10-19~8.5×10-19C的數(shù)值區(qū)間,并且呈現(xiàn)出4個峰值的分布狀態(tài). 因為若不同類別的數(shù)據量存在較大差異,則k-means聚類分析的誤差較大,所以選取該連續(xù)分布且數(shù)據量密集的數(shù)值區(qū)間進行分析. 利用SPSS軟件的k-means聚類分析功能,讓k=4,將2×10-19~8.5×10-19C數(shù)值區(qū)間的數(shù)據進行聚類. 由于數(shù)據是準連續(xù)分布的,故聚類結果為各個元電荷的累積疊加,即若第i個聚類中心所包含的元電荷數(shù)為Ne,則第i+1個聚類中心所包含的元電荷數(shù)為Ne+1. 各聚類中心排序后,各個相鄰中心之間的差值應接近單位元電荷的數(shù)值,故可估計出各聚類中心大致所含的元電荷數(shù),結果如表2所示,其中q為所帶電荷量,Ne為聚類中心所帶元電荷數(shù).

表2 各聚類中心油滴電荷分布統(tǒng)計
由于所帶電量必為元電荷的整數(shù)倍,對各點進行線性擬合,得到結果如圖3所示. 直線的斜率為1.527 1×10-19C即元電荷的值,與公認值e=1.60×10-19C相對偏差為4.6%,并且也顯示了電荷電量的量子性.

圖3 利用聚類分析確定的元電荷個數(shù)與油滴電荷量的關系圖
在大量油滴電荷數(shù)據的基礎上,先利用極端數(shù)據剔除法找到最佳的電荷量分割區(qū)間. 電荷量分割區(qū)間的選取與實驗數(shù)據量相關,因此相對于已有文獻工作,本文提供了在大量油滴電荷數(shù)據中找出電荷量分割區(qū)間的方法. 找到最佳的電荷量分割區(qū)間后,用峰值法和聚類分析方法確定不同電荷量區(qū)間實驗數(shù)據分布的中心. 峰值法簡單直觀,但有一定主觀性;而聚類分析方法則是基于大量數(shù)據分布特點的機器學習方法. 利用上述2種尋找中心方法,均可得到較好的元電荷的量值,用峰值法和聚類分析方法得到的元電荷量值的相對偏差分別為4.7%和4.6%,滿足實驗要求.