尹麗娜,鐘漢斌,馬 羚,焦 龍
(西安石油大學化學化工學院,陜西 西安 710065)
將陽光轉化為電能的太陽能技術包括染料敏化太陽能電池[1-2]、硅基太陽能電池、聚合物太陽能電池[3],以及鈣鈦礦型太陽能電池技術[4]等。在這些太陽能電池中,染料敏化太陽能電池(dye-sensitized solar cells, DSSC)自O’Regan和Gratzel[5]于1991年的開創性報告以來,一直備受關注,也因其低成本器件制造和高能量轉化效率[6](power conversion efficiency,PCE)等優點,進一步加快了DSSCs的規模化和實用化。
染料敏化劑在DSSCs中扮演著至關重要的角色。D-π-A型染料是一類具有光誘導分子內電荷轉移性質的電子供體、π共軛體、電子受體組成的化合物。芳胺衍生物[7]是富電子化合物,也是D-π-A型染料中的一種,廣泛應用于光電子學領域中的空穴傳輸和發光器件,如有機發光二極管、非線性材料和有機太陽能電池等。另外,芳胺類化合物還具有其他優良的性質,如優異的電學性質和光電化學行為等。Yanagida等[8]首次在有機染料中引入TPA單元作為電子給體,合成了染料1(PCE=3.30%)和2(PCE=5.30%),表現出了良好的能量轉化效率(圖1)。以芳胺類化合物作為DSSCs的染料敏化劑,可以通過調整電子供體、π共軛體系以及電子受體的結構,有效地調整分子的能級,達到優化染料敏化劑分子的性能,進一步提高DSSCs的PCE值。

圖1 部分化合物芳胺類化合物分子結構
全息定量構效關系(hologram quantitative structure activity relationship, HQSAR)是Hurst和Heritage[9]提出的一種出色的2.5D-QSAR技術,它能夠快速、方便地生成統計量好、預測精度高的QSAR模型,處理大批量的化學數據,其建模方法簡便、預測能力強,應用范圍廣泛[10-11]。
因此,本文應用HQSAR方法對35種芳胺類化合物分子進行全息定量構效關系研究,建立了相關QSAR模型,并通過內部驗證(留一交叉驗證)和外部驗證(外部測試集驗證)對模型進行了檢驗。HQSAR是預測和研究芳胺類化合物PCE值的一種簡便、有前途的方法。
35種芳胺類化合物分子結構和PCE實驗值的數據來自文獻[12],列于表1中。35種芳胺類化合物隨機分為兩組:第一組(Group 1)包含25種化合物;第二組(Group 2)包含10種化合物(在表中用“*”)

表1 芳胺類化合物PCE的實驗值與預測值

(1)
(2)
(3)
(4)



(5a)
(5b)
(5c)
(5d)


表1(續)
使用SYBYL軟件構建了35種芳胺類化合物的分子模型并進行結構優化,力場、電荷、能量梯度收斂值RMS和最大迭代次數(Max Interations)分別設置為Tripos標準力場、Gasteiger-Huckel電荷類型、0.209 kJ·mol-1·nm-1和1000次,其余采用系統默認值。
全息定量構效關系(HQSAR)是一種以分子全息圖為描述符的定量構效關系方法,其原理是將所研究的芳胺類化合物分子結構轉化成一系列大小不同、結構不同的重疊、環狀、分子搭接或者線性等的亞結構碎片,然后亞碎片結構通過散列算法以全息圖的二元格的形式進行編碼,最后采用偏最小二乘法(partial least squares, PLS)建立HQSAR模型。
分子碎片主要由碎片大小(fragmentsize)和碎片區分參數(fragmentdistinction)這兩個參數來確定。fragmentdistinction參數選項包括:供體/受體原子(donor/acceptor atoms, DA)、氫原子數(hydrogen atoms, H)、化學鍵類型(bonds, B)、原子類型(atoms, A)、連接類型(connections, C)和手性(chirality, Ch)。在目前的研究工作中,有四個片段,即化學鍵類型、氫原子數和手性、供體/受體原子被選擇用于HQSAR模型的生成。為了生成最佳模型,對數據集中所有重要的結構特征進行了分析。輸入分子被分解成碎片,適當地定義了最小(M)和接受最大(N)碎片數的值,全息圖的長度(L)保持在50~500之間。為了減少碎片碰撞,選擇L的值作為素數,L的默認值通常為53~401區間范圍的12個素數之一。PLS分析是關聯全息描述符和生物活性的有效方法,所得結果可用于設計PCE值更高的芳胺類化合物分子。fragmentsize參數一般指亞結構碎片中所擁有的原子數目,fragmentsize不同,分子結構信息也不同,系統一般默認“4-7”。通過調整碎片類型、碎片長度以及全息長度等參數提高模型的穩健性。
以第一組的25種化合物為訓練集建立并優化HQSAR模型,以第二組的10種化合物作為外部測試集檢驗和評估所建立模型的穩健性和預測能力。
“fragmentdistinction”和“fragmentsize”是影響HQSAR模型的兩個主要參數。首先對“fragmentdistinction”參數進行了優化,設置“fragmentsize”為軟件默認參數值“4-7”,采用不同的“fragmentdistinction”參數組合以第一組的25種化合物為訓練集建立63個HQSAR模型,計算并統計相關參數。表2為選取該HQSAR模型中9種最優模型的統計參數。由表2可知,q2最優為0.734,此時r2=0.940、“fragment distinction”參數為“B、H、Ch、DA”。其次設置“fragmentdistinction”參數為“B、H、Ch、DA”,對“fragmentsize”進行優化。選用不同fragmentsize參數建立不同HQSAR模型以選擇最優的fragmentsize參數,仍是以第一組作為訓練集建立HQSAR模型并統計相關參數,如表3所示。當“fragmentsize”為“4-7”時,q2=0.734,r2=0.940,此時模型結果最優。以上結果表明,當“fragmentdistinction”參數和“fragmentsize”參數分別設置為“B、H、Ch、DA”、“4-7”時可建立最優HQSAR模型,如表3所示,此最佳模型分子全息長度為97,主成分數為6。

表2 不同“fragment distinction”參數下HQSAR模型的統計結果

表3 不同“fragment size”參數下HQSAR模型的統計結果

對第一組化合物進行留一交叉驗證,選擇一個樣本作為位未知樣本,依次預測第一組25種芳胺類化合物的PCE值,預測結果見表1所示。模型預測RMSECV=1.2226,PCE預測值與實驗值之間的線性相關方程為y=0.7474x+1.0049(x表示實驗值,y表示預測值),相關系數R=0.7341。PCE實驗值與預測值的對比圖見圖2。

圖2 PCE預測值與實驗值對比圖
上述結果表明,所建立的HQSAR模型準確可靠,具有良好的預測能力,可以用此模型對芳胺類化合物的PCE值進行比較準確可靠的預測。
應用HQSAR方法研究了芳胺類化合物分子結構與相應染料敏化太陽能電池能量轉化效率(PCE)之間的定量關系,建立了相應的QSAR模型。結果表明,所建立的模型具有良好的預測能力和穩健性能,該模型對芳胺類化合物的PCE值可進行比較準確可靠的預測,預測出來的芳胺類化合物PCE實驗值與預測值大致相等。該方法可為預測其他芳胺類化合物的PCE值做重要的參考。