于明珠,張鵬莉,呂思凡,杜尚民,高艷鋒,杜江峰
1)鄭州大學生命科學學院 鄭州 450001 2)三門峽職業技術學院醫護學院 河南三門峽 472143
高通量藥物篩選在現代藥物研發中發揮著舉足輕重的作用,然而,該方法存在成本高、效率低、陽性率低等難以克服的缺點[1],無法應對現代藥物研發的需要。隨著計算機計算能力的大幅提升和藥物設計算法的發展,計算機輔助虛擬篩選得到廣泛應用[2],該策略既降低了發現活性先導化合物的成本,又避免了盲目篩選[3-4]。目前有許多商業化小分子化合物數據庫用于虛擬篩選,如ChemBridge、ChemDiv等,然而,這些數據庫都以2D結構的形式儲存數據,且不同的數據庫在分子組成方面也存在差異,因而在數據庫的選擇上存在一定的不確定性,并且2D結構的數據庫不適合直接用于以分子對接為主的虛擬篩選。因而,本研究對一些比較常用的數據庫中小分子化合物的2D數據進行處理,同時分析其屬性,從而構建一個具有3D結構的數據庫,以期為研究者提供一個直觀的藥物篩選平臺。
1.1小分子化合物的收集從6個常用的小分子化合物公司的官方網站上下載小分子化合物庫(ChemBridge、ChemDiv、InterBioScreen、LifeChemicals、Specs和Vitas-m)。其中ChemBridge數據庫包括2部分:核心庫(CORE library)與精選庫(EXPRESS-Pick library),共2個sdf文件,經過冗余檢索,無冗余分子。ChemDiv數據庫包含3個化合物數據集:公開可用化合物集(DC)、新化合物集(NC)和創新化合物集(IC),共6個sdf文件,經過冗余檢索,發現1個冗余分子并去除。InterBioScreen數據庫無明確分類,共4個sdf文件,經冗余檢索,有少量重復并去除。……