舒志萬,王智博,陶宇杰,王 嶸,沈國平,邢江娃,朱德銳
(青海大學 醫學院 基礎醫學研究中心,西寧 810016)
假定蛋白(hypothetical protein)是一類能從轉錄組海量數據中預測基因開放閱讀框的表達蛋白質,而在基因或基因組數據庫中無明顯的同源蛋白,或屬于某一未知功能的潛在蛋白[1]。蛋白質作為基因功能的執行者,其功能注釋是后基因組學時代的重要任務[2]。目前,蛋白Uniprot KB和Protein Data Bank (PDB)數據庫中有超過1.2億條蛋白質序列,僅有少量獲得功能注釋[3]。基于基因組學和轉錄組學高通量測序的廣泛應用,各類生物細胞中存在大量的假定蛋白基因序列,可能參與多種細胞過程和信號傳遞通路,在細胞生化代謝、環境適應和藥物靶點篩選等方面發揮潛在的應用作用。研究表明:專性嗜冷細菌的某些假定蛋白,能在低溫和中等溫度下維持蛋白活性,參與細菌的冷適應機制,涉及蛋白質折疊運輸、能量代謝和酶調節等方面[4-5]。在金黃色葡萄球菌、沙眼衣原體、核型化膿桿菌和鼠疫耶爾森菌體內,利用假定蛋白的結構特征識別可能參與致病機制的毒力蛋白,探究細菌性傳染病的藥物新靶點[6-11]。因此,注釋假定蛋白的潛在功能,可能為闡明宿主物種的生理調節、信號轉導和生化代謝途徑等發揮重要作用,尤其是某一類假定蛋白僅存在于某一特定物種屬群,明確此類假定蛋白的功能,可能有助于探討相關代謝機制[12]。
鹽單胞菌屬(Halomonas)是一類典型的嗜鹽細菌,已自然進化形成兩種經典策略應對高滲環境,其一是胞內積累K+/Cl-排出Na+,以維持細胞內外的滲透壓平衡;其二是胞內吸收或生物合成有機相容溶質(compatible solute),以維持各類生物大分子的結構穩定[13]。……