王瑞雪 張露丹 孫 林
(北京師范大學生命科學學院 北京 100875)
為了實現染色體拷貝數異常基因的正常表達水平,各種生物進化出了不同的分子機制。基因的劑量補償(dosage compensation)是一種表觀遺傳學機制。黑腹果蠅作為一種重要的模式生物,因其在經典遺傳學及全基因組學研究中的顯著優勢,在劑量補償效應的發現與研究過程中是至關重要的實驗材料。20世紀30年代初,Muller H.J.在研究攜帶部分功能缺失的X 染色體果蠅突變個體的眼睛色素水平時,首次發現了在兩性個體間性連鎖基因劑量不同,但表達水平相似的現象。Muller H.J.將這種調節機制命名為“劑量補償”。20世紀80年代,Devlin R.H.等研究者[1]在果蠅2L 染色體中發現了劑量補償現象,證明了果蠅的常染色體中同樣存在著劑量補償現象。近年來,隨著對非整倍體果蠅研究的不斷深入,人們對劑量補償效應的遺傳學概念及分子調控機制均有了更高層次的理解[2]。
在XY 性別決定生物中,性染色體的劑量在兩性間存在明顯差異,正常的雌性的體細胞內有2 條X 染色體,而正常雄性的體細胞則含有一條X 染色體和一條Y 染色體。雖然X 染色體與Y 染色體起源相同,有同源配對基礎,但由于突變、遺傳漂變、自然選擇等多方面因素,Y 染色體上的基因發生了改變。果蠅Y 染色體大部分由重復的衛星DNA、轉座元件和核糖體DNA 組成,通過異染色質形成轉錄沉默,只有少數功能基因,主要與雄性生殖功能相關。兩性間性染色體的組成和數目差異是決定性別差異的重要因素,同時也導致了兩性間性連鎖基因劑量上的不平衡。但是雌、雄個體之間基因表達量沒有因此產生相應的差異,這說明在X 染色體上存在劑量補償效應,即雖然X染色體劑量不同,但不同性別的個體間X 染色體上相關基因表達量是近乎相等的。
關于性染色體上的劑量補償,在3 種性連鎖基因劑量不平衡的遠緣生物中的研究顯示,不同物種中的基因劑量補償現象是通過不同的分子調控機制實現的[3]。哺乳動物中的基因劑量補償是通過隨機失活雌性2 條X 染色體中的1 條實現的;而在線蟲中,基因劑量補償的實現則是通過將雌雄同體的2 條X 染色體的基因表達水平減少一半,進而達到與雄性X 連鎖基因表達量相匹配的目的。
果蠅的性別是由胚胎中性染色體與常染色體的比值(性指數,sex index)決定的,這個比值與一些性連鎖基因相關。在雌性個體中,性別分化是通過誘導性別致死基因(sxl)的轉錄,起始性別特異性剪接級聯反應實現的[4],其pre-mRNA 上包含終止密碼子的3 號外顯子被剪切。雄性果蠅中不發生此剪接過程,所以,sxl在雄性果蠅中無法正常表達。而SXL 蛋白會抑制下游MSL2 蛋白的合成,進而影響MSL 復合體的裝配,因此,在早期的雄性胚胎中,SXL 的缺失使性別分化及劑量補償機制的建立成為可能。MSL2 蛋白正常合成并募集MSL1、MSL3 等其他因子組裝形成MSL 復合體。果蠅中的劑量補償是通過上調雄性個體中X 染色體上的大部分基因的轉錄水平完成的。在雄性特異性致死(MSL)復合體參與下,精確實現了200%的基因表達水平,以彌補雌、雄果蠅之間的X 染色體劑量的差異。該過程涉及了MSL 復合體內的相關組分,例如,位點特異性的組蛋白乙酰化修飾蛋白MOF、X 染色體特異性非編碼RNAroX1與roX2,以及組蛋白磷酸激酶JIL-1。整個劑量補償過程復雜而有序[5]。
為了解果蠅X 染色體上基因的劑量補償,研究者選擇了具有3 條X 染色體的超雌果蠅品系,對超雌果蠅和正常二倍體果蠅的三齡幼蟲進行了高通量RNA 測序,并統計了2 種果蠅所有轉錄本基因表達比率的分布頻率。以該比值區間(Bin)為橫坐標,將該比值區間對應基因出現的頻率為縱坐標,作比值-頻率分布圖(圖1),從圖1中可看出,超雌果蠅與正常果蠅基因表達比率的峰值出現在1.0 處,說明二者具有相同的基因表達水平,證明果蠅中性染色體上的確存在劑量補償效應。

圖1 超雌體果蠅/二倍體果蠅基因表達比率分布
早在1982年,就已有關于果蠅的常染色體的劑量補償的研究。研究者檢測了5 種結構基因定位于果蠅2 號染色體左臂的酶,比較了它們在三體及二倍體中的表達量。其中2L 三體果蠅中定位在染色體遠端的3 種酶,表達水平與二倍體中相近,并且3 個等位基因均是活躍的[1]。說明2L 染色體上的部分基因存在劑量補償現象,使每個等位基因達到正常二倍體水平2/3 的表達量,并且這種補償作用因染色體結構不同而存在區域性。
為了解2L 染色體上的劑量補償,研究者對2L三體果蠅的三齡幼蟲進行了高通量RNA 測序,統計了2L 三體與正常果蠅所有表達的轉錄本的基因表達比率分布頻率。2L 染色體的基因表達比率的峰值出現在0.9 和1.0 附近,這說明2L 染色體的基因表達水平與正常二倍體基本一致,在果蠅的常染色體上同樣存在劑量補償現象(圖2)。

圖2 2L 三體/二倍體果蠅基因表達比率分布圖
大量研究證明,常染色體上的劑量補償在多物種中廣泛存在。在游離型21-三體唐氏綜合征患者中,21 號染色體上發生劑量補償的基因共有77個,占該染色體基因總數的56.6%[8];野生型非整倍體酵母中,其染色體劑量增加的染色體上,僅11%~36%基因表達水平降低,大多數基因都可通過劑量補償效應維持表達水平的穩定[9];玉米中更是普遍存在劑量補償現象,1 號染色體長臂上的結構基因的表達量由劑量補償到直接劑量效應(表達量與基因劑量的變化相匹配)的范圍內均有分布,并且在劑量補償處存在峰值[10]。
除此之外,相比于性染色體,常染色體上的基因劑量補償還存在著性別差異性,這使得常染色體在劑量補償效應的研究中具有獨特的優勢。關于果蠅眼色的實驗已證明這種性別二態性的存在,并且這種性別導致的表達差異并非特定于某類基因,而是廣泛存在于許多劑量敏感的基因上,包括轉錄因子,染色質蛋白和信號轉導通路成員[11]。MSL 復合體定位在雄性果蠅的X 染色體上,復合體中存在與活化基因表達相關的組蛋白乙酰化酶MOF。若將MSL 復合體靶向X 染色體的蛋白MLE 突變,MOF 蛋白會分散到各個染色體上,roX RNA 的插入會吸引復合物從介入位點擴散,進而導致X 染色體和常染色體上的相關基因表達發生變化[12]。
基因的劑量補償效應最初發現于果蠅的性染色體上,表現為兩性之間基因劑量差異變化并未導致大部分蛋白質水平的相應變化。隨著研究的不斷深入,在果蠅及其他生物中,常染色體上基因的劑量效應也逐漸被證實。傳統概念認為劑量效應僅存在于性染色體上的基因,如今,研究者已認識到劑量效應廣泛存在于全基因組中。但是,由于目前蛋白質組學工具在準確檢測蛋白質水平變化方面存在著技術限制,研究者對于劑量補償是否可在翻譯水平上發生還存在許多爭議,而對于劑量效應是否可在翻譯后水平上發生還未有定論[13]。
此外,基因劑量補償的發生機制還存在爭議,研究者基于雄性果蠅X 染色體連鎖基因的2 倍上調和相關組蛋白乙酰化酶的修飾作用提出了激活模型。但傳統的激活模型雖解釋了兩性間X 染色體的劑量補償效應,卻不能解釋X 染色體和常染色體之間的基因表達失衡現象。并且非整倍體所引發的基因表達變化不是僅局限于發生劑量改變的染色體連鎖基因,而是廣泛存在于全基因組中。因此,Birchler J.A.[14]提出了新的劑量補償機制實現模型,即“平衡模型”。在平衡模型中,研究者認為基因組內的劑量補償是通過正向劑量效應(positive dosage effect)和 反 式 劑 量 效 應(inverse dosage effect)共同作用實現的。反式劑量效應會在全基因組內產生廣泛的影響。研究者通過遺傳學技術及分子生物學分析篩選出了47 個與白眼相關的反式劑量因子,可在單基因水平上模擬在非整倍體中觀察到的反式劑量效應[15]。其中,位于2R 染色體上的參與轉錄的pcf11基因,其缺失與重復突變型中存在明顯的反式劑量效應,且缺失與重復互補后,可恢復到正常水平。對劑量補償發生機制的研究,能為深入揭示基因調控和非整倍體中的基因表達起到非常重要的作用。