999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

NGS分析教學實操平臺的開發與應用

2022-11-08 05:49:34
醫學教育管理 2022年5期
關鍵詞:分析課程學生

王 晶 劉 旭 段 犖 程 杉

(首都醫科大學基礎醫學院,北京 100069)

近年來,二代測序技術(next-generation sequencing,NGS)飛速發展,測序成本持續降低,其樣本消耗低、數據量大等優勢得到充分顯現,日漸成為生物醫藥領域必備研究手段,使生命科學的探索進入了 “組學”時代[1-2]。

在高通量測序的相關實驗研究中,NGS數據的生物信息學分析專業度要求較高,雖然國內外綜合性院校在研究生教育階段開設了生物信息學等相關課程,但在醫學領域相關專業技術人才對測序數據分析的需求仍然未能充分滿足,特別是本科生教學中,相關能力培養的課程覆蓋存在明顯的缺口。其中主要原因是由于NGS的數據分析需要提供必要實操條件,從而與理論授課內容相結合,達到預期教學目標。

在醫學相關“大數據”的分析中,既要展示海量組學數據,更要解讀這些數據背后的醫學及生物學意義,這就要求師資兼備醫學生物學的知識儲備及生物信息處理能力。對上述問題系統性的解決,可填補大多數臨床醫學及基礎醫學專業學生在測序數據分析中的技能短板,也能夠為醫學院校加快學科交叉領域人才的培養鋪路助力[3]。

1 BIONEO高通量測序數據分析平臺的搭建

1.1 高通量數據分析平臺前期基礎

依托醫學遺傳學與發育生物學學系,在基礎醫學培養方案中開設高通量數據分析課程,與已開設的醫用數據挖掘課程偏向醫用數據庫的檢索和使用等教學內容互補,主要涉及NGS數據處理相關的理論及實驗等教學內容。醫學遺傳學作為銜接基礎研究和臨床研究橋梁學科,在面向臨床/基礎醫學專業講述交叉學科內容方面具有天然的優勢。在兼顧學生的知識背景、課程的師資準備和授課內容的精選等實踐基礎上,實現了內容豐富、難度適中、理論與實踐并重且教學效果良好的高通量數據分析課程的運行。

NGS測序數據分析作為一個新興前沿交叉學科,層出不窮的“組學”及NGS數據分析流程對課程教學團隊的背景及知識更新速度也有了更高的要求。特別在課程實驗部分的設計中,學生相關知識背景相對薄弱:如NGS數據處理中偏重計算生物學處理的部分,需要編程和算法設計,對于臨床醫學和基礎醫學學生而言,高等數學和計算機語言基礎較為欠缺,使得在對算法的理解和應用上有一定難度;此外,在注重數據分析及可視化的生物數據挖掘部分,大多數NGS據分析軟件都定位在Linux系統,人機交互需要通過命令輸入進行,從零基礎到能獨立完成基本分析操作需要一定的訓練周期。因此,我們有針對性地提出了解決方案:分析軟件全部根據源代碼在Windows操作系統下重新編譯,并且提供圖形化操作界面,為主要流程的參數輸入提供交互性的用戶體驗。

首先,我們通過從主流的生物信息學方法學期刊,如NatureMethods、Bioinformatics等雜志中甄選已發表并且被普遍采用的NGS測序數據分析軟件及分析流程,建立基因組測序(DNAseq)和轉錄組測序(RNA-seq)的標準化流程[4-12];進而重新編譯其中全部程序和軟件的代碼生成Windows操作系統下可直接運行的二進制可執行文件,并在此基礎上分別構建了基于Windows CMD窗口工具的全基因組測序(whole genome sequencing,WGS)、全外顯子組測序(whole exome sequencing,WES),RNA-seq及染色質免疫共沉淀測序(chromatin immunoprecipitation sequencing, ChIP-seq)4個測序類型多個獨立分析流程;最后為每個獨立的分析流程利用簡易的HTA編程,配伍了相應的圖形化操作界面。由于完全規避了對Linux操作系統的依賴和純終端命令行輸入的方式,徹底打破傳統實操教學中的許多技術壁壘,避免給學員造成不便[13]。

通過上述前期努力和嘗試,在一定程度上降低了基礎NGS數據分析的學習門檻,為建立適合基礎及臨床醫學學生高通量測序數據分析課程奠定了良好基礎。在先后2個批次的小規模面向基礎醫學專業學生的培訓后,均收獲了良好的教學反饋并收獲了同行督導專家的一致好評,同時建議對數據分析的實操步驟進一步整合及集成,改進互動式圖形化界面(graphic user interface, GUI)的集成,使面對高通量數據分析望而生畏的零基礎學生能有更好的入門體驗。

為此,我們進一步在Windows系統下對部分標準分析流程進行了優化和集成:將應用最為廣泛的WES變異比對及注釋和RNA-seq中基礎的差異表達基因分析兩套流程制作 “生信牛BIONEO高通量測序數據分析平臺”,同時為之提供了專門的測試和演示數據。至此,BIONEO軟件包成為一個可獨立運行的NGS標準分析流程實操平臺,提供對課程教學的完全支持,同時其經過拓展的專業版本(pro version)還能夠充分勝任科研級別的專業分析需求。

1.2 數據分析流程選擇

DNA-seq數據選擇Trimmomatic[9]中輸入fasta,將rawdata經過配對和篩選后輸出cleandata fasta文件;BWA[4]將cleandata中讀長(reads)比對回參考基因組;SAMtools[5]進行二進制轉換及排序生成bam文件,Picard[6]去除文庫構建過程中PCR產生的重復序列獲得bam文件;使用GATK[7]中BaseRecalibrator、ApplyBQSR及HaplotypeCaller,經過局部重比對和堿基質量重矯正后,檢測變異,并對評價出的位點進行質控矯正后輸出vcf文件,包括突變信息及突變所在染色體位置信息等;最后用ANNOVAR[8]進行對變異注釋,標注變異位置、變異類型、人群數據庫頻率、突變對表達蛋白的功能影響預測及保守性分析等。全部流程按照標準化流程操作,也可通過勾選操作進行部分步驟的分析。為了覆蓋更多的研究類型,分別建立人hg19、人hg38、小鼠mm10 3套參考基因組序列體系。

RNA-seq差異表達基因分析流選擇Trimmomatic[9]輸入fasta,將rawdata經過配對和篩選后輸出cleandata;HISAT2[10]將cleandata的reads比對回參考基因組;SAMtools[5]進行二進制轉換及排序;HTseq[11]生成收檢樣本每個基因的counts信息;DESeq2[12]輸出組間差異表達分析結果。支持通用流程連續自動運行或勾選部分分析步驟操作。BIONEO RNA-seq提供人hg38,小鼠mm10,大鼠Rnod 6.0及果蠅4套參考基因組序列體系。

1.3 系統基本構架及平臺GUI實現

目前雖然已有帶有GUI的高通量分析軟件,但大多僅完成注釋分析,而非完整分析流程套件[14-15],我院醫學遺傳學與發育生物學學系獨立開發的帶有GUI界面的BIONEO軟件可一次性集成完成全部分析流程。軟件的編譯使用基于HTML應用程序和vbscript語言編譯,實現GUI。BIONEO平臺對操作系統和使用環境的要求很低,其中系統配置為8核以上Windows 7或以上的64位操作系統即可;要求內存容量8 G以上,硬盤容量256 G即可(可通過USB 3. 0外接擴容);網絡以太網卡或調制解調器。

此外,針對軟件的產權保護,BIONEO采用了獨特的加密方式,每個軟件綁定一個磁盤,拷貝復制會觸發“Invalid Access”提示,并關閉軟件,在一定程度上保護了軟件的知識產權。該平臺已經成功搭建并獲得中華人民共和國國家版權局計算機軟件著作權(登記號:2021SR79556)。

2 BIONEO平臺在教學中的推廣使用

以這個平臺為基礎,我們正式面向全校基礎醫學及臨床醫學專業研究生開設高通量測序數據分析研究生選修課程,該課程分為理論課和實驗課。其中實驗課以案例實操為主,由教師提供樣例數據,或由選課研究生直接使用科研課題中產生的高通量數據,以我們建立的BIONEO軟件為操作平臺,進行數據分析的實時分析訓練。學生實時接觸主流高通量數據WES變異比對及注釋和RNA-seq 差異表達分析流程。通過師生線下座談和線上問卷等形式與所有選課學生交流,一致認為課程開設意義重大,使得零基礎的醫學生可以通過課程實踐,獨立完成主流常規高通量數據分析。同時,為了提高教學效果,我們也通過認真總結學生提出的反饋意見,對BIONEO進行了升級和調整。

2.1 增加互動界面,詳細介紹標準操作流程中生物信息學軟件及實時程序進程

在BIONEO的初始版本中,所有在數據分析的過程中,直接后臺運行每一步,學生的直觀感覺更像是在操作一個成熟的軟件套件,而不能監測每步所用的具體生物信息分析軟件和實時的數據產出。為了更詳細地展示每步數據分析過程,實現更好的教學效果,我們在操作界面上特別添加了針對高通量數據分析流程中每步軟件的說明,以“Read Me”的形式嵌套在每個可勾選流程右側,并在運行軟件的同時,恢復顯示Windows CMD窗口工具,使學生可以更加清晰直觀地掌握每一步數據產生的方法和過程。

2.2 疫情期間滿足線上教學需求,并進行教學比較

2020-2021學年度研究生課程實操課恰逢疫情期間線上授課,我們將BIONEO light版套件及樣例數據以開放下載的形式對學生共享,教師通過網絡授課軟件進行授課和實操指導。對比兩學年教學效果發現:無論是線下還是線上的授課模式,對于從未接觸過高通量數據分析的研究生,均有超過70%從未接觸過高通量測序數據分析的學生在初次接觸BIONEO套件后即能在指導后獨立完成DNA-seq基礎分析及RNA-seq差異表達基因分析,說明軟件本身的互動性及可操作性良好。此外,根據授課結果比較發現,線下互動性實操課程教學效果優于完全線上實操教學(表1),說明如何在線上教學模式下提高學生的課堂吸收率值得進一步探討和提高。

表1 BIONEO套件教學應用效果比較[n(%)]

2.3 開發專供課上演示的快速簡版軟件

基于目前普通個人電腦,單個樣本高通量測序數據分析周期約4~6 h,而單次實操課為4課時(3 h),初始版本的BIONEO只能演示測序數據分析的初始,由于課程時間限制,無法為學生呈現完整的數據分析流程。為了讓學生在課堂實時練習軟件操作,接受教師指導并獲得測序分析結果,我們將人類h38基因組參考序列中1號染色體的參考序列從全基因組參考序列中單獨拆分出來作為比對用參考基因組,單獨制作BIONEO light版本,這一操作大大提高了比對和注釋的時間,單個樣本從原始下機數據到變異注釋完成只需35 min,在保持軟件功能練習完整性的同時實現了課堂全過程操作,保留全功能的BIONEO pro版作為科研需求,Light版及Pro版功能對比見圖1。

圖1 Light版及Pro版BIONEO操作流程比較

2.4 覆蓋滿足教學科研雙需求

符合當前市場一般配置的普通個人電腦雖然可以完成BIONEO提供的生物信息學分析,但其計算速度仍然低于專業服務器,因此,學系面向基礎醫學院及各個臨床醫院開放了內嵌BIONEO pro版套件的計算服務器和存儲服務器的預約使用,將課程內容延伸至實際科研課題中。學生帶著科研問題走進課堂,通過理論學習更好地完成課題設計,通過BIONEO light實操訓練初步掌握高通量測序數據基礎分析,再基于學系提供的服務器自助式完成個體科研課題數據分析及解讀,徹底實現“授之以漁”的教學目標。迄今,基于BIONEO pro操作平臺,本校已經完成了對基礎醫學院免疫學系、首都醫科大學附屬北京兒童醫院、首都醫科大學宣武醫院等多個系室/科室的科研支持。

3 后續改進

隨著生物醫藥研究所需主流高通量測序的種類越來越多,分析流程個性化愈發凸現,基礎模式化流程不能完全滿足數據深度挖掘的需要;新興的單細胞轉錄組測序(single cell RNA-seq,scRNA-seq)、宏基因組測序(metagenomics next generation sequencing, mNGS)也已經成為生物醫藥較常規大數據分析,數據分析套件種類急需擴充。同時,我們注意到,不同于早期生物信息學分析流程中不同模塊可由多款軟件實現, scRNA-seq及mNGS均具有獨立成熟專業的分析套件(Cellranger及QIIME 2),這些套件基于Linux系統,完全平移到Windows系統事倍功半。因此,在基于已有工作基礎及經驗的同時,也充分考慮為專業生物信息學分析人員提供性能良好的自主分析平臺,后續擬建立以Linux 操作系統為基礎的多測序種類。自Windows 10開始,系統整合了wsl(windows subsystem for linux),提供對linux程序運行環境的原生態支持,目前wsl升級至版本2,兼容性得到很大改善,可以滿足絕大多數NGS生物信息學軟件包的環境支持。隨著高校軟件正版化對Windows操作系統的全面升級,我們為NGS課程所準備的雙系統流程和演示資源在完成系統培訓的基礎上,將進一步為真實數據的研究工作提供更加直接和有力的支持。

4 結 語

BIONEO平臺為專業型強且操作難度高的高通量測序數據分析提供了一個有效的解決方案,在基礎醫學教學的應用具有良好的靈活性和可行性,通過涵蓋目前最主流高通量測序類型的數據分析方法并單獨制作體系,為零基礎的基礎醫學和臨床醫學學生提供簡便的實操環境。通過在Windows界面下整合最主流的高通量測序數據(DNA-seq和RNA-seq)的標準化流程,極大降低了主流NGS數據分析與后續挖掘的技術門檻。BIONEO在基礎醫學教育中的全面推廣將為生物醫藥行業基礎研究領域中高通量測序數據分析作為必備手段的普及提供有效支持。

(致謝:本研究的整體設計思路及主要實現方案由丁衛教授和葉海虹教授指導完成,特此感謝!感謝牛歡等同學幫助完成軟件和流程的測試工作。)

利益沖突所有作者均聲明不存在利益沖突

作者貢獻聲明王晶:搭建、測試平臺,進行試驗或調查,撰寫論文;劉旭:平臺數據測試;段犖:不同版本BIONEO操作流程比較;程杉:設計課題,審訂論文

猜你喜歡
分析課程學生
數字圖像處理課程混合式教學改革與探索
隱蔽失效適航要求符合性驗證分析
軟件設計與開發實踐課程探索與實踐
計算機教育(2020年5期)2020-07-24 08:53:38
為什么要學習HAA課程?
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
趕不走的學生
學生寫話
電力系統及其自動化發展趨勢分析
學生寫的話
聰明的學生等
主站蜘蛛池模板: 免费一级无码在线网站 | 亚洲制服丝袜第一页| 三级视频中文字幕| 色综合成人| 999精品视频在线| 91在线视频福利| 伊人无码视屏| 国语少妇高潮| 亚洲精品自拍区在线观看| 中文字幕免费视频| 久久久久国产一级毛片高清板| 久久美女精品国产精品亚洲| 精品国产成人高清在线| 久久国产精品夜色| 91视频精品| 九月婷婷亚洲综合在线| av在线人妻熟妇| 国产打屁股免费区网站| 六月婷婷激情综合| 天天躁日日躁狠狠躁中文字幕| 国产精品性| 欧美色99| 精品自窥自偷在线看| 欧美亚洲欧美| 色天天综合久久久久综合片| 日本91在线| 日本不卡在线视频| 国产成在线观看免费视频| 国产在线视频自拍| 伊人久久大线影院首页| 国产免费怡红院视频| 免费不卡在线观看av| 黄色污网站在线观看| 国产免费高清无需播放器| 国产香蕉国产精品偷在线观看 | 欧美高清日韩| 成年免费在线观看| 天天干天天色综合网| 国产欧美精品专区一区二区| 久久中文字幕不卡一二区| 欧美a级在线| 成人亚洲天堂| 日本91视频| 久久婷婷国产综合尤物精品| 久久综合干| 国产男人的天堂| 中文精品久久久久国产网址| 奇米精品一区二区三区在线观看| 久久女人网| 午夜精品影院| 国产精品综合色区在线观看| 国产精品不卡永久免费| 欧美 国产 人人视频| 一级一级一片免费| 亚洲第一在线播放| 波多野结衣一区二区三区AV| 亚洲男人的天堂视频| a色毛片免费视频| 亚洲最猛黑人xxxx黑人猛交| 亚洲 欧美 偷自乱 图片| 欧美成人精品一区二区 | 高清国产va日韩亚洲免费午夜电影| 日本日韩欧美| av在线无码浏览| 国产欧美在线观看一区| 91成人在线观看视频| 欧美日韩国产成人高清视频| 亚洲精品爱草草视频在线| 久久久亚洲色| 亚洲天堂首页| 亚洲精品在线91| 国产亚洲欧美另类一区二区| 无码网站免费观看| 欧美中文字幕第一页线路一| 一本久道热中字伊人| 四虎影视8848永久精品| 一区二区三区成人| 91国内在线观看| 国产原创第一页在线观看| 91啪在线| 精品自拍视频在线观看| 超碰91免费人妻|