日本一本正道综合久久dvd_亚洲综合图_色综合久久天天_亚洲综合图色国模40p_国产精品嘿咻嘿咻

 
首頁 > 銀行 >
 
 

環(huán)球今頭條!五大生信技能研究分析,生命科學(xué)熱度來襲!深度學(xué)習(xí)基因組學(xué)+機器學(xué)習(xí)轉(zhuǎn)錄組學(xué)與表觀

2023-06-25 20:22:35  來源:嗶哩嗶哩

隨著高通量生物技術(shù)的發(fā)展,已經(jīng)開發(fā)了多種組學(xué)技術(shù)來表征不同但互補的生物信息,包括基因組學(xué)、單細胞、表觀基因組學(xué)、轉(zhuǎn)錄組學(xué)、微生物組學(xué)和代謝組學(xué)等。

近年來,癌癥相關(guān)多組學(xué)技術(shù)的快速發(fā)展 一直是人工智能生物學(xué)分析探索新型抗癌靶點的最重要因素之一。下圖將這些技術(shù)分為五個方面:表觀遺傳學(xué)、基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)和多組學(xué)整合分析。


(資料圖片)

人工智能整合多組學(xué)數(shù)據(jù)(例如表觀遺傳學(xué)、基因組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué))以識別癌癥治療靶點。

最近的人工智能技術(shù)已經(jīng)從“淺層”學(xué)習(xí)架構(gòu)發(fā)展到“深度”學(xué)習(xí)架構(gòu)。作為人工智能的一個重要分支,機器學(xué)習(xí)(ML)可以自動學(xué)習(xí)捕捉復(fù)雜的模式,并根據(jù)數(shù)據(jù)做出智能決策。ML在癌癥研究和臨床腫瘤學(xué)中有著非常廣泛的應(yīng)用。特別是,在多組學(xué)數(shù)據(jù)快速增長的推動下,屬于ML子領(lǐng)域的基于深度學(xué)習(xí)(DL)的方法已成為生物醫(yī)學(xué)數(shù)據(jù)分析的強大工具

專題內(nèi)容

專題一、深度學(xué)習(xí)基因組學(xué)

專題二、機器學(xué)習(xí)轉(zhuǎn)錄組學(xué)與表觀組學(xué)

專題三、深度學(xué)習(xí)單細胞

專題四、機器學(xué)習(xí)代謝組學(xué)

專題五、機器學(xué)習(xí)微生物組學(xué)

學(xué)習(xí)目標(biāo)

【深度學(xué)習(xí)基因組學(xué)】通過基礎(chǔ)入門+應(yīng)用案例實操演練的方式,從初學(xué)及應(yīng)用研究的角度出發(fā),帶大家實戰(zhàn)演練多種深度學(xué)習(xí)模型在基因組學(xué)分析中的各種應(yīng)用,深入剖析多篇高分文章代碼演示及文章復(fù)現(xiàn),通過對這些深度學(xué)習(xí)在基因組學(xué)中的應(yīng)用案例進行深度講解和實操,能夠掌握深度學(xué)習(xí)分析高維基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)等多組學(xué)數(shù)據(jù)流程,系統(tǒng)學(xué)習(xí)深度學(xué)習(xí)及基因組學(xué)理論知識及熟悉軟件代碼實操,熟練掌握這些前沿的分析工具的使用以及研究創(chuàng)新深度學(xué)習(xí)算法解決生物學(xué)及臨床疾病問題與需求。

【學(xué)習(xí)轉(zhuǎn)錄組學(xué)與表觀組學(xué)】在Linux和R環(huán)境中進行數(shù)據(jù)分析的技能。如何處理和分析轉(zhuǎn)錄組和表觀組數(shù)據(jù),并深入了解這兩個領(lǐng)域的關(guān)鍵概念和最新發(fā)展。內(nèi)容包括Linux操作系統(tǒng)的基礎(chǔ)知識和常用命令行技巧,R編程語言的應(yīng)用,轉(zhuǎn)錄組數(shù)據(jù)的預(yù)處理和差異表達分析,表觀組數(shù)據(jù)的分析方法,以及綜合應(yīng)用和實際項目實踐。

【深度學(xué)習(xí)單細胞】通過高分文獻和代碼實操,解析單細胞深度的套路

【機器學(xué)習(xí)代謝組學(xué)】熟悉代謝組學(xué)和機器學(xué)習(xí)相關(guān)硬件和軟件;熟悉代謝組學(xué)從樣本處理到數(shù)據(jù)分析的全流程;能復(fù)現(xiàn)至少1篇CNS或子刊級別的代謝組學(xué)文章圖片。

【機器學(xué)習(xí)微生物組學(xué)】機器學(xué)習(xí)在微生物組數(shù)據(jù)分析流程,能夠快速運用到自己的科研項目上。

詳細內(nèi)容

一、深度學(xué)習(xí)基因組學(xué)

第一天

理論部分

深度學(xué)習(xí)算法介紹

1.有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法

1.1全連接深度神經(jīng)網(wǎng)絡(luò)DNN在基因組學(xué)中的應(yīng)用舉例

1.2卷積神經(jīng)網(wǎng)絡(luò)CNN在基因組學(xué)中的應(yīng)用舉例

1.3循環(huán)神經(jīng)網(wǎng)絡(luò)RNN在基因組學(xué)中的應(yīng)用舉例

1.4圖卷積神經(jīng)網(wǎng)絡(luò)GCN在基因組學(xué)中的應(yīng)用舉例

2.無監(jiān)督的神經(jīng)網(wǎng)絡(luò)算法

2.1自動編碼器AE在基因組學(xué)中的應(yīng)用舉例

2.2生成對抗網(wǎng)絡(luò)GAN在基因組學(xué)中的應(yīng)用舉例

實操內(nèi)容

1.Linux操作系統(tǒng)

1.1常用的Linux命令

1.2 Vim編輯器

1.3基因組數(shù)據(jù)文件管理, 修改文件權(quán)限

1.4查看探索基因組區(qū)域

2.Python語言基礎(chǔ)

2.1.Python包安裝和環(huán)境搭建

2.2.常見的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)類型

第二天

理論部分

基因組學(xué)基礎(chǔ)

1.基因組數(shù)據(jù)庫

2.表觀基因組

3.轉(zhuǎn)錄基因組

4.蛋白質(zhì)組

5.功能基因組

實操內(nèi)容

基因組常用深度學(xué)習(xí)框架

1.安裝并介紹深度學(xué)習(xí)工具包tensorflow, keras,pytorch

2.在工具包中識別深度學(xué)習(xí)模型要素

2.1.數(shù)據(jù)表示

2.2.張量運算

2.3.神經(jīng)網(wǎng)絡(luò)中的“層”

2.4.由層構(gòu)成的模型

2.5.損失函數(shù)與優(yōu)化器

2.6.數(shù)據(jù)集分割

2.7.過擬合與欠擬合

3.基因組數(shù)據(jù)處理

3.1安裝并使用keras_dna處理各種基因序列數(shù)據(jù)如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WG等

3.2使用keras_dna設(shè)計深度學(xué)習(xí)模型

3.3使用keras_dna分割訓(xùn)練集、測試集

3.4使用keras_dna選取特定染色體的基因序列等

4.深度神經(jīng)網(wǎng)絡(luò)DNN在識別基序特征中應(yīng)用

4.1實現(xiàn)單層單過濾器DNN識別基序

4.2實現(xiàn)多層單過濾器DNN識別基序

4.3實現(xiàn)多層多過濾器DNN識別基序

第三天

理論部分

卷積神經(jīng)網(wǎng)絡(luò)CNN在基因調(diào)控預(yù)測中的應(yīng)用

1.Chip-Seq中識別基序特征G4,如DeepG4

2.Chip-Seq中預(yù)測DNA甲基化,DeepSEA

3.Chip-Seq中預(yù)測轉(zhuǎn)錄調(diào)控因子結(jié)合,DeepSEA

4.DNase-seq中預(yù)測染色體親和性,Basset

5.DNase-seq中預(yù)測基因表達eQTL,Enformer

實操內(nèi)容

復(fù)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)CNN識別基序特征DeepG4、非編碼基因突變DeepSEA,預(yù)測染色體親和性Basset,基因表達eQTL

1.復(fù)現(xiàn)DeepG4從Chip-Seq中識別G4特征

2.安裝selene_sdk,復(fù)現(xiàn)DeepSEA從Chip-Seq中預(yù)測DNA甲基化,非編碼基因突變

3.復(fù)現(xiàn)Basset,從Chip-Seq中預(yù)測染色體親和性

4.復(fù)現(xiàn)Enformer,從Chip-Seq中預(yù)測基因表達eQTL

第四天

理論部分

深度學(xué)習(xí)在識別拷貝數(shù)變異DeepCNV、調(diào)控因子DeepFactor上的應(yīng)用

1.SNP微陣列中預(yù)測拷貝數(shù)變異CNV,DeepCNV

2.RNA-Seq中預(yù)測premiRNA,dnnMiRPre

3.從蛋白序列中預(yù)測調(diào)控因子蛋白質(zhì),DeepFactor

實操內(nèi)容

1.復(fù)現(xiàn)DeepCNV利用SNP微陣列聯(lián)合圖像分析識別拷貝數(shù)變異

2.復(fù)現(xiàn)循環(huán)神經(jīng)網(wǎng)絡(luò)RNN工具 dnnMiRPre,從RNA-Seq中預(yù)測premiRNA

3.復(fù)現(xiàn)DeepFactor,從蛋白序列中識別轉(zhuǎn)錄調(diào)控因子蛋白質(zhì)

第五天

理論部分

深度學(xué)習(xí)在識別及疾病表型及生物標(biāo)志物上的應(yīng)用

1.從基因表達數(shù)據(jù)中識別乳腺癌分型的深度學(xué)習(xí)工具DeepType

2.從高維多組學(xué)數(shù)據(jù)中識別疾病表型,XOmiVAE

3.基因序列及蛋白質(zhì)相互作用網(wǎng)絡(luò)中識別關(guān)鍵基因的深度學(xué)習(xí)工具DeepHE

實操內(nèi)容

1.復(fù)現(xiàn)DeepType,從METABRIC乳腺癌數(shù)據(jù)中區(qū)分乳腺癌亞型

2.復(fù)現(xiàn)XOmiVAE,從TCGA多維數(shù)據(jù)庫中識別乳腺癌亞型

3.復(fù)現(xiàn)DeepHE利用基因序列及蛋白質(zhì)相互作用網(wǎng)絡(luò)識別關(guān)鍵基因

第六天

理論部分

深度學(xué)習(xí)在預(yù)測藥物反應(yīng)機制上的應(yīng)用

1.聯(lián)合腫瘤基因標(biāo)記及藥物分子結(jié)構(gòu)預(yù)測藥物反應(yīng)機制的深度學(xué)習(xí)工具SWnet

實操內(nèi)容

1.預(yù)處理藥物分子結(jié)構(gòu)信息

2.計算藥物相似性

3.在不同數(shù)據(jù)集上構(gòu)建self-attention SWnet

4.評估self-attention SWnet

5.構(gòu)建多任務(wù)的SWnet

6.構(gòu)建單層SWnet

7.構(gòu)建帶權(quán)值層的SWnet

案例圖片:

二、機器學(xué)習(xí)轉(zhuǎn)錄組學(xué)與表觀組學(xué)

第一天

理論部分

高通量測序原理

高通量測序基礎(chǔ)

測序方法及數(shù)據(jù)

二代測序數(shù)據(jù)分析流程

實操內(nèi)容

R語言基礎(chǔ)

R(4.1.3)和Rstudio的安裝

R包安裝和環(huán)境搭建

數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)類型

R語言基本函數(shù)

數(shù)據(jù)下

數(shù)據(jù)讀入與輸出

第二天

理論部分

多組學(xué)基礎(chǔ)

常用生物組學(xué)實驗與分析方法

常用組學(xué)數(shù)據(jù)庫介紹

批量處理組學(xué)數(shù)據(jù)

生物功能分析

基于轉(zhuǎn)錄組學(xué)的差異基因篩選,疾病預(yù)測

組學(xué)數(shù)據(jù)可視化

實操內(nèi)容

Linux操作系統(tǒng)

Linux操作系統(tǒng)的安裝與設(shè)置

網(wǎng)絡(luò)配置與服務(wù)進程管理

Linux的遠程登錄管理

常用的Linux命令

在Linux下獲取基因數(shù)據(jù)

利用Linux探索基因組區(qū)域

Shell script與Vim編輯器

基因組文件下載與上傳

Linux權(quán)限管理

文件的身份

修改文件的所有者和所屬組

修改文件權(quán)限

第三天

理論部分

介紹轉(zhuǎn)錄組學(xué)的基本概念和研究流程

RNA-seq數(shù)據(jù)的預(yù)處理和質(zhì)量控制

序列比對和對齊評估

基因表達量估計和差異表達分析

實操內(nèi)容

轉(zhuǎn)錄組測序數(shù)據(jù)質(zhì)量控制

轉(zhuǎn)錄組數(shù)據(jù)比對

RNA-seq數(shù)據(jù)原始定量

主成分分析

原始定量結(jié)果差異分析

差異結(jié)果篩選及可視化

GO和KEGG通路富集分析

GSEA基因集富集分析

第四天

理論部分

表觀遺傳學(xué)的基本概念和技術(shù)介紹

DNA甲基化和組蛋白修飾的分析方法

表觀組數(shù)據(jù)的預(yù)處理和質(zhì)量控制

差異甲基化和差異修飾分析

甲基化和修飾的功能注釋和富集分析

甲基化數(shù)據(jù)的整合分析和基因調(diào)控網(wǎng)絡(luò)構(gòu)建

表觀組數(shù)據(jù)的可視化方法和工具

介紹其他表觀組學(xué)技術(shù)(如染色質(zhì)構(gòu)象捕獲)

實操內(nèi)容

測序數(shù)據(jù)質(zhì)量控制和檢查

數(shù)據(jù)比對和多匹配問題

計算結(jié)合峰位置

IGV中組學(xué)結(jié)果可視化

差異peaks分析

結(jié)合程度矩陣計算

富集熱圖和曲線圖繪制

第五天

理論部分

機器學(xué)習(xí)概述

線性模型

決策樹

支持向量機

集成學(xué)習(xí)

模型選擇與性能優(yōu)化

實操內(nèi)容

決策樹算法實現(xiàn)

隨機森林算法實現(xiàn)

支持向量機(SVM)算法實現(xiàn)

樸素貝葉斯算法實現(xiàn)

Xgboost算法實現(xiàn)

聚類算法實現(xiàn)

DBSCAN算法實現(xiàn)

層次聚類算法實現(xiàn)

第六天

理論部分

基因功能注釋和富集分析

WGCNA(Weighted Gene Co-expression Network Analysis)網(wǎng)絡(luò)分析

轉(zhuǎn)錄因子分析和調(diào)控網(wǎng)絡(luò)構(gòu)建

轉(zhuǎn)錄組數(shù)據(jù)的可視化方法和工具

轉(zhuǎn)錄水平預(yù)測蛋白翻譯水平

實操內(nèi)容

創(chuàng)建Seurat對象

數(shù)據(jù)質(zhì)控

測序深度差異及標(biāo)準(zhǔn)化

單細胞數(shù)據(jù)降維

批次效應(yīng)去除

數(shù)據(jù)整合

亞群注釋

GSVA通路活性分析

單細胞富集分析

案例圖片:

三、深度學(xué)習(xí)單細胞

第一天

理論內(nèi)容

1.單細胞組學(xué)研究簡介(包含單細胞轉(zhuǎn)錄組測序技術(shù)進展及其原 理)

2.單細胞主要數(shù)據(jù)庫介紹

2.1 CellMarker

2.2 CancerSEA

2.3 Tabula Muris

2.4 TISCH

3.單細組學(xué)在腫瘤、發(fā)育、免疫及其它領(lǐng)域的研究思路的介紹 4.單細胞測序分析在科研中的應(yīng)

4.1 與 bulk 測序相較的優(yōu)勢

4.2 發(fā)現(xiàn)新細胞類型

4.3 識別細胞亞群轉(zhuǎn)錄差異

4.4 細胞互作預(yù)測

實操內(nèi)容

1.R 語基礎(chǔ)

1.1 文件讀入

1.2 數(shù)值、字符串、向量

1.3 列表 矩陣 數(shù)據(jù)框

2.數(shù)據(jù)清洗

2.1 缺失值處理

2.2 數(shù)據(jù)篩選

2.3 數(shù)據(jù)合并

2.4 數(shù)據(jù)匹配

2.5 分類變量

2.6 條件函數(shù)

2.7 字符串的切分

2.8 重復(fù)值處理

3.R 語言基礎(chǔ)繪圖

3.1 箱式圖

3.2 小提琴圖

3.3 熱圖

第二天

理論內(nèi)容

1.Seurat 對象

2.細胞質(zhì)控

2.1 nFeature

2.2 nCount

2.3 percent.mt

3.特征選擇

3.1 高變基因

3.2 FindVariableFeatures

4.降維聚類

4.1 tsne

4.2 umap

4.3 線性降維 PCA

實操內(nèi)容

1.數(shù)據(jù)讀入

1.1 10x 數(shù)據(jù)讀入

1.2 csv 數(shù)據(jù)讀入

1.3 txt 數(shù)據(jù)讀入

2. 多數(shù)據(jù)的整合

2.1 直接法

2.2 harmony 包

3.質(zhì)控

4.歸一化

5.聚類

6.tSNE/UMAP 降維

7.細胞類型注釋

7.1 自動注釋法

7.2 marker 人工注釋法

8.細胞比例計算

9.基因集打分

9.1 ssGSEA

9.2 AUCel

10.單細胞 GSVA 富集分析

11.單細胞 GSEA 富集分析

第三天

理論內(nèi)容

1.IF6+文獻解讀

2.單細胞常見圖表解讀

2.1 降維聚類圖

2.2 marker 氣泡圖/小提琴圖

2.3 細胞通訊圖

3.富集分析

3.1 基因 ID

3.2 弦表圖

3.3 和弦圖

4.細胞通訊基本原理

5.反卷積

5.1 系數(shù)表

5.2 bulk 轉(zhuǎn)錄組矩陣

實操內(nèi)容(以 IF6+文獻文獻為例)

1.單細胞差異基因分析并繪制火山圖

2.GO/KEGG 富集分析并繪制氣泡圖、柱狀圖、弦表圖 3.iTALK 分析不同細胞的通訊情況

4.Cibersortx

4.1 單細胞數(shù)據(jù)處理

4.2 bulk 數(shù)據(jù)

4.3 推測 bulk 數(shù)據(jù)新細胞類型的比例)

第四天

理論內(nèi)容

1.深度學(xué)習(xí)入門

1.1 基本概念

1.2 常用方法

1.3 科研應(yīng)用

2.LASSO 的原理和作用

2.1 正則化

2.2 懲罰參數(shù)

2.3 變量收縮

3.Randomforest 的原理和作用

3.1 Bagging 思想

3.2 OOB error

3.3 Bagging 框架參數(shù)(n_estimators、oob_score、criterion)

3.4 決策樹參數(shù)

4.SVM 的原理和作用

4.1 最大間隔超平面

4.2 支持向量

4.3 SVM 最化問題

5.ROC 曲線的原理和作用

5.1 二分類

5.2 true negative;false negative

5.3 true positive;true negative

實操內(nèi)容

1.LASSO 的應(yīng)用

1.1 lambda 選擇

1.2 特征選擇

2.Randomforest 的應(yīng)用

2.1 error 圖

2.2 氣泡圖

2.3 棒棒糖圖

3.SVM 的應(yīng)用

4.ROC 曲線的應(yīng)用

第五天

理論內(nèi)容

1.深度學(xué)習(xí)結(jié)合單細胞的應(yīng)用

1.1 細胞亞群

1.2 特征基因篩選

1.3 基因后續(xù)驗證的科研思路

2.解析深度學(xué)習(xí)結(jié)合單細胞的文獻(IF8+)

3.LASSO 與單細胞聯(lián)合

4.Randomforest 與單細胞聯(lián)合

5. SVM-RFE 與單細胞聯(lián)合

5.1 支持向量機

5.2 遞歸消除

6.人工神經(jīng)網(wǎng)絡(luò) ANN 與單細胞聯(lián)合

6.1 人工和生物神經(jīng)網(wǎng)絡(luò)之間的相似性

6.2 神經(jīng)元模型

6.3 神經(jīng)網(wǎng)絡(luò)模型

6.4 前饋神經(jīng)網(wǎng)絡(luò)

6.5 反饋神經(jīng)網(wǎng)絡(luò)

6.6 M-P 模型

6.7 neuralnet

實操內(nèi)容 (IF8+文獻為例)

1.單細胞分析(包括數(shù)據(jù)讀取、聚類降維、細胞注釋等)

2.LASSO 篩選特征基因并構(gòu)建預(yù)后模型

3.生存曲線檢驗預(yù)后模型的效果

4.cox 森林圖驗證風(fēng)險評分是否有臨床意義

5.列線表

6.免疫治療 TIDE 與風(fēng)險評分的分析

7.免疫浸潤分析風(fēng)險評分與免疫微環(huán)境的關(guān)系

8.neuralnet 的基礎(chǔ)案例實操

9.ANN 的單細胞特征基因篩

四、機器學(xué)習(xí)代謝組學(xué)

第一天

A1 代謝物及代謝組學(xué)的發(fā)展與應(yīng)用

(1) 代謝生理功能;

(2) 代謝疾病;

(3) 非靶向與靶向代謝組學(xué);

(4) 空間代謝組學(xué)與質(zhì)譜成像(MSI);

(5) 代謝流與機制研究;

(6) 代謝組學(xué)與藥物和生物標(biāo)志物。

A2 代謝組學(xué)實驗流程簡介

A3 色譜、質(zhì)譜硬件原理

(1) 色譜分析原理;

(2) 色譜的氣相、液相和固相;

(3) 色譜儀和色譜柱的選擇;

(4) 質(zhì)譜分析原理及動畫演示;

(5) 正、負離子電離模式;

(6) 色譜質(zhì)譜聯(lián)用技術(shù);

(7) LC-MS 的液相系統(tǒng)

A4 代謝通路及代謝數(shù)據(jù)庫

(1) 幾種經(jīng)典代謝通路簡介;

(2) 能量代謝通路;

(3) 三大常見代謝物庫:HMDB、METLIN 和 KEGG;

(4) 代謝組學(xué)原始數(shù)據(jù)庫:Metabolomics Workbench 和Metabolights.

第二天

B1 代謝物樣本處理與抽提

(1)組織、血液和體液樣本的提取流程與注意事項;

(2)用 ACN 抽提代謝物的流程與注意事項;

(3)樣本及代謝物的運輸與保存問題;

B2 LC-MS數(shù)據(jù)質(zhì)控與搜庫

(1)LC-MS 實驗過程中 QC 樣本的設(shè)置方法;

(2)LC-MS 上機過程的數(shù)據(jù)質(zhì)控監(jiān)測和分析;

(3)XCMS 軟件數(shù)據(jù)轉(zhuǎn)換與提峰;

B3 R軟件基礎(chǔ)

(1)R 和 Rstudio 的安裝;

(2)Rstudio 的界面配置;

(3)R 的基本數(shù)據(jù)結(jié)構(gòu)和語法;

(4)下載與加載包;

(5)函數(shù)調(diào)用和 debug;

B4 ggplot2

(1)安裝并使用 ggplot2

(2)ggplot2 的畫圖哲學(xué);

(3)ggplot2 的配色系統(tǒng);

(4)ggplot2 畫組合圖和火山圖;

第三天

機器學(xué)習(xí)

C1無監(jiān)督式機器學(xué)習(xí)在代謝組學(xué)數(shù)據(jù)處理中的應(yīng)用

(1)大數(shù)據(jù)處理中的降維;

(2)PCA 分析作圖;

(3)三種常見的聚類分析:K-means、層次分析與 SOM

(4)熱圖和 hcluster 圖的 R 語言實現(xiàn);

C2一組代謝組學(xué)數(shù)據(jù)的降維與聚類分析的 R 演練

(1)數(shù)據(jù)解析;

(2)演練與操作;

C3有監(jiān)督式機器學(xué)習(xí)在代謝組學(xué)數(shù)據(jù)處理中的應(yīng)用

(1)數(shù)據(jù)用 PCA 降維處理后仍然無法找到差異怎么辦?

(2)PLS-DA 找出最可能影響差異的代謝物;

(3)VIP score 和 coef 的意義及選擇;

(4)分類算法:支持向量機,隨機森林

C4一組代謝組學(xué)數(shù)據(jù)的分類算法實現(xiàn)的 R 演練

(1)數(shù)據(jù)解讀;

(2)演練與操作;

第四天

D1 代謝組學(xué)數(shù)據(jù)清洗與 R 語言進階

(1)代謝組學(xué)中的 t、fold-change 和響應(yīng)值;

(2)數(shù)據(jù)清洗流程;

(3)R 語言 tidyverse

(4)R 語言正則表達式;

(5)代謝組學(xué)數(shù)據(jù)過濾;

(6)代謝組學(xué)數(shù)據(jù) Scaling 原理與 R 實現(xiàn);

(7)代謝組學(xué)數(shù)據(jù)的 Normalization;

(8)代謝組學(xué)數(shù)據(jù)清洗演練;

D2在線代謝組分析網(wǎng)頁 Metaboanalyst 操作

(1)用 R 將數(shù)據(jù)清洗成網(wǎng)頁需要的格式;

(2)獨立組、配對組和多組的數(shù)據(jù)格式問題;

(3)Metaboanalyst 的 pipeline 和注意事項;

(4)Metaboanalyst 的結(jié)果查看和導(dǎo)出;

(5)Metaboanalyst 的數(shù)據(jù)編輯;

(6)全流程演練與操作

第五天

E1機器學(xué)習(xí)與代謝組學(xué)頂刊解讀(2-3 篇);

(1)Nature Communication 一篇代謝組學(xué)小鼠腦組織樣本 database 類型的文獻;

(2)Cell 一篇代謝組學(xué)患者血液樣本的機器學(xué)習(xí)與疾病判斷的文獻;

(3)1-2 篇代謝組學(xué)與轉(zhuǎn)錄組學(xué)和蛋白組學(xué)結(jié)合的文獻。

E2 文獻數(shù)據(jù)分析部分復(fù)現(xiàn)(1 篇)

(1)文獻深度解讀;

(2)實操:從原始數(shù)據(jù)下載到圖片復(fù)現(xiàn);

(3) 學(xué)員實操。

案例圖片:

五、機器學(xué)習(xí)微生物組學(xué)

第一天

機器學(xué)習(xí)及微生物學(xué)簡介

1. 機器學(xué)習(xí)基本概念介紹

2. 常用機器學(xué)習(xí)模型介紹(GLM,BF,SVM,lasso,KNN等等)

3. 混淆矩陣

4. ROC曲線

5. 主成分分析(PCA)

6. 微生物學(xué)基本概念

7. 微生物學(xué)常用分析介紹

R語言簡介及實操

1.R語言概述

2.R軟件及R包安裝

3.R語言語法及數(shù)據(jù)類型

4.條件語句

5.循環(huán)

第二天

機器學(xué)習(xí)在微生物學(xué)中的應(yīng)用案例分享

1.利用機器學(xué)習(xí)基于微生物組學(xué)數(shù)據(jù)預(yù)測宿主表

2.利用機器學(xué)習(xí)基于微生物組學(xué)數(shù)據(jù)預(yù)測疾病狀態(tài)

3.利用機器學(xué)習(xí)預(yù)測微生物風(fēng)險

4.機器學(xué)習(xí)研究飲食對腸道微生物的影響

微生物學(xué)常用分析(實操)

1. 微生物豐度分析

2. α-diversity,β-diversity分析

3. 進化樹構(gòu)建

4. 降維分析

5. 基于OTU的差異表達分析,熱圖,箱型圖繪制微生物biomarker鑒定

第三天(實操)

零代碼工具利用機器學(xué)習(xí)分析微生物組學(xué)數(shù)據(jù)

1. 加載數(shù)據(jù)及數(shù)據(jù)歸一化

2. 構(gòu)建訓(xùn)練模型(GLM, RF, SVM)

3. 模型參數(shù)優(yōu)化

4. 模型錯誤率曲線繪制

5. 混淆矩陣計算

6. 重要特征篩選

7. 模型驗證,ROC曲線繪制利用模型進行預(yù)測

第四天(實操)

利用機器學(xué)習(xí)基于微生物組學(xué)數(shù)據(jù)預(yù)測宿主表型(二分類變量以及連續(xù)變量)

1. 加載數(shù)據(jù)(三套數(shù)據(jù))

2. 數(shù)據(jù)歸一化

3. OUT特征處理

4. 機器學(xué)習(xí)模型構(gòu)建(RF, KNN, SVM, Lasso等9種機器學(xué)習(xí)方法)

5. 5倍交叉驗證

6. 繪制ROC 曲線,比較不同機器學(xué)習(xí)模型模型性能評估

第五天(實操)

利用機器學(xué)習(xí)預(yù)測微生物風(fēng)險(多分類)

1.加載數(shù)據(jù)

2.機器學(xué)習(xí)模型構(gòu)建(RF, gbm, SVM, LogitBoost等等)

3.10倍交叉驗證

4.模型性能評估

利用機器學(xué)習(xí)預(yù)測刺激前后腸道菌群變化

1.數(shù)據(jù)加載及預(yù)處理

2.α-diversity,β-diversity分析

3. RF模型構(gòu)建(比較分別基于OUT,KO,phylum的模型效果)

4.10倍交叉驗證, 留一法驗證

5.特征篩選及重要特征可視化外部數(shù)據(jù)測試模型

案例圖片:

全國各大高校、企業(yè)、科研院所從事人工智能、生命科學(xué)、代謝工程、有機合成、天然產(chǎn)物、藥物、生物信息學(xué)、植物學(xué),動物學(xué)、化學(xué)化工,醫(yī)學(xué)、基因組學(xué)、農(nóng)業(yè)科學(xué)、植物學(xué)、動物學(xué),臨床醫(yī)學(xué)、食品科學(xué)與工程、腫瘤免疫與靶向治療、 全基因組泛癌分析、人黏連蛋白折疊基因組機、病毒檢測、功能基因組、遺傳圖譜、基因挖掘變異、代謝組學(xué)、蛋白質(zhì)組學(xué)、轉(zhuǎn)錄組學(xué)、生物醫(yī)學(xué)、癌癥、核酸、毒物學(xué)等研究科研人員及愛好者

深度學(xué)習(xí)在基因組學(xué)

2023.07.29----2023.07.30全天(上午 09.00-11.30 下午 13.30-17.00)

2023.07.30----2023.07.31晚上 (晚上 19.00-22.00)

2023.08.05----2023.08.06 全天(上午 09.00-11.30 下午 13.30-17.00)

2023.08.07----2023.08.08晚上 (晚上 19.00-22.00)

機器學(xué)習(xí)轉(zhuǎn)錄組學(xué)與表觀組學(xué)

2023.07.29----2023.07.30全天(上午 09.00-11.30 下午13.30-17.00)

2023.08.05-----2023.08.06全天(上午09.00-11.30下午13.30-17.00)

2023.08.12-----2023.08.13全天(上午09.00-11.30下午13.30-17.00)

深度學(xué)習(xí)單細胞

2023.08.05----2023.08.06全天(上午 09.00-11.30 下午13.30-17.00)

2023.08.08-----2023.08.09晚上(晚上19.00-22.00)

2023.08.14-----2023.08.15全天(上午09.00-11.30下午13.30-17.00)

機器學(xué)習(xí)代謝組學(xué)

2023.08.05----2023.08.06全天(上午 09.00-11.30 下午 13.30-17.00)

2023.08.08----2023.08.09晚上 (晚上 19.00-22.00)

2023.08.12----2023.08.13全天(上午 09.00-11.30 下午 13.30-17.00)

機器學(xué)習(xí)微生物時間

2023.08.05----2023.08.06全天(上午 09.00-11.30 下午 13.30-17.00)

2023.08.08----2023.08.09晚上 (晚上 19.00-22.00)

2023.08.12----2023.08.13全天(上午 09.00-11.30 下午 13.30-17.00

關(guān)鍵詞:

  
相關(guān)新聞
每日推薦
  • 滾動
  • 綜合
  • 房產(chǎn)