WGCNA分析--提升转录组测序文章档次的利器

如题所述

第1个回答  2024-06-24
现在进行转录组测序,查看差异基因,进行富集分析,讨论差异基因功能与自己研究性状或处理之间的关系,再加上简单的qPCR验证,这样的数据在发表SCI时影响因子越来越低。为了突破这一困境,必须增加新的分析内容。今天,我们将介绍一个能显著提升文章档次的分析工具——基因共表达网络分析(WGCNA)。该分析对样品数量有一定要求,建议不少于15个,但随着测序成本的降低,达到这一数量已不再是难事。接下来,我们将通过两篇文献了解如何利用WGCNA分析基因共表达网络,以提升文章质量。
文章1:
题目:Identification of regulatory networks and hub genes controlling soybean seed set and size using RNA sequencing analysis
期刊:Journal of Experimental Botany
IF:5.3
性状:大豆籽粒大小
实验材料:
大豆籽粒的大小是一个重要的农艺性状,直接影响大豆产量。为了找到决定大豆籽粒大小的关键调控基因,作者选择了两个大豆品种进行转录组分析,分别是大籽粒Wandou 28 (V1)和小籽粒Peixian Layanghuang (V2)。取样时期为三个时期:种子发育(S1)、种子生长(S2)和早期种子成熟(S3),其中前两个时期的取样部位分别为:带籽的豆荚(S1)和完整种子(S2),S3时期取了两个部位分别为:种皮(S3-1)和子叶(S3-2),每个品种每个样品三个生物学重复,共24个样品。
转录组分析结果:
对转录组分析结果中每个基因的表达量进行计算,删除表达量低的基因(FPKM<0.5)。然后,统计每个时期不同品种基因表达量高低的分布图,约一半的基因处于低表达水平0.5<=FPKM<=5。PCA分析发现,样品按照不同发育时期聚类,而不是按照不同品种聚类,说明发育时期是决定基因表达谱的关键因素,而性状的不同引起的转录表达差异较小。
差异基因分析:
差异基因分析显示,在相同发育时期,不同品种之间的差异基因数量以及在不同发育时期之间的差异基因数量。
差异基因功能注释分析:
主要针对决定籽粒大小的差异基因进行功能分析,挑选出一些代表基因,查看其功能和表达量。例如,在V1S1 vs V2S1差异比较中,共找到973个差异基因,其中489个基因上调,484个基因下调。上调的代表基因的功能及表达量如下,其中包括转录因子、植物激素(生长素等)、脂肪酸代谢、蛋白激酶活性、类黄酮生物合成等功能相关的基因。
WGCNA分析:
找到调控籽粒大小的关键hub基因。首先对所有样品所有基因的表达量矩阵进行过滤,删除表达量低的基因(FPKM<0.05),共有7359个基因用于基因共表达网络构建。分析得到12个共表达基因模块,其中有4个模块与种子大小相关。
关键模块基因共表达网络构建:
导出WGCNA共表达网络分析结果,绘制模块中基因的表达量热图和网络图。通过研究这些hub基因的功能发现,这些网络中的关键hub基因,包括MYB家族转录因子、激素(ABA、CK、BA)响应因子、细胞色素P450、BR信号激酶等,都可能与籽粒的大小相关。
文章2:
题目:Global transcriptome and co-expression network analyses reveal cultivar-specific molecular signatures associated with seed development and seed size/weight determination in chickpea analysis
期刊:The Plant Journal
IF:5.7
性状:鹰嘴豆籽粒大小
实验材料与方法:
这篇文章与上一篇文章思路几乎一致,只是研究的物种变成了鹰嘴豆。同样的,也是选取了两个籽粒大小差异明显的栽培品种:Himchana 1 (小籽粒)和JGK 3 (大籽粒),取样时期为每个样品7个时期S1-S7,分别为授粉后5, 9, 12, 19, 25, 30和40天(DAP),还测了一下叶片的转录组,并取3个生物学重复,共48个样品。
转录组测序结果:
利用转录组测序所有基因以及所有样品的表达矩阵进行相关性分析和PCA聚类分析,从中可以发现,相同的发育状态或组织聚类在一起,说明他们之间具有较强的相关性。
差异基因比较分析:
作者主要比较了相同发育状态不同品种之间的转录组差异比较,差异基因的上下调数量和其中转录因子的数量。另外还统计差异基因中不同类型转录因子的数量。
基因共表达网络分析:
首先作者将不同的样品按籽粒大小不同品种分开,分别用WGCNA做共表达网络分析,其中在Himchana 1样品中共找到27个模块(a),在JGK 3样品中找到21个模块(b)。模块与样品之间相关性分析,从而发现不同发育时期的特有的基因模块。
结合上一步的分析结果,再来分析两个品种各自得到的模块之间的相关性。作者推断这个特殊的模块很可能与籽粒大小相关。作者进一步研究这些模块中基因表达情况发现里面很多基因的表达量(在S3和S5时期)在不同的品种中具有相反的表达。之后作者进一步研究这些模块里面基因的相关功能等等。
总结:
上述两篇文章都是植物当中普通的转录组文章,由于添加了WGCNA分析从另一个角度分析与性状相关的基因,文章的档次提升不少。想得到WGCNA的分析技能吗,点击《 WGCNA视频教学视频 》即可观看:手把手教学包你学会。
更多生物信息课程:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课,学习链接:linux系统使用、perl入门到精通、perl语言高级、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析、GEO芯片数据挖掘、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8. 其他课程链接:二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读。