如何快速从转录组数据中筛选目标基因!

如题所述

第1个回答  2022-06-07
如何从海量高通量测序数据中筛选出目标数据?这是困扰大多数老师的一个难题!

我以一个excel的简单函数为例,演示一下如何从表格中快速筛选感兴趣的基因等信息。

函数的名称是 VLOOKUP函数 ,该函数是Excel表中的一个纵向查找函数,学会该函数之后, 可以方便我们从所有基因的结果中筛选我们关心的基因相关信息,比如:基因的长度、基因在样品中的表达量、基因的注释等等信息 。

VLOOKUP函数需要输入4个值:

1、要查找的值,比如:基因的ID;

2、需要查找的区域;

3、区域中包含返回值的列号,也就是找到相关值之后返回第几列的信息;

4、精确匹配或者近似匹配,一般我们选择精确匹配。精确匹配采用0/FALSE、近似匹配采用1/TRUE。

一般来说,我们做完转录组测序,都会有一个总表,表里有所有基因的ID、长度、表达量、差异倍数、注释信息等等,表格很大,内容很多。

如果我们想提取某些差异基因的基因长度信息,那么我们该如何操作呢?

我们需要在需要提取长度信息的差异基因表中加上一列gene_length列。

然后插入VLOOKUP函数,按要求输入4个参数,点击确定即可。

以上是利用基因ID在总表中查找一列信息,比较简单。如果我们想查找多列信息该如何操作呢?

方法相似,我们可以在总表中插入deg_gene列,然后去差异基因表中查找基因ID即可,具体操作如下:

到这里,一个简单的Excel表筛选基因信息的方法就介绍完了,实际上在公司给出转录组标准分析之后,很多个性化都可以由自己解决,您需要的仅仅是高手领进门!

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接: 基因家族分析实操课程 、 基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接: 转录组(有参)结果解读 ; 转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接: WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接: 转录组标准分析后的数据挖掘 、 转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读 、 OTU网络图绘制 、 cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接: linux系统使用 、 perl入门到精通 、 perl语言高级 、 R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接: TCGA-差异基因分析 、 GEO芯片数据挖掘 、 GSEA富集分析课程 、 TCGA临床数据生存分析 、 TCGA-转录因子分析 、 TCGA-ceRNA调控网络分析

8.其他课程链接: 二代测序转录组数据自主分析 、 NCBI数据上传 、 二代测序数据解读 。