人类基因组怎样形成的?

如题所述

人类基因组,又译人类基因体,是智慧人种的基因组。共组成24个染色体,分别是22个体染色体、X染色体与Y染色体,含有约30亿个DNA碱基对。碱基对是以氢键相结合的两个含氮碱基,以A、T、C、G四种碱基排列成碱基序列。其中一部分的碱基对组成了大约20000到25000个基因。

全世界的生物学与医学界在人类基因组计划中,调查人类基因组中的真染色质基因序列。发现人类的基因数量比原先预期的更少,其中的外显子,也就是能够制造蛋白质的编码序列,只占总长度的1.5%。

现代遗传学家认为,基因是DNA(脱氧核糖核酸)分子上具有遗传效应的特定核苷酸序列的总称,是具有遗传效应的DNA分子片段。基因位于染色体上,并在染色体上呈线性排列。基因不仅可以通过复制把遗传信息传递给下一代,还可以使遗传信息得到表达。不同人种之间头发、肤色、眼睛、鼻子等不同,是基因差异所致。

人类只有一个基因组,大约有5万~10万个基因。

随着人类基因组逐渐被破译,一张生命之图将被绘就,人们的生活也将发生巨大变化。基因药物已经走进人们的生活,利用基因治疗更多的疾病不再是一个奢望。因为随着我们对人类本身的了解迈上新的台阶,很多疾病的病因将被揭开,药物就会设计得更好些,治疗方案就能“对因下药”,生活起居、饮食习惯有可能根据基因情况进行调整,人类的整体健康状况将会提高,21世纪的医学基础将由此奠定。

利用基因,人们可以改良果蔬品种,提高农作物的品质,更多的转基因植物和动物、食品将问世,人类可能在新世纪里培育出超级作物。通过控制人体的生化特性,人类将能够恢复或修复人体细胞和器官的功能,甚至改变人类的进化过程。

人类基因组计划人类基因组计划(HGP)是由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法兰西共和国、德意志联邦共和国、日本和我国科学家共同参与了这一价值达30亿美元的人类基因组计划。按照这个计划的设想,在2005年,要把人体内约10万个基因的密码全部解开,同时绘制出人类基因的谱图。换句话说,就是要揭开组成人体10万个基因的30亿个碱基对的秘密。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。

1986年,诺贝尔奖获得者Renato Dulbecco发表短文《肿瘤研究的转折点:人类基因组测序》(Science, 231: 1055~1056)。文中指出:“如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。……从哪个物种着手努力?如果我们想理解人类肿瘤,那就应从人类开始。……人类肿瘤研究将因对DNA的详细知识而得到巨大推动。”

什么是基因组·基因组就是一个物种中所有基因的整体组成。人类基因组有两层意义:遗传信息和遗传物质。要揭开生命的奥秘,就需要从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。

为什么选择人类的基因组进行研究?因为人类是在“进化”历程上最高级的生物,对它的研究有助于认识自身、掌握生老病死规律、疾病的诊断和治疗、了解生命的起源。

测出人类基因组DNA的30亿个碱基对的序列,发现所有人类基因,找出它们在染色体上的位置,破译人类全部遗传信息。

在人类基因组计划中,还包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。

HGP的目的是解码生命、了解生命的起源、了解生命体生长发育的规律、认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。

HGP的主要任务是人类的DNA测序,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。

1.遗传图谱

遗传图谱又称连锁图谱,它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cm)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。

第一代标记:经典的遗传标记,例如ABO血型位点标记,HLA位点标记。20世纪70年中后期,限制性片段长度多态性(RFLP),位点数目大与105,用限制性内切酶特异性切割DNA链,由于DNA的一个“点”上的变异所造成的能切与不能切两种状况,可产生不同长度的片段(等位片段),可用凝胶电泳显示多态性,从片段多态性的信息与疾病表型间的关系进行连锁分析,找到致病基因。如Huntington症。但每次酶切2~3个片段,信息量有限。

第二代标记:1985年,小卫星中心、可变串联重复VNTR可提供不同长度的片段,其重复单位长度为6~12个核苷酸,1989年微卫星标记系统被发现和建立,重复单位长度为2~6个核苷酸,又称简短串联重复(STR)。

第三代标记:1996年MIT的Lander ES又提出了SNP(single nucleotide polymorphysm)的遗传标记系统。对每一核苷酸突变率为10~9,双等位型标记,在人类基因组中可达到300万个,平均约每1250个碱基对就会有一个。3~4个相邻的标记构成的单倍型(haplotype)就可有8~16种。

2.物理图谱

物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法——标记片段的部分酶解法,来说明图谱制作原理。

用部分酶解法测定DNA物理图谱包括两个基本步骤:

(1)完全降解:选择合适的限制性内切酶将待测DNA链(已经标记放射性同位素)完全降解,降解产物经凝胶电泳分离后进行自显影,获得的图谱即为组成该DNA链的酶切片段的数目和大小。

(2)部分降解:以末端标记使待测DNA的一条链带上示踪同位素,然后用上述相同酶部分降解该DNA链,即通过控制反应条件使DNA链上该酶的切口随机断裂,而避免所有切口断裂的完全降解发生。部分酶解产物同样进行电泳分离及自显影。比较上述二步的自显影图谱,根据片段大小及彼此间的差异即可排出酶切片段在DNA链上的位置。下面是测定某组蛋白基因DNA物理图谱的详细说明。

完整的物理图谱应包括人类基因组的不同载体DNA克隆片段重叠群图,大片段限制性内切酶切点图,DNA片段或一特异DNA序列(STS)的路标图,以及基因组中广泛存在的特征型序列(如CpG序列、Alu序列,isochore)等的标记图,人类基因组的细胞遗传学图(即染色体的区、带、亚带,或以染色体长度的百分率定标记),最终在分子水平上与序列图的统一。

基本原理是把庞大的无从下手的DNA先“敲碎”,再拼接。以Mb、kb、bp作为图距,以DNA探针的STS(sequence tags site)序列为路标。1998 年完成了具有52000个序列标签位点(STS),并覆盖人类基因组大部分区域的连续克隆系的物理图谱。构建物理图的一个主要内容是把含有STS对应序列的DNA的克隆片段连接成相互重叠的“片段重叠群(contig)”。用“酵母人工染色体(YAC)作为载体的载有人DNA片段的文库已包含了构建总体覆盖率为100%、具有高度代表性的片段重叠群”,近几年来又发展了可靠性更高的BAC、PAC库或cosmid库等。

3.序列图谱

随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。

HGP对人类的重要意义

1.HGP对人类疾病基因研究的贡献

人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。对于单基因病,采用“定位克隆”和“定位候选克隆”的全新思路,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。对于心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。健康相关研究是HGP的重要组成部分,1997年相继提出:“肿瘤基因组解剖计划”“环境基因组学计划”。

2.HGP对医学的贡献

基因诊断、基因治疗和基于基因组知识的治疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预。

3.HGP对生物技术的贡献

(1)基因工程药物:分泌蛋白(多肽激素,生长因子,趋化因子,凝血和抗凝血因子等)及其受体。

(2)诊断和研究试剂产业:基因和抗体试剂盒、诊断和研究用生物芯片、疾病和筛药模型。

(3)对细胞、胚胎、组织工程的推动:胚胎和成年期干细胞、克隆技术、器官再造。

4.HGP对制药工业的贡献

筛选药物的靶点:与组合化学和天然化合物分离技术结合,建立高通量的受体、酶结合试验以知识为基础的药物设计:基因蛋白产物的高级结构分析、预测、模拟——药物作用“口袋”。

个体化的药物治疗:药物基因组学。

5.HGP对社会经济的重要影响

生物产业与信息产业是一个国家的两大经济支柱;发现新功能基因的社会和经济效益;转基因食品;转基因药物(如减肥药,增高药)。

6.HGP对生物进化研究的影响

生物的进化史,都刻写在各基因组的“天书”上;草履虫是人的亲戚——13亿年;人是由300万~400万年前的一种猴子进化来的;人类第一次“走出非洲”——200万年的古猿;人类的“夏娃”来自于非洲,距今20万年——第二次“走出非洲”。

7.HGP带来的负面作用

侏罗纪公园不只是科幻故事;种族选择性灭绝性生物武器;基因专利战;基因资源的掠夺战;基因与个人隐私。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-12-24
7. 把下面这段话译成汉语
机器学习方法也用于生物信息学。我们基因组中的DNA是“生命的印记”,是碱基序列,即a、G、C、t。蛋白质是生物体的组成和功能。正如DNA是碱基序列一样,蛋白质是氨基酸序列(由碱基定义)。分子生物学中计算机科学的一个应用是序列比对。
这是一个困难的字符串匹配问题,因为字符串可能很长,有很多模板。
字符串。要匹配,可能会有删除、插入和替换。聚类用于学习基序,基序是蛋白质中重复出现的氨基酸序列。基序是有趣的,因为它们可能对应于它们所描述的序列中的结构或功能元素。这个类比是,如果氨基酸是字母,蛋白质是句子,图形就像单词一样,即一串具有特定意义的字母,经常出现在不同的句子中。(5%)