基本信息
- 项目名称:
- 数字候选基因法及其在挖掘猪新候选基因中的应用
- 来源:
- 第十一届“挑战杯”国赛作品
- 小类:
- 生命科学
- 大类:
- 自然科学类学术论文
- 简介:
- 候选基因法是畜禽经济性状基因的主要挖掘手段之一,但传统候选基因法的应用受到了信息瓶颈的严重制约。如何打破信息瓶颈,对传统候选基因法进行新的发展具有重要的科学意义。 网络资源的快速积累促进了数字化分析技术的发展,网络数据库中海量的数据为打破传统候选基因法面临的信息瓶颈提供了契机。本项目将通过深入挖掘网络数据,发展新的数字候选基因法,并在猪的经济性状基因挖掘进行尝试性应用。
- 详细介绍:
- 1 猪经济性状相关基因研究进展及加大新基因挖掘力度的必要性 建立在微效基因(多基因)模型基础上的传统数量遗传学对家养农业动物的遗传改良作出了巨大贡献,但长期以来缺乏剖解、分析单个数量性状基因的方法和手段,分子数量遗传学的出现则改变了这种局面。近年来,运用分子数量遗传学的研究方法挖掘家猪经济性状主基因或连锁标记一直是畜牧科学的研究热点。目前,在猪的连锁图谱上已积累了近万个标记,其中包括了数千个功能基因 ( )。猪基因作图结果的快速积累为其经济性状相关基因的筛选奠定了良好的基础。 到目前为止,通过候选基因法(candidate gene approach)或基因组扫描法(genome-wide scan),已鉴定出一些与繁殖、生长、胴体和肌肉品质性状相关的基因(含QTL)或与之连锁的分子标记。氟烷基因(Hal)中的氟烷敏感等位基因(Haln)已被证明能促进肌肉生长,抑制脂肪沉积并能导致PSE肉的发生(Smith and Bampton,1977;Fujii, et al, 1991;Leach, et al, 1996)。酸肉基因(RN基因)中RN-等位基因使得猪肉加工后失重多,引起酸肉状态(Le Roy, et al,1990;Milan,et al,1996)。ESR、FSHβ亚基和PRLR等基因作为产仔数的候选基因已引起国内外的广泛关注(Rothschild et al, 1996;Short et al, 1997;赵要风等,1999;朱猛进等,2001;Kaminski et al, 2002;Isler et al, 2002;van Rens et al, 2002;徐迎宁等,2003)。生长激素(growth hormone, GH)基因和类胰岛素生长因子(insulin-like growth factor,IGF)基因由于在生长轴中调控地位的重要性而曾被当作肌肉生长性状的候选基因(Casas-Carrillo, et al,1997;Knorr, et al,1997;Cheng,et al,2000),其中IGF已被确定为狗体型控制主基因(Sutter, et al., 2007)。心脏脂肪酸结合蛋白基因(heart fatty acid binding protein,H-FABP)和脂肪组织脂肪酸结合蛋白基因(adipocyte fatty acid binding protein,A-FABP)作为肌内脂肪含量(intramuscular fat content,IMF)的候选标记也引起了国内外学者的注意(Gerbens, et al,1997;1998;1999;2000;Nechtelberger et al, 2001)。此外,te Pas等(1999)发现肌细胞生成素基因(myogenin,MYOG)和初生重、生长速度及瘦肉率相关。钙蛋白酶抑制蛋白基因(calpastatin,CAST)和抑肌素基因(myostatin gene, MSTN)是肌肉生长的重要候选基因之一(Ernst,et al,1998)。与脂肪酸代谢有关酶类、结合蛋白基因是背膘厚和瘦肉率的重要候选基因,如激素敏感脂肪酶基因(hormone sensitive lipase, HSL)、肥胖基因(obese, OB)等。在基因组扫描法研究方面, De koning等(1999)利用127个微卫星标记将背膘厚QTL定位在7号和2号染色体上,同时将肌内脂肪QTL定位在2、4、6和7号染色体上。还有研究者将肌纤维数QTL定位在12号染色体上(Anderson,et al,1996);将肌肉嫩度QTL定位在4、7和15号染色体上(Rothschild, et al,1995;Paszek,et al,1998);将平均背膘厚和腹肥肉率QTL定位在4号染色体上(Anderson,et al,1994)。综合来看,生长和背膘厚的QTL在1、2、3、4、6、7、8、13、14和15号染色体上均有发现,肉质性状的QTL在2、3、4、6、7、12和15号染色体有分布,而繁殖性状的QTL则被定位到4、6、7和8号染色体上。 在这些研究中,多数基因(或连锁标记)还无法得到肯定,QTL在染色体上的位置的重复性不高、稳定性较差,连锁距离过大,甚至还有相互矛盾的结果。除了氟烷基因(Hal)和酸肉基因(RN基因)这类近乎质量性状的主基因外,对于猪繁殖、肌肉生长、脂肪沉积这些典型数量性状的研究尚未得到绝对认可的结果。总而言之,基因定位的结果积累很快,但能得以确认的结果却很少(杨达,2003),目前鉴定和积累的基因或标记还远达不到实际应用的程度。对于猪的多数经济性状而言,仍然需要大规模筛选控制基因或连锁标记,深入挖掘新的候选基因仍然十分必要。 2 猪基因(组)转录谱及研究方法发展现状及不足 对猪经济性状分子遗传基础的研究有助于发现新的候选基因,因此国内外学者在挖掘猪主要经济性状候选基因的同时,对猪经济性状分子遗传基础的研究亦十分重视。分析基因转录过程是目前获得目标性状分子遗传基础知识的主要手段,所以基因转录谱已成为当前学术界的研究热点之一。 研究基因转录谱(transcriptome)的方法有两类,一是基于生物信息学原理的数字化技术(in silico techniques),即研究基因的数字化表达图谱(Audic,et al,1998;Bortoluzzi, et al,2000;Moreno, et al,2001;Bakay, et al,2002),二是用于基因实际表达分析的分子生物学实验方法,包括Northern杂交、逆转录-PCR(RT-PCR)、差异显示PCR方法(differential display RT-PCR, DDRT-PCR)、消减杂交(subtractive hybridization, SH)、DNA芯片技术(DNA chip technique)、基因表达系列分析(serial analysis of gene expression, SAGE)、表达序列标签串联排列连接(tandem arrayed ligation of expressed sequence tags, TALEST)(Spinella et al,1999)和GeneCalling(Shimkets,2004)等,其中涉及猪的研究多集中于分子生物学方法。Wesolowski等(2004)用DDRT-PCR技术对母猪胎儿快速生长期(21、35和45天)内胚胎的11个重要功能基因的转录谱变化进行了研究。Junghans等(2004)用DDRT-PCR和实时RT-PCR技术比较了在饲喂大豆蛋白日粮和酪蛋白日粮下生长猪肝脏四个基因的差异表达情况。Blomberg le和Zuelke(2004)以附植前胚胎作实验材料,首先公开报道了SAGE技术用于猪的转录谱分析。Bai等(2003)用cDNA microarray技术测定了猪不同类型骨骼肌中低等和中等丰度表达基因的差异转录谱,鉴定出一批可能参与肌肉表型决定(phenotype determination)的候选基因。赵书红等(2003)用cDNA 宏阵列技术对猪胚胎期和出生后骨骼肌基因表达差异进行了初步研究。潘佩文等(2002)用mRNA差异显示技术分析了不同猪种肌肉发育过程中基因的表达差异,筛选出一批猪种特异表达和差异表达的ESTs。另外,该领域的不少研究主要着重于对研究技术的发展(Moody,et al,2002;Yao,et al,2002;Nobis,et al,2003; Bertani,et al,2003)。 从这些研究进展可以发现,目前有关猪基因转录谱的研究主要局限于分子生物学实验方法。在这些分子生物学实验方法中,差异显示技术(DDRT-PCR)检测基因数目有限,重复性较差,不适合大规模的基因表达研究。尽管少数实验室开始在猪中运用cDNA阵列和SAGE这类基因高通量技术研究猪的基因转录谱,但对于那些旨在筛选猪经济性状主基因或连锁标记的普通研究室而言,很难承担cDNA阵列和SAGE技术带来的高昂实验成本。总之,目前有关猪基因转录谱的研究并不系统,侧重于分子生物学技术本身的研究较多,重点探讨经济性状分子遗传基础的研究较为欠缺,一些新的研究策略的运用相对不足,该领域的研究需要进一步加强和深入。 3 数字候选基因法的提出 候选基因法(candidate gene approach)和基因组扫描法(genome-wide scan) 是挖掘畜禽数量性状主基因和关联标记的两种基本方法。其中,候选基因法具有不需要特殊试验设计、统计检验效率较高、成本低廉、操作简便、检测方案易于实施、适用于除高度连锁不平衡群体之外的任何群体以及可直接运用于分子育种实践等优点(徐迎宁,1999;张沅等,2001)。不过,传统候选基因法的缺点也很明显。一方面,确定候选基因的过程是一个含有较多主观推测成分的过程,与之配套的下游统计分析方法亦不能直接判定所筛选的候选基因是目标性状的主基因还是与QTLs不平衡连锁的间接标记;另一方面,人们确定候选基因多基于激素调控、生化路径等生理生化信息,这使得可用的候选信息十分有限,信息瓶颈已成为制约候选基因法进一步应用的明显障碍。因此,如何克服候选基因法的缺点是目前筛选经济性状基因的研究中所面临的重要问题。 对于一个具体的数量性状而言,表型直接由基因的表达过程所决定,即表型变异直接对应于基因表达过程的变异,因而性状的表型变异最终是由直接控制和间接参与基因所引起的表达过程变化所决定(环境作用一般通过应激相关基因及其下游级联基因的表达途径作用于性状)。显然,性状本身的组织内或上游信息源器官内(如肌肉的上游信息源器官为肝脏和垂体)影响性状发育过程表达变化的基因就是控制性状表型变异的基因。因此,从性状本身的基因表达调控过程着手,是突破信息瓶颈制约的有效途径。不过,在基因表达过程的变异组分中,主要组分体现了内外环境的影响,不能由上代传给下代,是非遗传性的,只有部分变异组分由遗传所致。显然,控制性状变异的候选基因的相关信息已经蕴含在基因表达信息中,通过对性状发育过程基因表达规律的分析是获取候选基因的有效途径。但是,一般实验室很难承受用高通量分子生物学方法测定性状基因转录谱带来的高昂试验成本。随着网络资源的指数型增长,已出现多种储存基因表达信息的网络数据库,分子生物学实验不再是获取基因表达信息的唯一途径。由于数据库的信息源是世界各地研究者通过实验得到的真实数据及其衍生数据,因此,在信息量庞大的网络数据库支持下,通过检索数据库获取的信息量远比一次或少数几次实际分子生物学实验得到的信息多。显然,通过网络资源分析特定性状发育的基因表达过程已初步具备成熟条件。不过,在如何利用网络数据库基因表达信息揭示性状分子遗传基础,以及如何构建并利用数字化的表达过程筛选经济性状候选基因方面,尚未建立配套的系统理论和方法。数字候选基因法(digital candidate gene approach,DigiCGA)的核心功能是从性状虚拟转录过程中提取可能的候选基因。不同于电脑克隆、CATS等比较结构基因组学方法,它在信息源的利用上,遵守了比较功能基因组学原理,即综合利用网络数据库中多个物种同类性状的基因表达信息,构建某一物种目标性状的数字化转录过程,并通过转录过程的规律分析进而筛选出性状可能的候选基因。 4. 本项目作品的研究内容 传统的候选基因法严重依赖于已有的先验信息,存在耗费高、需时多、主观臆断等诸多不足。当前网络数据库迅速发展,各种基因组数据大量积累,发展一种新的生物信息学原理的数字化策略筛选候选基因,可以打破信息瓶颈,大大缩短筛选时间和减少耗费,达到经济、迅速筛选候选基因的目的。 本项目作品发展了候选基因法并提供了相应软件。数字候选基因法做为传统候选基因法的发展,通过综合利用网络资源和多来源数据,克服了传统候选基因法受信息瓶颈制约的不足。本作品提供的研究思想和软件可在先验知识不足的经济性状候选基因筛选中得到较为广泛的应用,具有重要的实际应用价值。 作品进一步挖掘了数字候选基因法的理论基础,建立相关分析策略,并通过策略应用,筛选候选基因并进行验证,旨在建立一个数字候选基因法的理论可行策略和应用模型,为对数字化筛选新候选基因研究提供参考依据和可行措施。
作品专业信息
撰写目的和基本思路
- 【目的】建立数字候选基因法的分析策略和框架,对传统候选基因法进行新的发展。 【基本思路】 一、利用生物信息手段构建数字候选基因的筛选策略; 二、以目标性状为例,选取网络数据库下载数据并进行整合分析,为数字化筛选提供标准数据集,通过数据联合分析筛取目标性状候选基因; 三、开发相应分析工具对数据进行分析。
科学性、先进性及独特之处
- 一、发展了一种新方法——数字候选基因法。提出猪数字候选基因分析策略,探索性尝试把该方法引入到猪育种领域,为后续研究提供参考依据。 二、提出了“振荡平衡假说”,并整合了网络免疫基因数据,为数字候选基因法挖掘猪抗病性状基因提供了数据源。 三、自主开发了分析软件Filter,可主要完成针对猪健康性状进行数据联合分析的三种功能,支持Excel直接读入和输出,并可扩展应用到猪其它性状的相关分析中。
应用价值和现实意义
- 实际应用价值 发展了数字候选基因法并提供了相应软件,突出综合利用网络资源克服信息瓶颈,可在经济性状候选基因筛选中实际应用 现实意义 传统的候选基因法存在信息瓶颈等不足。当前网络数据库迅速发展,发展新的生物信息学原理的数字化筛选策略,可达到经济、迅速筛选候选基因的目的。 项目探索了数字候选基因法的操作流程,并进行了实际应用,为畜禽经济性状基因的挖掘提供了新方法。
学术论文摘要
- 中文翻译: 1 《数字候选基因法:一种鉴定候选基因的数字化方法》 摘要:到目前,候选基因法和基因组扫描法已被广泛使用。然而由于信息瓶颈和其它缺点,该领域的研究并未取得预期进展。几十年来网络数据呈现指数性增长,为数字候选基因法的出现奠定了基础。在这里,我们就数字候选基因法及我们提出的候选基因鉴定策略等相关内容进行了总结。 2 《动物先天性免疫信号通路:超越还原主义》 摘要:免疫系统在保持生物内环境的稳定和平衡方面扮演着关键角色。动物先天性免疫一直是全球免疫学研究的焦点,目前已知其功能依赖于免疫信号通路网络或级联分子机器的行为。到目前,相关研究多集中在级联分子组分与功能鉴定上,未对整体特征给予足够重视,本质上遵循了还原论研究模式。本文强调该研究领域从还原论到系统观点的转变,前半部分对动物先天性免疫信号通路主要方面进行了总结,着重强调免疫信号通路的整体特征,后半部分根据信号通路的整体特征提出了基于整体观的振荡平衡假说,主要用来刻画动物先天性免疫系统信号转导的整体特性,有助于从免疫网络整合角度理解某些免疫学现象。 3 软件论文已初步完成
获奖情况
- 1 论文《Digital candidate gene approach (DigiCGA): A digitalized approach for candidate gene identification》已在中国畜牧兽医学会信息技术分会2008年学术讨论会论文集上发表,页数180-185. 2 论文《Innate Immune Signaling Pathways in Animals: Beyond Reductionism》已被International Reviews of Immunology杂志正式接受(该杂志最新影响因子为4.935) 3 2009年荣获湖北省第七届“挑战杯”大学生课外学术作品竞赛 “特等奖”
鉴定结果
- 1 发表了2篇论文(含SCI论文) 2 自主开发了数字候选基因法的配套软件 3 2009年荣获湖北省第七届“挑战杯”大学生课外学术作品竞赛 “特等奖”
参考文献
- 1 M J Zhu and S H Zhao, Candidate Gene Identification Approach: Progress and Challenges. Int J Biol Sci 3(7):420-427, 2007. 2 N Tiffin, et al. Integration of text- and data-mining using ontologies successfully selects disease gene candidates. Nucleic Acids Res 33(5): 1544-1552, 2005. 3 M Ceresa, et al. A web-enabled database of human gene expression controlled annotations for gene list functional evaluation. Conf Proc IEEE Eng Med Biol Soc 2007:394-7, 2007. 4 R Medzhitov and C Jr Laneway, Advance in immology. New Engl J Med 343: 338-344, 2000. 5 Z Cao, et al, and D V Goeddel, TRAF6 is a signal transducer for Interleukin-1.Nature 383: 443-446, 1996. 6 H Kikuchi, J Itoh, and S Fukuda, Chronic nicotine stimulation modulates the immune response of mucosal T cells to Th1-dominant pattern via nAChR by upregulation of Th1-specific transcriptional factor. Neurosci Lett 432: 217-221, 2008.
同类课题研究水平概述
- 目前有关猪基因转录谱的研究主要局限于分子生物学实验方法。在这些分子生物学实验方法中,差异显示技术检测基因数目有限,重复性较差,不适合大规模的基因表达研究。尽管少数实验室开始在猪中运用cDNA阵列和SAGE这类基因高通量技术研究猪的基因转录谱,但对于普通研究室而言,很难承担高昂的实验成本。总之,目前有关猪基因转录谱的研究并不系统,侧重于分子生物学技术本身的研究较多,重点探讨经济性状分子遗传基础的研究较为欠缺,一些新的研究策略的运用相对不足,该领域的研究需要进一步加强和深入。 候选基因法和基因组扫描法是挖掘畜禽数量性状主基因和关联标记的两种基本方法。其中,候选基因法具有不需要特殊试验设计、统计检验效率较高、成本低廉、操作简便、检测方案易于实施、适用于除高度连锁不平衡群体之外的任何群体以及可直接运用于分子育种实践等优点。不过,传统候选基因法的缺点也很明显。一方面,确定候选基因的过程是一个含有较多主观推测成分的过程,与之配套的下游统计分析方法亦不能直接判定所筛选的候选基因是目标性状的主基因还是与QTLs不平衡连锁的间接标记;另一方面,人们确定候选基因多基于激素调控、生化路径等生理生化信息,这使得可用的候选信息十分有限,信息瓶颈已成为制约候选基因法进一步应用的明显障碍。因此,如何克服候选基因法的缺点是目前筛选经济性状基因的研究中所面临的重要问题。 随着网络资源的指数型增长,已出现多种储存基因表达信息的网络数据库,由于数据库的信息源是世界各地研究者通过实验得到的真实数据及其衍生数据,因此,在信息量庞大的网络数据库支持下,通过检索数据库获取的信息量远比一次或少数几次实际分子生物学实验得到的信息多。显然,通过网络资源分析特定性状发育的基因表达过程已初步具备成熟条件。不过,在如何利用网络数据库基因表达信息揭示性状分子遗传基础,以及如何构建并利用数字化的表达过程筛选经济性状候选基因方面,尚未建立配套的系统理论和方法。数字候选基因法的核心功能是从性状虚拟转录过程中提取可能的候选基因。不同于电脑克隆、CATS等比较结构基因组学方法,它在信息源的利用上,遵守了比较功能基因组学原理,即综合利用网络数据库中多个物种同类性状的基因表达信息,构建某一物种目标性状的数字化转录过程,并通过转录过程的规律分析进而筛选出性状可能的候选基因。