基因组多态性、单核苷酸多态性和国际人类基因组单倍型作图计划

基因组多态性、单核苷酸多态性和国际人类基因组单倍型作图计划

一、基因组多态性、单核苷酸多态性和“国际人类基因组单倍型图谱计划”(论文文献综述)

胡乃文[1](2020)在《TNF,GRN和ERAP1基因多态性与强直性脊柱炎的关联性研究》文中指出第一部分中国汉族人群TNF和GRN基因多态性与强直性脊柱炎的关联性研究研究背景脊柱关节炎(spondyloarthritis,SpA)是一组具有共同临床特点和遗传学特征的慢性炎症性疾病。强直性脊柱炎(Ankylosingspondylitis,AS)是SpA最常见的表现形式。家族聚集性是AS的重要特征。人类白细胞抗原(humanleukocyte antigen,HLA)-B27是迄今为止所发现与AS关联性最强的基因。但近年来的研究发现,非HLA-B27基因在AS发病中亦具有重要作用。因此,为进一步明确AS的病因及发病机制,有必要探讨非HLA-B27基因在AS发病中的作用。单核苷酸多态性(Single Nucleotide Polymophisms,SNP),是指单个核苷酸在基因组水平上发生变异所导致的DNA序列多态性。由于SNP广泛存在于各人群的基因组中,且易于分型,目前业已成为现代遗传变异与复杂性状研究中的最重要研究对象。肿瘤坏死因子(tumornecrosis factor,TNF)基因,位于6p21.33,是一种非HLA的MHC基因。该基因编码一种属于肿瘤坏死因子超家族的、主要由巨噬细胞分泌的促炎细胞因子。它可以与TNFRSF1A/TNFR1和TNFRSF1B/TNFBR受体结合,从而发挥作用。TNF与包括自身免疫病在内的多种疾病有关。近来的研究表明TNF在AS发病机制中具有重要作用。关于TNF是脊柱关节炎的关键细胞因子的最有力证据是,在临床中使用TNF抑制剂可以有效改善脊柱关节炎(包括强直性脊柱炎)患者的症状和体征。从组织水平上,TNF抑制剂可以引起一系列的组织学改善,包括减少中性粒细胞和巨噬细胞的炎性浸润、减少新骨形成等。既往已有诸多关于TNF基因的SNP与AS相关性的研究,但是存在争议。因此,有必要进一步研究TNF的SNP与AS的关系。GRN基因即颗粒蛋白前体(granulin precursor,PGRN)基因,位于17q21.31,其功能为编码颗粒蛋白(granulin,GRN)前体。这种信号肽切割后产生成熟的颗粒蛋白,可以进一步裂解成6kDa的各种活性肽。这些肽和完整的颗粒蛋白调节细胞生长。然而,颗粒蛋白家族的不同成员可以作为抑制剂、激动剂或对细胞生长具有双向调节作用。近年来,颗粒蛋白被认为与许多自身免疫性疾病有关。有研究提示颗粒蛋白前体是炎症的关键调节因子,其抗炎作用可能是通过阻断TNF与其受体的结合来实现。还有研究发现PGRN抗体阳性的银屑病关节炎(PsA)患者,发生肌腱附着点炎和指(趾)炎的几率较高。AS和PsA均属于血清阴性脊柱炎(SpA),因此同时研究TNF和GRN基因多态性是否与AS相关具有重要意义。基于以上观点,为探讨TNF和GRN基因在AS发病机制中的潜在作用,我们选择了 TNF和GRN基因的多个SNP位点,为AS的易感基因评估提供依据。研究目的探讨TNF、GRN基因单核苷酸多态性与我国山东地区汉族人群强直性脊柱炎(AS)的关联性。研究方法1.研究对象病例组选取861例AS患者,均属于中国山东地区汉族人群,为2014年1月至2015年12月在山东大学附属山东省立医院风湿免疫科门诊或病房的符合1984年修订的纽约AS分类标准的患者。记录患者的症状、体征、受累关节、家族史;采用流式细胞术测定HLA-B27;所有患者均完成骶髂关节X线检查,由影像科专业医师按骶髂关节的国际统一分级标准进行结果判定。所有患者均需排除其他自身免疫性疾病。正常对照组864例均来自于本研究中心体检中心健康中国山东汉族人群,已排除肿瘤、其他结缔组织病、传染病等疾病,年龄、性别均与AS组匹配。所有入选者均在知情同意后入组。2.实验方法2.1 标本收集用EDTA抗凝管采集AS患者和对照组人群空腹外周静脉血2ml,放置冰箱中在-80℃条件下保存,备检。2.2 基因组DNA提取使用基因组DNA提取试剂盒,按照说明书操作步骤提取病例组和对照组DNA。2.3 DNA浓度和纯度测定向DNA样本2ul中加入三蒸水48ul,将浓度稀释至1/25,用紫外分光光度仪测量OD260/OD280比值以及DNA浓度,并分析DNA纯度。2.4 多态性位点的选择根据dbSNP数据库获取TNF、GRN基因的SNPs资料,各个SNP位点的分布频率由HaploView软件来确定,同时应用Tagger功能筛选TagSNP。初步筛选需满足次要等位基因频率>5%及连锁不平衡系数r2>0.8。根据筛选结果,最终确定 TNF 基因的 rs361525、rs1799964、rs1800629、rs1800630、rs769178和GRN基因的 rs850713、rs3785817、rs3760365、rs4792939、rs25646、rs5848作为研究位点。2.5 基因分型使用Taqman探针Real-time PCR方法按照步骤进行基因分型。2.6 检测结果分析应用SDS软件(Applied Biosystem,2.0 version)进行数据收集和处理TaqMan-PCR扩增后的FAM和VIC荧光信号。3.统计学分析3.1 Hardy-Weinberg 平衡检验使用 SHEsis 软件进行 Hardy-Weinberg 平衡检验。3.2病例组与对照组基因型和等位基因频率的统计分析 用SPSS24.0软件通过卡方检验对各个等位基因、基因型和单倍型进行分析。使用SHEsis程序计算单倍型频率、优势比及95%可信区间。3.3患者临床表现/实验室结果与基因多态性关联分析将收集的相关数据应用SPSS24.0软件完成统计学分析。3.4连锁不平衡及单倍体型分析各个多态性位点之间的连锁不平衡及单倍体型的统计学分析分别由HaploView2.0及SHEsis软件来完成。4.SNP位点的生物信息学功能分析使用GTEx,Haploreg和Regulome DB数据库对 TNF 基因的 rs1799964,rs1800629,rs1800630,rs769178 功能进行注释。研究结果1.基本信息共对861例AS病人及864例正常健康对照进行了基因分型。AS病人中,男性患者634例,女性患者227例,年龄15-71岁,平均年龄30.56±10.98岁。正常对照组,男性619例,女性245例,年龄14-73岁,平均年龄31.97±11.23岁。所有研究对象均属山东汉族人群。病例组与对照组在年龄、性别上无显着性差异(p>0.05)。2.Hardy-We i nberg 平衡检验本实验所有SNPs的p值>0.05,均符合Hardy-Weinberg平衡定律,提示所有研究的SNP位点基因型和吻合基因的观察值和期望值吻合良好。3.TNF基因型频率和等位基因频率在AS及正常人的分布3.1有统计学差异的位点对于rs1799964位点,AS组与对照组基因型分布的差异具有统计学意义(p<0.0001);两组等位基因分布的差异也具有统计学意义(p<0.0001;OR=0.60,95%CI=0.50-0.71),提示 C 等位基因是 AS 的保护性基因。对于rs1800629位点,AS组与对照组基因型分布的差异具有统计学意义(p=0.0004);两组等位基因分布的差异也具有统计学意义(p=0.0001;OR=0.60,95%CI=0.39-0.74),提示A等位基因是AS的保护性基因。对于rs1800630位点,AS组与对照组基因型分布的差异具有统计学意义(p<0.0001);两组等位基因分布的差异也具有统计学意义(p<0.0001,95%CI=0.48-0.72),提示A等位基因是AS的保护性基因。对于rs769178位点,AS组与对照组基因型分布的差异具有统计学意义(p<0.0001);两组等位基因分布的差异也具有统计学意义(p<0.0001,95%CI=2.18-3.09),提示T等位基因是AS的危险性基因。3.2无统计学差异的位点对于rs361525位点,AS组与对照组基因型和等位基因频率无显着性差异。4.GRN基因型频率和等位基因频率在AS及正常人的分布对于 rs850713、rs3785817、rs3760365、rs4792939、rs25646、rs5848 位点,AS组与对照组基因型和等位基因频率均无显着性差异。提示GRN基因多态性与AS易感性无关。5.对TNF等位基因频率分布具有显着性差异位点的基因型遗传模式分析对于rs1799964位点,在显性遗传模式下,CC基因型和CT基因型可降低AS的风险;在隐性遗传模式下,CC基因型可降低AS的风险。对于rs1800629位点,在显性遗传模式,AA基因型和AG基因型可降低AS的风险;在隐性遗传模式下,AA基因型可降低AS的风险。对于rs1800630位点,在显性遗传模式下,AA基因型和AC基因型可降低AS的风险;在隐性遗传模式下,AA基因型可降低AS的风险。对于rs769178位点,在显性遗传模式下,TT基因型和GT基因型可增加AS的风险;在隐性遗传模式下,TT基因型可增加AS的风险。6.TNF基因多态性与AS患者临床/实验室指标关联分析rs1799964、rs1800629、rs1800630、rs769178 在显性和隐性遗传模式下的基因型与AS患者的性别、年龄、病程、家族史、HLA-B27阳性、外周关节受累、葡萄膜炎均无明显关联性。7.连锁不平衡及单倍型分析统计学结果显示,TNF及GRN基因的各研究位点之间存在弱的连锁不平衡。TNF基因5个研究位点的CGAGG、CGCAG、TACGG、TGCGG、TGCGT单倍型以及GRN基因6个研究位点的CTGACA单倍型在AS组与正常对照组之间比较,具有统计学差异。8.TNF基因生物信息学分析在 GTEx 数据库中对 TNF 基因的 rs1800629、rs1800630、rs769178 和rs1799964位点进行eQTL分析,结果发现上述SNPs可影响多个基因的表达量,且在GSE25101数据集中显示,上述部分基因在AS患者中亦具有差异表达,提示rs1800629、rs1800630、rs769178 和 rs1799964 的 SNPs 可能通过调控其他基因的表达量从而在强直性脊柱炎发生和发展中发挥生物学功能。结论1.我们在国内外首次确认了 TNF基因位点rs769178多态性与AS易感性相关;验证了 rs1800629、rs1800630、rs769178 和 rs1799964 在 AS 组与对照组等位基因频率及基因型差异显着,差异具有统计学意义。TNF基因多态性与山东地区汉族人群AS易感性相关,eQTL分析显示其可能通过影响某些基因的表达量影响AS的易感性。目前未发现其与AS的临床表现具有显着相关性。2.GRN基因多态性与山东地区汉族人群的AS易感性无关,但是SNP基因型频率在不同种族、不同地区的分布存在明显差异,故需要更收集不同地区、不同人群的更多资料,来进一步研究GRN基因与AS是否存在关联性。第二部分ERAP1基因多态性与强直性脊柱炎易感性关系的Meta分析研究背景强直性脊柱炎(ankylosing spondylitis,AS)是一种以累及中轴和外周关节、韧带和肌腱附着点为主要特征的慢性、全身性、炎症性疾病。AS具有高度遗传性,人类白细胞抗原(human leukocyte antigen,HLA)-B27基因是迄今为止发现的和AS关联性最强的基因。但近年来的研究发现,非HLA-B27基因在AS发病中也具有重要作用,研究其在AS发病中所起作用对进一步明晰AS的病因及发病机制具有重要意义。近年来的研究发现,非HLA-B27基因中的内质网氨基肽酶(endoplasmic reticulum aminopeptidase,ERAP)1基因在AS风险中也起重要作用。许多病例对照研究发现ERAP1的基因多态性与AS相关,但研究结果不尽一致。结果不一致的原因之一可能与人群差异有关。Meta分析是一种总结许多研究结果的有效的标准分析方法。既往已有多篇相关的Meta分析,但是既往研究所选择的数据库、研究人群不尽一致,且近2年多来又有多篇新的关于ERAP1基因多态性与AS关系的文章数据。故在本研究中,我们结合全基因组关联研究(genomewide association studies,GWAS)和病例对照研究进行 Meta 分析,以探讨ERAP1是否与总体人群和不同种族亚群的AS易感性相关。研究目的通过Meta分析,确定ERAP1基因单核苷酸多态性是否与总体人群和不同种族亚群AS易感性之间的关系。研究方法1.一般资料主题词采用“ankylosing spondylitis”、“ERAP1”和“polymorphism”,检索Pubmed、Embase和Cochrane数据库,同时检索相关自由词。语种设置为英语。2.筛选方法按照提前制定好的文献纳入标准与剔除标准筛选文献。每项研究均摘录以下信息:第一作者,发表年份,研究人群的国家和种族,病例组和对照组的数量,ERAP1多态性的等位基因数量。采用Newcastle-Ottawascale(NOS)文献质量评价量表评价纳入的研究的质量。3.统计学分析应用Review Manager 5.3进行统计学分析。使用OR值及其95%可信区间来作为效应指标,进行总体人群和按照种族划分的人群亚组分析。使用I2来对异质性进行定量分析。对于存在明显异质性的数据,再进行敏感性分析。采用漏斗图来分析发表偏倚。研究结果1.文献检索结果初步文献检索Pubmed数据库92篇,Embase数据库21篇,Cochrane数据库2篇,总计105篇。根据纳入标准和剔除标准,经过仔细阅读文献题目、摘要和全文,最终纳入文献31篇。总共包括26291名AS患者和45779名健康人对照。2.Meta分析结果对 rs27044,rs17482078,rs10050860,rs30187,rs2287987,rs27980,rs27037,rs27434,rs26653,rs1065407,rs27529,rs27582,rs469876,rs7711564,rs27038,rs3734016,rs11209032,rs26618,rs27895,rs17481856,rs13167972等共21个位点进行Meta分析,并按照地域和人种进行亚组分析。结果显示,rs27434的A等位基因在总体人群和高加索人群、中东人群、东亚人群中均为AS的危险因素;rs27980、rs27582、rs469876、rs27038、rs11209032、rs26618、rs27895、rs17481856 SNP在总体人群中和各亚组人群中均与AS无明显相关性;其余12个位点在总体人群和各亚组人群中与AS的相关性各有不同。在总体人群中,rs27434,rs17482078,rs10050860,rs30187,rs2287987,rs27037,rs26653,rs7711564和rs13167972 SNP与AS的易感性相关。在高加索人群中,rs27044,rs17482078,rs10050860,rs30187,rs2287987,rs27037,rs27434,rs26653,rs1065407,rs13167972 SNP与AS的易感性相关。在中东人群中,rs27044,rs27434,rs26653 SNP 与 AS 相关。在东亚人群中,rs30187,rs27037,rs27434,rs27529,rs7711564 SNP 与 AS 易感性相关。结论对目前已发表的有关ERAP1基因SNP与AS易感性关系的研究进行Meta分析表明,ERAP1基因的单核苷酸多态性与总体人群、高加索人群、中东人群和东亚人群的AS易感性有关,具体每个位点对AS易感性的影响大小在不同种族之间存在差异。对rs27434的功能注释提示,其可能通过影响ERAP1的表达以及间接影响TNF的作用从而对AS易感性产生影响,但尚需进一步研究以明确。下一步还需进一步的种族特异性关联研究来确定不同人群ERAP1的SNP与AS易感性的遗传关系。

王燕[2](2020)在《新疆地区变应性鼻炎吸入变应原谱及相关拷贝数变异分析》文中认为目的:通过对新疆地区近13年变应原皮肤点刺试验结果回顾性分析及对变应性鼻炎家系的全基因组测序和变应性鼻炎病例对照组拷贝数变异分析,了解了本区变应性鼻炎患者变应原谱的分布及变化情况,探讨了基因拷贝数变异与变应性鼻炎的相关性。方法:第一部分:回顾性分析了2007年1月-2019年12月间5019例患者的皮肤点刺试验结果,研究分析了不同变应原在13年间的分布情况及变化规律以及在不同性别、年龄、族别患者中的分布情况。第二部分:对1个新疆地区汉族家系(3个变应性鼻炎样本,2个正常样本)进行了低深度全基因组测序,并采用了生物信息学的方法及拷贝数变异片段区域的基因功能寻找筛选候选拷贝数变异;第三部分:收集汉族变应性鼻炎患者696例,汉族对照528例,对其外周血提取DNA后,采用AccucopyTM拷贝数检测技术对13个候选基因拷贝数变异进行检测:8_1、8_2、9_1、9_2、ADAM8、CCL3L1、IL1RL1、MUC5B、MUC5AC、NME7、ORMDL3、SERPINA1_1、SERPINA1_2。分析13个候选基因拷贝数变异在病例对照组中的分布情况及其与变应性鼻炎的相关性。结果:第一部分:1)14种变应原在不同时间的分布明显不同,差异有统计学意义(P<0.05),变应原阳性率随年份不同而变化,但藜属在13年间基本处于本区变应原的首位。14种变应原总体阳性率分别是藜属48.2%、车前草33.2%、艾蒿33.1%、豚草32.7%、刺槐32.1%、梯牧草32%、粉螨31.5%、杨树30.3%、尘螨29.6%、蟑螂26.9%、猫上皮11.6%、特异青霉菌9.4%、狗上皮8.5%、交链孢霉7.7%;2)不同性别间的比较,男性2140例(42.6%),女性2879例(57.4%)。艾蒿、藜属、豚草、车前草、梯牧草、刺槐、交链孢霉、特异青霉、尘螨、粉螨、蟑螂、杨树、猫上皮的男性阳性率明显高于女性,差异有统计学意义(P<0.05)。狗上皮的阳性率在男性女性之间分布均无统计学差异(P>0.05);3)不同年龄之间的比较,除狗上皮阳性率在不同年龄间差异无统计学意义(P=0.288)外,其余13种:艾蒿、藜属、豚草、车前草、梯牧草、刺槐、杨树、交链孢霉、特异青霉、猫上皮、尘螨、粉螨、蟑螂在不同年龄间变应原阳性率差异均具有统计学意义(P<0.05);4)不同民族间的比较,汉族3850例、维吾尔族694例、哈萨克族270例、回族113例、其他民族92例,交链孢霉、特异青霉、猫上皮、尘螨、粉螨、蟑螂阳性率在不同民族间分布,差异无统计学意义(P>0.05)。艾蒿、藜属、豚草、车前草、梯牧草、刺槐、杨树、狗上皮在不同民族间变应原阳性率差异具有统计学意义(P<0.05)。第二部分:通过对家系全基因组测序后,总共发现了1360个拷贝数变异,其中3个变应性鼻炎样本携带而2正常个体未携带,筛选出62个拷贝数变异,将测序质量低、结果不可靠;拷贝数变异片段范围内没有功能基因的以及拷贝数变异内基因与变应性鼻炎没有明确关系的剔除,最终得到与变应性鼻炎相关的候选拷贝数变异;第三部分:8_1、8_2、9_1、9_2、ADAM8、CCL3L1、IL1RL1、MUC5B、NME7、ORMDL3、SERPINA1_1、SERPINA1_2的拷贝数在病例对照组的分布无明显差异(P>0.05).MUC5AC在病例对照组中差异分布具有统计学意义(P=0.002)。结论:第一部分:新疆地区变应原分布随时间不同在不断变化,主要变应原以草本类为主,变应原在不同性别、年龄、族别变应性鼻炎患者中的分布不同。第二部分:经过测序筛选共得到13个候选拷贝数变异,分别是8_1、8_2、9_1、9_2、ADAM8、CCL3L1、IL1RL1、MUC5B、MUC5AC、NME7、ORMDL3、SERPINA1_1、SERPINA1_2;第三部分:MUC5AC基因拷贝数变异与变应性鼻炎存在相关性。同时CCL3L1在新疆汉族人群中的拷贝数范围是1-10。

段富交[3](2020)在《胃癌危险因素的定量评估及发病风险预测模型构建》文中认为胃癌(Gastric Cancer,GC)是消化系统最常见的恶性肿瘤,死亡率位居中国恶性肿瘤第二位。研究表明早期胃癌可获得根治性切除,预后较好,五年生存率可达90%,但胃癌的早期检出率不足10%,处于胃癌进展期患者,其五年生存率不足30%,目前仍缺乏有效的非侵入性的早期胃癌筛查的诊断方法。胃癌的发生发展是幽门螺杆菌(Helicobacterpylori,Hpylori)感染、环境和遗传等多因素参与的过程,除Hpylori感染、吸烟、饮酒及高盐饮食等目前已确认的危险因素外,单核苷酸多态性(Single nucleotide polymorphism,SNP)和长链非编码RNAs(Long non-coding RNA,lncRNAs)在胃癌中的广泛作用正逐步被披露。由于胃癌的复杂性与异质性,确定其潜在危险因素并通过模型进行风险预测已在高危人群的早期识别、精准预防以及个体化干预中广泛应用。然而,目前现有的风险预测模型中,未见将lncRNAs作为风险因子纳入评估,且在胃癌领域未见基于多基因风险评分(Polygenic risk scores,PRS)构建的风险预测模型。目的通过定量系统评价和Meta分析明确Hpylori感染、环境等非遗传因素和遗传因素对中国人群胃癌发生的影响及其流行病学意义:基于人群验证关联结果,构建胃癌风险预测模型,通过评价各模型间的预测能力,筛选出最优模型,为中国人群胃癌的早期诊断和精准预防提供可能的依据。方法1.遗传和非遗传因素与胃癌发病风险的流行病学评价(1)利用 PubMed、EMBASE、Cochrane Library、Web of Science、CNKI、Wanfang、VIP和CBM数据库进行系统文献检索,对在中国人群中实施并探讨生物、行为、环境和遗传因素与胃癌发病相关的研究进行定量合并分析,并采用Venice标准对积累证据进行质量评价。(2)利用比值比(Odds ratio,OR)及 95%置信区间(95%Confidence Interval,95%CI)分析非遗传和遗传因素与胃癌发病关联强度,假阳性报告概率(False positive reporting probability,FPRP)评估显着性关联结果,并对关联显着的非遗传和遗传因素组合对胃癌发病风险贡献分别进行评价。(3)采用遗传分数(Genetic score)、归因危险度(Attributable risk percentage,ARP)、人群归因危险度(Population attributable risk percentage,PARP)进行流行病学效应评价。2.基于多基因风险评分的胃癌风险预测模型构建(1)利用生物信息学方法筛选出胃癌中存在差异表达并与microRNAs(miRNAs)具有潜在结合位点的lncRNAs及其对应功能性SNPs;根据循证医学(Evidence based medicine,EBM)策略筛选出具有遗传关联的SNPs,并结合已发表的相关领域性系统综述中中国人群相关联位点,对数据进行质控后纳入人群验证。(2)采用1:1频数匹配的病例-对照研究设计,按性别和年龄(±2岁)进行个体匹配,收集660例经病理学确诊的胃癌患者和660例社区正常对照人群血液样本。分别采用聚合酶链式反应-限制性片段长度多态性(Polymerase chain reaction-restriction fragment length polymorphism,PCR-RFLP)、创造性酶切位点原理结合 PCR-RFLP 方法(Created restriction site-PCR-RFLP,CRS-PCR-RFLP)和荧光多重酶连接反应(Improved multiplex ligation detection reaction,iMLDRTM)对lncRNA SNPs和EBM筛选SNPs进行基因分型。(3)采用拟合优度卡方检验(Chi square test of goodness of fit)评估对照人群的基因型分布是否符合哈迪-温伯格平衡(Hardy-Weinberg equilibrium,HWE),使用非条件Logistic回归完成两部分SNPs与胃癌发病风险的关联性分析。(4)利用Plink进行关联性SNPs的数据质控、等位基因的关联分析及PRSice-2(Polygenic risk score software)基础数据集(Base dataset)和目标数据集(Target dataset)的生成;基于加权遗传风险评分(Weighted genetic risk scores,wGRS)和PRS,利用经EBM筛选关联验证后SNPs分别构建风险预测模型,将lncRNA SNPs作为危险因素的独立数据集纳入风险预测模型,并使用Empirical P-value进行模型内10,000次拟合以优化参数,构建最优模型。(5)利用受试者工作曲线(Receiver operating characteristic,ROC)及曲线下面积(Areaunder curve,AUC)评价不同模型对胃癌的识别度;采用净重新分类指数(Net reclassification improvament,NRI)和整体鉴别指数(Integrated discrimination improvement,IDI)评估wGRS和PRS模型的预测能力;利用赤池信息准则(Akaike information criterion,AIC)和贝叶斯信息准则(Bayesian information criterion,BIC)评价模型的拟合程度。结果1.H.pylori感染、吸烟、饮酒、家族史、胃部疾病、高盐饮食、腌制食品、快速进食、不规律饮食、食用烫食、烟熏煎炸、辛辣饮食、精神抑郁和糖尿病与胃癌发病相关性分析结果具有统计学意义(P<0.01),Hpylori感染率与胃癌发病率趋势基本一致。2.PSCA rs2976392、rs2294008,MUC1 rs4072037,MTHFR rs1801133,COX-2 rs20417,XRCC1 rs 1799782,rs25487,XRCC3 rs861539,NAT2 rs1799930、rs1799929,NAT2 Phenotype(Slow/Fast)、PLCE1 rs2274223、rs3765524,GSTM1,GSTT1,IL-17A rs2275913、rs8193036,PRKAA1 rs13361707,ERCC5 rs751402,TGFBR rs3773651,IL-10rs1800896 和VDR rs731236 与胃癌发生相关性分析结果具有统计学意义(P<0.05)。3.胃癌非遗传因素与遗传因素组合分布风险的累积频率分别与合并OR值及遗传分数高度相关,经对数变换后,累积频率对应的OR值和遗传分数均符合正态分布;对于非遗传因素,ARP的前三位分别为胃部疾病(66.33%)、腌制食品(54.34%)和烟熏煎炸(49.75%);PARP前三位分别为腌制食品(33.85%)、食用烫食(24.73%)和H.pylori感染(23.30%)。对于胃癌相关联的SNPs,ARP前三位的分别为NAT2,rs1799929(53.91%)、NAT2表型(53.05%)和1L-10 rs1800896(42.85%);对于PARP前三位的分别为 VDR rs731236(36.96%)、TGFBR2 rs3773651(25.58%)和 MUC1 rs4072037(20.56%)。4.基于等位基因、突变杂合、突变纯合、显性和隐性五种遗传模型,根据性别、年龄、吸烟、饮酒和胃癌家族史调整进行多因素logistic回归分析,结果显示,在 21 个胃癌相关 lncRNA SNPs 中,14 个 SNPs(rs1859168、rs4784659、rs579501、rs77628730、rs7816475、rs6470502、rs1518338、rs2867837、rs12494960、rs7818137、rs3825071、rs7943779、rs911157 和 rs16981280)与胃癌发病风险关联具有统计学意义(P<0.05);EBM筛选并验证后的20个SNPs与胃癌发病风险相关性分析表明,15 个 SNPs(rs2294008、rs25487、rs751402、rs1801133、rs1799782、rs763780、rs8193036、rs4072037、rs2274223、rs2275913、rs20417、rs13361707、rs3773651、rs1799930和GSTM1)与胃癌发病风险具有统计学关联(P<0.05)。5.对lncRNA SNPs和EBM筛选SNPs在病例组与对照组中的分布分别进行wGRS,其病例组的wGRS均值均高于对照组。对两种来源的SNPs,根据wGRS评分分布进行分组,以0-1分组人群为参照,随着分数组的增加,胃癌发病风险显着增加,PRS与wGRS分布及分组比较结果趋势一致。6.将EBM筛选并经关联验证SNPs的PRS分为十分位,以40-60%分位为参照,结果表明,随着分位的降低,个体发病风险总体呈下降趋势;随着分位增高,胃癌发病风险呈显着的增加趋势;其中,处于最低10%的十分位风险评分的个体发病风险比一般人群低47%(OR=0.53,95%CI:0.34,0.83);PRS处于最高10%的十分位个体胃癌发生风险是一般人群的3.24倍(OR=3.24,95%CI:2.07,5.06)。7.利用NRI和IDI,对增加一种或多种新的危险因素后模型的预测效果改善情况进行评估,结果显示,在同种因素或条件下,PRS模型均优于wGRS模型且胃癌相关lncRNA SNPs作为独立数据集可有效提高模型的识别度。根据纳入不同危险因素构建模型的ROC曲线,结合不同因素对wGRS和PRS模型的AIC和BIC影响的比较,筛选出拟合优度最佳者。结果显示,在PRS基础上引入lncRNA SNPs、吸烟、饮酒及H.pylori感染具有最佳的拟合优度和预测能力(AUC:0.78(0.68,0.88),AIC=117.23,BIC=122.31)。结论1.胃癌非遗传因素与遗传因素组合分布的累积频率和其发病风险均具有明显的线性关系,随人群累积频率的减小,胃癌发病风险显着增加。2.H.pylori感染、腌制食品和食用烫食,VDR rs731236、TGFBR2 rs3773651和MUC1 rs4072037在人群中的暴露对胃癌的发生贡献较大。3.胃癌关联性SNPs与其lncRNA SNPs存在显着的联合作用,在同种因素或条件下,PRS模型优于wGRS模型且引入胃癌相关lncRNA SNPs可显着提高模型的识别度。4.PRS联合lncRNA SNPs、吸烟、饮酒及H.pylori感染的模型对胃癌发病风险具有最优预测能力,有助于区分胃癌高风险和低风险人群。

阿丽耶·库热什[4](2020)在《20个微单倍型遗传标记的法医学应用研究》文中研究说明目的:本研究拟筛选高多态性的包含三等位SNP的微单倍型标记,并评估这些位点在个人识别,亲子鉴定,祖先推断等中的法医学应用价值。方法:基于前期高通量测序结果和千人基因组计划数据库,筛选出包含三等位基因SNP的微单倍型和其他高多态性的微单倍型。计算微单倍型标记的各项法医学参数并根据不同的法医学目的探索其应用价值。依据每个基因座序列信息设计特异性引物并在Miseq PE300平台上进行测序,根据测序结果进行遗传多态性研究。Modified-powerstates进行法医遗传学参数计算,Familias 3软件用于模拟亲子对检测,STRUCTURE分析和系统发育树构建用以评估微单倍型基因座在祖先推断上的应用。结果:最终共获得69个样本20个微单倍型基因座的测序结果,根据筛选标准,其中用于个人识别的14个基因座的累积个人识别概率CPD为0.999999999999748,理论上检测到DNA混合斑的概率为0.999878。平均Ae值为3.75。13个应用于亲缘鉴定的微单倍型基因座累积的累积排除概率CPEduo和CPEtrio分别为0.9931和0.9999。微单基因座体系在不同地区群体人群中表现出较大的遗传分化。经STRUCTURE分析,在K=4时能区分东亚,南亚,非洲和欧洲的地区的群体。结论:本研究中构建的微单倍型遗传标记,在个人识别,祖先推断和亲子鉴定中都表现出较好的应用价值,并且这些标记能扩充现有的微单倍型遗传标记数据库。

张春红[5](2019)在《人体微量营养素缺乏风险关联SNP高通量微流体芯片方法研究与初步应用》文中研究说明背景:继限制性酶切片断长度多态性和短串联重复序列之后,单核苷酸多态性位点(single-nucleotide polymorphism,SNP)以遗传标记密度高、稳定性高、分型检测易于实现自动化的特点成为第3代多态性标记,在遗传诊断,遗传风险评估、连锁不平衡图谱和遗传关联分析等人类基因组学研究领域显示了强大的应用前景。人体存在营养素需要量个体化遗传特征,通过研究导致功能和表型改变的编码区和调控区的个体化SNP信息,可以基于SNP分析对个体化营养素缺乏风险进行评估和干预,通过基于正常人群和缺乏人群的流行病学观察及人群SNP基因分型检测,可以建立人群SNP基因型频率分布特征,获得与营养素缺乏风险高度关联的SNP位点公共数据库,从而实现基于个体差异或人群差异特征的精准营养干预。为此,探索快速、准确、高通量的SNP基因分型技术以及基于SNP检测对人体营养缺乏风险进行评估的研究必要而迫切。目的:一、研究建立人体微量营养素缺乏风险关联SNP高通量微流体芯片方法通过文献荟萃分析筛选提取营养相关联的SNPs,优化血液和唾液样本DNA自动化提取程序,建立适宜的引物设计方法,采用微流体芯片技术,建立微流体芯片营养SNP的检验方法,实现对营养不良风险的评估。二、微流体芯片方法的初步应用采用人群对微流体芯片方法进行测试,初步分析基因型数据的地域分布特征,并与生化数据进行关联分析,研究营养SNPs的检验方法在微量营养素缺乏风险评估中应用的可行性。方法:采用自动化提取工作站建立血液和唾液样本的DNA提取流程,采用竞争性等位基因PCR原理设计引物,纳入了 52个与维生素A,D,E,B6,B2,叶酸,钙,铁,锌和硒微量营养素缺乏易感性关联较大的SNP位点,SNP检索和纳入原则是在中国生物医学文献数据库、中国期刊全文数据库、万方数据库、重庆维普中文科技期刊全文数据库,PubMed数据库和Web of Science中检索从建库至2017年6月25日发表的相关文献,检索主题词分别为“single nucleotide polymorphism or SNP”and“vitamin A,D,E,B6,B12,FA,Ca,Iron,Zn,Se”和“单核苷酸多态性”和“维生素A,D,E,B6,B12,叶酸,钙,铁,锌和硒”。同时手工检索文献,并辅以文献追踪法收集更多相关文献。建立创新性SNP微流体芯片检测方法,并对如下指标进行评估:(1)防交叉污染能力的测试:奇数反应孔中预点引物混合液,偶数反应孔中不点制无引物混合液。另外,采用凝胶电泳试验对芯片对应反应孔中的溶液进行检测。试验重复操作六次。(2)引物特异性分型能力和准确性评估:先将52个SNP位点对应的引物混合液分别预点于不同的反应孔中,待引物混合液干燥后再将156个不同的DNA样本预点于不同的反应孔中,室温静止30 min使得芯片干燥,DNA样本的浓度为10 ng/μl,随后将PCR预混液注入到进样通道中。所有的芯片分型检测结果均与对应的二代测序(NGS)分型结果进行比较。试验重复操作六次。(3)适宜DNA反应浓度检测:先将52个SNP位点对应的引物混合液分别预点于不同的反应孔中,再将52个不同的DNA样本中每个样本都按照1 ng/pl,5ng/μl,10ng/μl和15ng/μl进行四个浓度梯度稀释。试验重复操作六次。(4)重现性检测:先将52个SNP位点对应的引物混合液分别预点于不同的反应孔中,重现性试验采用一个DNA样本进行检测。试验重复操作六次。(5)临床血液样本多种营养素缺乏风险筛查评估应用:采用所建立的成熟的芯片分型检测方法,随机选取六个临床样本进行评估应用。先将52个SNP位点对应的引物混合液分别预点于不同的反应孔中,随后按照芯片检测流程进行检测,并对检测结果进行分析。(6)血液中提取的DNA与唾液中提取的DNA在芯片上分型结果的比较:分别获得三个人的血液DNA样本,来自于同样的三个人的唾液DNA样本。先将52个SNP位点对应的引物混合液分别预点于不同的反应孔中,随后按照芯片检测流程进行检测,并对检测结果进行分析。(7)运用二代测序方法对芯片分型结果进行验证,设计二代测序所需引物序列,目的扩增片段长度约300~450 bp,包含该SNP位点。目的片段的扩增,序列测定工作均由生工生物工程(上海)股份有限公司完成。运用建立的高通量微流体芯片基因分型检测方法,对1130份血细胞样本进行了基因分型检测,对每份样本检测与人体微量营养素维生素A,D,E,B6,B12,叶酸,钙,铁,锌和硒等微量营养素缺乏风险高度关联的143个SNP遗传标记物。该143个SNP位点的纳入原则同上所述。铁营养素相关生化指标与SNP位点易感性分析中,CRP>10 mg/l的人被排除在这项研究之外。体内铁储量采用如下公式进行计算:体内铁储量(Body iron,BI,mg/kg)=-[log(sTfR*1000/SF)-2.8229]/0.1207。由于数据缺失量小于5%,对连续变量中的缺失数据采用现有数据把原始数据中的缺失数值模拟出来。采用Q-Q图和Shapiro检验数据是否符合正态分布,若不符合正态分布,则采用扭曲线性混合模型(Warped linear mixed model,Warped-LMM)对生化指标数据进行变换。扭曲线性混合模型是在标准混合线性模型的基础上建立起来的一种分析方法,允许在进行遗传分析的同时适应表型变换,应用在生化指标变量中,以改善其与正态分布的配合度,因为SF和sTfR浓度呈正偏态分布。采用R软件包进行PCA、Kinship和SNP位点之间连锁不平衡分析,分析候选SNP位点的特征。如有种群结构的存在,采用FaST-LMM模型(Factored spectrally transformed linear mixed models)进行关联分析,首先采用连续变量探索基因多态性位点与各种营养素之间的关联性,随后再采用分类变量对所有的表型数据和基因型数据进行关联分析。SF的分组标准:参照《WST 465-2015人群铁缺乏筛查办法》将铁缺乏的标准设定为SF<25 ng/ml,当CRP≤5 mg/1时,当SF<25 μg/1时判定为铁缺乏组,当SF≥25 μg/1时判定为正常人群;当CRP>5 mg/1时,当SF<32μg/1时判定为铁缺乏组;当SF≥25μg/1时判定为正常人群。sTfR的分组标准:sTfR<4.4 mg/1时为铁缺乏组,sTfR≥4.4mg/1时判定为正常人群。参照《WS/T600—2018人群叶酸缺乏筛查方法》将叶酸(FA)的缺乏标准设定为FA<4 ng/ml时为叶酸缺乏组,FA≥4 ng/ml时判定为正常人群。同型半胱氨酸(HCY)和维生素B12的缺乏标准参照检测试剂盒上提供的数据:HCY≥10μM时为病例组,HCY<10μM时判定为正常人群。B12的分组标准:B12<425 pg/ml时为B12缺乏组,B12>425 pg/ml时判定为正常人群。采用卡方检验分析不同基因型以及等位基因在民族之间的分布差异,采用方差分析分析不同基因以及等位基因携带人群的各种生化指标的分布情况。根据P值0.05的阈值确定是否有统计学意义。结果:一、建立了 SNP高通量微流体芯片方法和人体微量营养素缺乏风险检测方法,包括3个主要流程:建立了自动化DNA提取流程,通过对带有凝胶的血细胞、EDTA抗凝全血、离心去血清后的血细胞、新鲜唾液、唾液保存液保存的唾液样本和口腔拭子采集的口腔黏膜细胞等各种样本的提取效果比较,结果显示96份新鲜唾液获取的DNA浓度为150.02±50.97 ng/μl,OD260/280为1.80±0.15,OD260/280为1.50±0.21。从新鲜唾液中获取DNA含量理想,DNA降解程度低,提取方法简单,应作为唾液标本采集的首选,是开展营养基因组学人群研究的有效方法。分析并应用了竞争性等位基因特异PCR扩增设计方法。建立了人体微量营养素缺乏风险关联SNP微流体芯片检测标准化流程,对方法的评估结果显示应用物理性阻断技术实现了相邻反应孔间的零交叉污染。本研究将5 ng/μl和15 ng/μl分别作为血液和唾液来源的样本的适宜DNA反应浓度检测下限值。芯片平台上相同样本精密度为0.67%~26.06%,相同位点的重复结果上没有太大的差异。该研究在重现性方面显现出良好的实验结果,无论在芯片内还是在芯片间,重现性均良好。六个临床样本多种营养素缺乏风险筛查彩色图谱直观显示出多种营养素缺乏风险,以及单一营养素缺乏风险程度,同时也表明个体在营养素缺乏风险程度上各有其独特性。通过分析三个个体血液和唾液两种来源的DNA样本在微流体芯片上的52个SNP位点分型结果,并且与二代测序结果进行比较,结果显示三个个体血液和唾液两种来源的DNA样本在芯片上的52个位点分型结果完全一致,与二代测序的结果也完全一致。二、对143个MDR-SNPs位点地域分布特征及关联分析进行了初步探索主成分分析(PCA分析)结果显示了存在群体遗传结构。对主成分1和主成分2与种群间关系的方差分析结果为P<1.36e-14,表明143个SNP位点存在显着的民族差异。这与样本的最初个体信息吻合,也进一步印证了本研究中采用的基因分型技术的准确性良好。采用函数snpgdsPCACorr分析了主成分中前三个成分与SNP位点之间的关系,结果表明:3号染色体上的基因多态性位点与其他染色体上的多态性位点均呈现显着的差异,主成分分析PC1中显示位于RAB6B基因上的rs2280673解释效度在25%以下,位于TF基因上的rs1799852解释效度为25-500%,位于RBP2基因上的rs2118981位点和SRPRB基因上的rs1830084位点解释效度在50-75%之间,位于TF基因上的rs1358024,rs1525892,rs 1880669,rs381]647,rs3811658,rs6794945,rs7638018,rs8177248八个多态性位点的解释效度为75%以上。采用卡方检验分析不同基因型以及等位基因在民族之间的分布差异,采用方差分析分析不同基因以及等位基因携带人群的各种生化指标的分布情况,获得了大量具有统计学意义的位点。结论:本研究建立了人体微量营养素缺乏风险关联SNP微流体芯片检测方法,主要包括构建了适合于大规模流行病学研究的唾液基因组自动化DNA提取方法,建立了竞争性等位基因特异PCR扩增引物设计方法,建立了一种高通量微流体芯片基因分型检测方法,并采用1130人的小样本对方法进行了初步测试应用。

席锟[6](2019)在《非洲栽培稻与亚洲栽培稻中非生物胁迫抗性基因的功能性核苷酸多态性》文中研究说明水稻是全世界一半以上人类的主食。但是水稻是在相对良好的环境条件下驯化的,对大部分非生物逆境较敏感,所以复杂多变的非生物逆境是限制水稻生长发育、生物产量及品质的主要因素之一。本研究选取了非洲栽培稻5份、非洲新稻4份、非洲栽培稻基因渗入系12份、常籼规稻16份、常规粳稻8份、杂草稻3份,共6种类型的48份水稻种质材料为研究对象,通过克隆四个非生物胁迫抗性基因序列并测序,探究了四个非生物胁迫抗性基因的DNA序列以及其中的多态性,发掘不同水稻种质中非生物逆境抗性相关基因的变异,并结合相关的表型性状数据,筛选出含有有利等位基因的水稻种质材料。以期为水稻的抗逆品种选育提供优异的种质资源和理论依据。本研究的结果如下:1.在48个水稻材料的耐盐基因ZFP179转录区域(编码区+UTR区)序列中共鉴定出2个单倍型和3个变异位点,单倍型之间的遗传距离为2.341。单倍型ZFP179.Hap1被分在ST I组,单倍型ZFP179.Hap2被分在ST II组。两个单倍型中存在2种编码序列,且其翻译的氨基酸序列也不相同,其中存在着2个氨基酸序列的变异位点。在进一步ZFP179基因的密码子偏好性分析中,发现耐盐基因ZFP179等位基因明显偏好于使用以碱基G/C结尾的密码子。2.在48个水稻材料的耐旱基因OsRCI2-5转录区域(编码区+UTR区)序列中共鉴定出6个单倍型和10个变异位点。6个单倍型之间平均遗传距离为1.053,最大遗传距离为1.265,最小遗传距离为0.894。单倍型OsRCI2-5.Hap1被分在DT1 I组,单倍型OsRCI2-5.Hap3、OsRCI2-5.Hap4、OsRCI2-5.Hap5和OsRCI2-5.Hap6被分在DT1 II组,单倍型OsRCI2-5.Hap2被分在DT1 III组。6个单倍型中存在3种编码序列,但其翻译获得的氨基酸序列相同。在进一步OsRCI2-5基因的密码子偏好性分析中,发现耐旱基因OsRCI2-5等位基因明显偏好于使用以碱基G/C结尾的密码子。3.在48个水稻材料的耐旱基因OsDT11转录区域(编码区+UTR区)序列中共鉴定出7个单倍型和29个变异位点。7个单倍型之间平均遗传距离为1.472,最大遗传距离为2.446,最小遗传距离为0.087。单倍型OsDT11.Hap3被分在DT2 I组,单倍型OsDT11.Hap4、OsDT11.Hap5、OsDT11.Hap6和OsDT11.Hap7被分在DT2 II组,单倍型OsDT11.Hap1和OsDT11.Hap2被分在DT2 III组。7个单倍型中共存在3种编码序列,分别可以翻译获得2种氨基酸序列。在进一步OsDT11基因的密码子偏好性分析中,发现耐旱基因OsDT11等位基因对于密码子的第3位碱基没有明显的选择偏好性。4.在48个水稻材料的耐冷基因qLTG3-1转录区域(编码区+UTR区)序列中共鉴定出7个单倍型和12个变异位点。7个单倍型之间平均遗传距离为1.488,最大遗传距离为2.472,最小遗传距离为0.234。单倍型qLTG3-1.Hap1、qLTG3-1.Hap2、qLTG3-1.Hap3和qLTG3-1.Hap7被分在LTR I组,单倍型qLTG3-1.Hap5被分在LTR II组,单倍型qLTG3-1.Hap4和qLTG3-1.Hap6被分在LTR III组。7个单倍型中存在7种编码序列,它们可分别翻译为7种氨基酸序列。在进一步qLTG3-1基因的密码子偏好性分析中,发现耐旱基因qLTG3-1的单倍型比较偏好于使用以碱基G/C结尾的密码子。5.在选择压力分析时发现,耐盐基因ZFP179受到强烈的正选择效应的影响,耐旱基因OsRCI2-5受到强烈的纯化选择作用,耐旱基因OsDT11可能偏向于中性选择作用,耐冷基因qLTG3-1受到一定程度的纯化选择作用。6.结合表型性状进行多重分析时发现,在盐胁迫条件下2个ZFP179单倍型在相对根长上存在显着差异。在旱胁迫条件下,5个OsRCI2-5单倍型在存活率、相对茎长和相对根数等11农艺性状存在显着差异;6个OsDT11单倍型在存活率、相对茎长和相对根数等13农艺性状存在显着差异。在冷胁迫条件下,5个qLTG3-1单倍型在平均发芽天数和相对发芽天数存在显着差异。

宣金锋[7](2019)在《Y染色体遗传标记在法医学中的应用研究》文中研究表明目的:在人类的23对染色体中,有22对为常染色体,另1对为性染色体。在不同性别中,男性性染色体组成为XY,女性为XX。Y染色体仅存在于男性细胞中,属于近端着丝粒染色体。在人类Y染色体上有五类多态性遗传标记,包括卫星DNA、小卫星DNA、微卫星DNA、InDel及SNP。而对Y染色体进行分析的意义在于Y染色体仅存在于男性个体中,且Y染色体STR稳定的由父代男性遗传给子代男性。Y染色体STR基因座呈单倍体父系伴性遗传的特性,与常染色体STR基因座相比较而言在法医学鉴定中具有其独特性。随着科技的发展进步,测序技术的进步也是日新月异。目前使用的测序技术主要有Sanger测序、焦磷酸测序以及正在迅速发展的新一代测序技术。新一代测序技术一次可对多个样本的几十万到几百万条DNA分子进行序列测定,测序准确度可达99%以上,其单次测序所产生的高质量数据在平均水平下已经足以覆盖人类基因组30倍以上,为DNA分析提供了一种全新的技术手段。DYF155S1基因座是被报道的第一个Y染色体上的小卫星多态性位点,同时具有长度多态性和序列多态性,而且不同民族间存在重复序列排列差异。因此本研究拟在以下三方面做探索:1、使用新一代测序技术分析Y染色体STR及其侧翼SNP,探索新一代测序技术在Y染色体STR核心序列测定的准确程度并探讨新一代测序技术在解决混合斑检验中的作用。2、利用二次PCR及Sanger测序技术对包括中国汉族群体在内的4个群体的样品进行了研究,探讨DYF155S1位点的遗传多态性及群体间差别。3、进行群体遗传学研究,探索中国吉林省延边地区朝鲜族人群的Y-STR数据特征,为Y染色体STR位点在法庭科学中的应用提供基础数据。研究方法:本研究选取了20例无父缘关系个体样品,选取其中两例无关个体样品混合形成各组份DNA含量不同的混合斑样品,两组确定父子关系的4个样品。使用ABI Y Filer Plus试剂盒对所有样品进行Y染色体STR分型。针对Y染色体各STR位点上下游各1.5Kb范围设计序列特异性引物,扩增出包含各Y染色体STR核心序列在内的DNA片段。在携有两端接头的转座酶作用下,对扩增出的DNA片段随机片段化,同时于片段末端连接接头。修复转座连接处,然后进行PCR反应,对文库进行富集,并加上测序所需全长接头。用AMPure XP Beads对片段长度进行筛选,使目的片段长度范围在300-400bp。将文库混合、变性后,加入到Illumina HiSeq测序平台进行高通量并行测序,对文库两端分别进行测序(即paired-end,PE),因此每个样本会生成reads1(R1)和reads2(R2)两个数据文件。对测序原始数据进行质量控制与质量检测,确认测序原始数据可靠性后将原始数据与参考序列进行比对获取各样品的STR及SNP数据。观察各样品的Y染色体STR位点核心序列能否准确读出,观察混合样品的STR位点能否通过数据比对获得准确的分型,能否组装出不同样本的单倍型。利用二次PCR及Sanger测序技术对中国境内的4个群体:汉族、朝鲜族、藏族、维吾尔族的共200例样品的DYF155S1位点进行调查研究,统计分析这四个民族间DYF155S1位点的遗传多态性及群体间差别。对257个中国吉林省延边地区朝鲜族男性样品的Y染色体STR数据进行统计分析。按不同区域统计相应的法医学参数包括单倍型数目、单倍型多样性,随机匹配概率、单倍群数目等。用R语言基于10个群体的单倍群频率进行主成分分析,判断不同群体间的遗传距离。结果:1、本研究建立了区域捕获技术与新一代测序技术相结合对Y染色体STR基因座测序分析的方法。探讨了新一代测序技术对STR位点重复序列及其重复次数进行研究的可行性,证明在单一重复序列STR位点新一代测序技术可以较好地对其进行测序分析,而对于重复次数较多或重复单元较多STR位点则测序结果表现不佳。研究结果表明,使用新一代测序技术对结构较复杂的STR位点如DYS385、DYS387S1位点重复序列及其重复次数进行研究存在一定局限。2、本研究结果表明,使用新一代测序技术可以对混合样品STR位点重复序列及其重复次数进行研究分析。3、本研究共发现DYF155S1位点重复序列5种,分别为1型、3型、4型、6型和7型。包括本研究在内,DYF155S1位点的重复序列已发现有9种类型。研究发现,DYF155S1位点的结构有较明显的民族差别。本研究中发现的6型重复序列仅在维吾尔族个体和藏族个体中检出,7型重复序列仅在藏族个体和朝鲜族个体中检出。4、在本研究中,50名汉族个体样本检出48种结构组合,50名维吾尔族个体样本检出48种结构组合,50名朝鲜族个体检出了49种结构组合,50名藏族个体检出了42种结构组合。合计200名个体在DYF155S1位点共检出187种结构组成,可以提示该位点的多态性非常高,是法医学亲权鉴定、个人识别的重要遗传标记。5、经过对延边地区朝鲜族257例男性个体Y染色体STR检测分析,19个STR位点中DYS385基因座的GD值最高,为0.9666,DYS391基因座的GD值最低,为0.2260。除DYS385之外的18个STR基因座中,DYS391等位基因数最少,为3个,DYS456、DYS447基因座等位基因最多,均为8个。4、将延边地区男性和YHRD数据库中北京汉族、江苏汉族、吉林汉族、云南汉族、辽宁回族、辽宁朝鲜族、辽宁满族、广西苗族、日本人群、韩国人群等共10个群体进行遗传距离分析。分析结果表明,延边地区朝鲜族与辽宁朝鲜族和韩国人群遗传距离相近,而与其他民族遗传距离较远,尤其与广西苗族遗传距离最远。结论:1、本研究使用区域捕获加序列分析的方法分析了Y染色体STR位点,确认该方法能够更高效、更准确的对Y染色体STR及其侧翼序列进行分析。2、对DYF155S1位点在中国四个民族内的多态性分布进行了调查研究,证实该位点在核心序列及排列方式分布上具有一定的民族差异,可以为个体的民族区分提供帮助。3、对中国延边地区朝鲜族群体的19个Y染色体STR位点进行了频率调查并获取了相应数据。延边地区朝鲜族与辽宁朝鲜族和韩国人群遗传距离相近,而与其他民族遗传距离较远。

张昭阳[8](2018)在《GWAS定位水稻成熟种子组培力相关基因及功能分析》文中研究指明组织培养技术广泛应用于植物功能基因组研究和作物改良育种。水稻是世界范围种植最广泛的粮食作物之一,它的组织培养能力对其转基因效率有很大的影响。常用的水稻组织培养使用成熟种子作为外植体,经历愈伤诱导,愈伤分化阶段产生新的小植株。虽然水稻成熟种子的高效组织培养和农杆菌介导转化体系已经建立,但仅限于粳稻和少些籼稻品种。过去二十年间通过QTL定位鉴定到了很多与水稻组培力相关的QTLs,但是对影响水稻组培力的基因发掘较少,对于水稻组织培养的机制还不明了。本研究应用GWAS技术分别对水稻成熟种子愈伤形成和分化两个阶段的相关性状进行扫描,在一个大的自然群体中分析水稻组培力的遗传变异,希望鉴定到水稻组织培养相关的基因并展开进一步研究。愈伤诱导方面,鉴定了510个水稻微核心种质资源的诱导率(CIR)、诱导速率(CIS)、和出愈伤初始天数(T0)三个性状。在三个主要的亚群(IndAll,JapAll,Aus)中,Aus表现出最高的CIR和CIS以及最小的T0,籼稻群体的诱导率(P=1.05E-06)和诱导速率(P=0.000986)显着大于粳稻群体。在整个510群体以及七个亚群中对诱导的三个性状进行GWAS分析。在整个群体共扫描到88个loci(CIR 33个loci,CIS 31个loci,T0 24个loci)。共有23个显着loci的lead SNPs位于水稻成熟种子诱导相关的物理图谱双边界QTLs内。候选基因筛选方面,三个候选基因CRL1、OsBBM1和OsSET1分别与拟南芥的LBD17和LBD29,BBM,SWN直系同源。另外根据lead SNP的P值,基因注释和水稻各组织表达谱以及愈伤诱导过程的表达量变化,挑选了14个可能与愈伤诱导相关的候选基因。通过购买突变体,构建RNAi材料,发现了三个候选基因LOCOs04g09900,LOCOs02g30900,LOCOs02g57250(OsIAA10)可能参与了水稻的愈伤诱导。其中OsIAA10的RNAi会导致几乎完全无法生成愈伤,表型与表达量共分离,而且种子在诱导培养基上胚芽生长不受到影响,胚芽长度与OsIAA10的表达量负相关并共分离。我们的发现说明水稻可能通过根发育途径产生愈伤,其机制可能是OsIAA10响应生长素类似物2,4-D,激活ARFs从而启动CRL1等下游基因的表达。愈伤分化方面,使用诱导后生长状态一致的237份种质愈伤作为材料。鉴定了237份种质的绿点生成的3个性状:绿点生成率(BGR)、绿点生成速率(BGS)、出绿点初始天数(GBT0),以及愈伤分化的4个性状:愈伤分化率(DR)、愈伤分化速率(DS)、出绿苗初始天数(PRT0)、每颗愈伤分化苗数。在主要的三个亚群中Aus表现出最强的绿点生成与愈伤分化能力,粳稻的BGR(P=1.49226E-06)、BGS(P=0.0437)和DR(P=4.81099E-07),DS(P=0.00187)都显着高于籼稻。分别对绿色芽点生成性状和愈伤分化性状进行GWAS分析。绿色芽点生成方面,三个性状共鉴定了61个显着关联loci(BGR 32个loci,BGS18个loci,GBT0 11个loci)。愈伤分化方面,四个性状共扫描到60个显着关联loci(DR 13个loci,DS 8个loci,PGT0 26个loci,APN 13个loci)。共有10个显着loci的lead SNPs位于已定位的愈伤分化QTLs区域内。BGS性状在Aus群体的GWAS分析定位到一个与已报道的控制愈伤分化性状的基因PSR1。在Aus群体中分析PSR1的单倍型,得到了2个haplotype。Hap1具有较高的BGS,并显着高于hap2(P=0.0233)。

陈剑华[9](2018)在《精神神经内分泌相关障碍的高通量遗传学研究》文中认为精神障碍和躯体疾病之间存在着复杂的相互影响,其作用机制可能与神经-内分泌-免疫相关,本文聚焦精神分裂症、重性抑郁障碍、原发性痛经以及库欣病等精神神经内分泌相关障碍,从候选基因、全外显子组、全基因组等不同的策略展开相关研究。汉族人群中SP4基因与精神分裂症和重性抑郁障碍的遗传易感性分析精神分裂症与重性抑郁障碍等精神障碍可能由多个易感基因引起,但单个易感基因对增加疾病的风险影响较小。鉴定与精神分裂症和重性抑郁障碍相关的遗传变异位点是理解这些障碍的病理生理学机制的关键步骤之一。为了探讨SP4基因是否在中国汉族人群的精神分裂症或重性抑郁障碍中起到作用。我们聚焦于SP4基因的9个SNP位点,在1,235名精神分裂症患者,1,045名重性抑郁障碍患者和1,235名来自汉族人群的健康对照中进行病例对照研究。结果发现rs40245的等位基因和基因型频率分布与精神分裂症显着相关(Pallele=5.00×10-4,Bonferroni校正后Pallele=4.00×10-3;Pgenotype=2.30×10-3,Bonferroni校正后Pgenotype=0.018)。SNP rs6461563的等位基因频率分布与精神分裂症显着相关(Pallele=3.30×10-3,Bonferroni校正后Pallele=0.026)。我们的研究结果表明SP4基因的常见风险因素与中国汉族人群精神分裂症相关,与重性抑郁障碍无显着关联。精神分裂症的全基因组关联分析研究为了进一步了解精神分裂症易感性的遗传基础,我们进行了全基因组关联分析研究(GWAS),共有36,180名中国人(其中有12,083例为病例),并结合精神疾病基因组学联盟(PGC2)的最近的精神分裂症的数据结果开展了进一步跨种族的荟萃分析。我们观察到有显着差异的精神分裂症风险等位基因在不同种族之间的方向呈现一致性。通过多基因评分分析支持的跨种族的荟萃分析表明,结合多个种族的数据集是一个有价值和有效的方法。在PGC2研究和我们的中国人群数据集中鉴定的103个基因座,117个达到全基因组水平的显着差异(GWS)的标签等位基因(或其代表的等位基因),在中国人群的病例里有约95%的基因位点(98个基因座,达到GWS的有109个),其中约50%达到名义上的显着性(P<0.05)(56个基因座,达到GWS的有58个),约75%在跨种族的分析中继续显示GWS(78个基因座,达到GWS的有85个)。在中国人群的数据中分析出来达到GWS的有7个基因位点,其中有3个达到GWS。在识别109 GWS基因座的跨种族分析中,其中有113个基因位点在至少一个分析中达到GWS。在113个风险基因位点中,有30个是新发现的,其中有4个只有在中国人群的数据集中才能看到。我们观察到在许多易感基因位点的精细定位方面有相当大的改进。我们的研究结果提供了许多支持候选基因位点的证据,并突出了一些基因通路(如:胰高血糖素样肽-1调节胰岛素分泌通路等),以供进一步的研究。同时我们还观察到中国人群中精神分裂症与重性抑郁障碍之间存在显着的遗传相关性(rg=0.43,P=5.87×10-8)。总的来说我们的发现为精神分裂症的遗传结构和生物学病因机制提供了新的认识。中国人群原发性痛经的全基因组关联分析研究原发性痛经是一种育龄期妇女的常见问题,被定义为在没有盆腔病理学改变的情况下出现的月经期疼痛性痉挛。原发性痛经的病因和病理生理在很大程度上仍然是未知的。在本研究中,我们对总数为6,770名的中国受试者中进行了两阶段的全基因组关联分析研究和随后的重复验证研究,以确定与原发性痛经相关的遗传因素。我们的研究结果提示ZMIZ1基因中的位点rs76518691和NGF基因周围的位点rs7523831与原发性痛经显着相关(P<5×10–8)。ZMIZ1基因以前已经被报道与几种自身免疫性疾病有关,而NGF基因在产生疼痛和痛觉过敏中起到了关键作用,并且与偏头痛有关。这些研究结果为原发性痛经的易感性机制研究提供了未来的方向,此外,我们的遗传结构分析也为这种病症的多基因遗传性质提供了分子遗传学上的支持。垂体促肾上腺皮质腺瘤致病相关基因的遗传研究垂体促肾上腺皮质腺瘤(库欣病)由脑垂体腺瘤引起,大量分泌促肾上腺皮质激素,导致过量的糖皮质激素和皮质醇增多。去泛素化酶基因USP8的突变在35-62%的垂体促肾上腺皮质腺瘤中被发现。然而,USP8野生型肿瘤中的主要驱动突变仍然是未知数。在本研究中,我们在USP8野生型的促肾上腺皮质腺瘤中鉴定了多次出现的去泛素化酶基因USP48(主要编码p.M415I or p.M415V;21/91例受试者样本)和BRAF基因(编码p.V600E;15/91例受试者样本)。USP48或BRAF基因突变在USP8突变型病例中很少被检出(分别为1/78和4/78)。在总共有169例的垂体促肾上腺皮质腺瘤中,USP8、USP48和BRAF的突变呈现显着的相互独立存在的趋势。因此,我们的研究有助于了解垂体促肾上腺皮质腺瘤发病的分子机制,并为这一疾病提供了新的可能的药物治疗靶点。

沈佳薇[10](2016)在《复杂疾病致病机制研究中数据分析算法的开发与应用》文中指出复杂疾病的致病不是由于单个基因位点的显性或隐性的遗传所引起的,遗传因素在复杂疾病的发展中起着重要的作用,且其病因由多种因素组成,包括常见变异以及基因-基因、基因-环境相互作用等。目前我们对于大多数复杂疾病的病因的了解仍然有限,有很大比例的遗传风险因素还有待探索。开展复杂疾病的遗传学研究将有助于我们了解疾病发生发展中的生化机制和发病机制,从而为疾病的早期预防、早期诊断、药物筛选和使用提供理论依据和生物靶标,最终提高复杂疾病的防治水平。因此,开展复杂疾病的遗传学研究有着重要的意义。当前,复杂疾病遗传机制的研究思路主要分为以下几步:(1)开展高通量实验得到位点的基因型。(2)对原始数据进行质量控制、人群结构分析。(3)进行功能变异位点分析,即单位点分析策略。(4)进行基因相互作用分析,即多位点分析策略。(5)构建复杂疾病遗传机制的分子网络。复杂疾病的遗传学研究的成果能够为遗传诊断和疾病预防提供大量的信息,这些信息将能够为临床决策提供重要的依据并使得个性化医疗成为可能。二代测序技术的发展为遗传疾病的诊断和预防奠定了坚实的基础。本研究论文的前三个课题将围绕复杂疾病遗传机制的研究思路中的(2)、(3)、(4)展开。第四个课题则提出了一种新的基于二代测序的无创产前诊断方法。课题Ⅰ:人群层化是指不同人群之间等位基因频率存在系统性差异的现象。在全基因组关联分析研究中,人群层化的存在会增加关联分析结果的假阳性率。主成分分析是目前使用最广泛的检测人群层化的方法之一。然而,随着基因芯片技术的发展,其通量也越来越大,传统的基于CPU的算法的效率已经无法满足日益增长的数据量的需求。为此,我们实现了一种基于GPU的主成分分析的算法:SHEsisPCA,其运算效率远远高于传统的基于CPU的算法,最高加速比超过了 100倍。同时,我们也实现了一种基于X-means的聚类分析算法,它可以根据样本的遗传背景计算出匹配的病例和对照样本,从而降低人群层化对于全基因组关联分析的影响。我们使用SHEsisPCA对非洲人种进行了人群结构分析,结果表明样本的聚类结果和样本的实际人群分类是高度相关的。且我们的研究表明,使用SHEsisPCA得到匹配的病例对照样本后再进行关联分析能很大程度上降低关联分析的假阳性率。研究者们也可以使用SHEsisPCA来匹配公共数据库里(如dbGaP,IlluminaiControlDB)的对照样本,从而扩充研究样本的数据量,增加全基因组关联分析的统计效能。课题Ⅱ:关联分析是遗传学研究的重要手段。目前,已有很多适用于二倍体二等位基因物种的关联分析算法和软件被提出,而适用于多倍体多等位基因物种的算法和软件却十分有限。多倍体在植物中是十分常见的,且多等位基因的遗传标记位点,如小卫星位点,拷贝数多态性等,也常常被研究者使用。本课题提出了一个用于多倍体多等位基因物种的关联分析的在线分析平台SHEsisPlus,其操作简单、用户友好,主要功能包括:病例-对照以及数量性状位点的关联分析、哈温平衡检验、连锁不平衡分析、单倍型分析以及高维的基因相互作用分析。同时,我们也提出了两种新的算法。一种是适用于多倍体多等位基因物种的高效的单倍型推断算法,该算法的准确度以及效率远远超过了现有的算法。另一种是适用于数量性状的高维基因相互作用分析算法,我们应用了信息论中的互作信息来定量位点之间的相互作用,研究结果表明该方法的统计效能远远高于传统的方法,且不受单个位点的边际效应的影响。SHEsisPlus是目前第一个支持多倍体多等位基因物种关联分析的在线平台。课题Ⅲ:前列腺癌是发生于男性的最常见的恶性肿瘤之一。前列腺癌是一种复杂疾病,目前认为复杂疾病的致病机制受遗传因素和环境因素的交互影响。虽然现已发现了多个前列腺癌的易感基因位点,然而这些发现仅能解释13%的遗传度。为了进一步寻找前列腺癌致病因素中缺失的遗传度,我们在四个人种(非洲裔美国人、欧洲人、拉丁美洲人、日本人)中开展了大规模的全基因组基因相互作用研究,共包含5,269个病例及5,289个对照。在我们的结果中,有一对相互作用的区域(7p21.3 和 18p11.2,p=1.4×10-14)达到了经 Bonferroni 矫正后的全局阳性阈值(p<2.28× 10-13),且这两个区域间的相互作用在四个人种中均为阳性。18p11.22位于基因VAPA附近,研究表明,在前列腺癌的发生发展中,VAPA是基因PTEN的ceRNAs(competing endogenous RNA),而PTEN则是一个重要的肿瘤抑制基因,该基因在多种肿瘤中均存在变异,包括前列腺癌。以往的研究已在7p21区域内发现了多个前列腺癌的易感位点。药物富集分析的结果表明,呈现强阳性的相互作用的基因与经FDA批准的用于治疗前列腺癌的药物的靶标基因显着重叠。之前的研究认为全基因组关联分析的结果可以为新药的开发提供非常宝贵的信息。这里我们证明了全基因组基因相互作用分析的结果也能够为药物研发提供重要的证据和指导。这表明人类遗传数据可以有效地和其他生物学信息相结合以发现新的生物学证据并指导药物的开发。课题Ⅳ:高通量测序技术已被广泛应用于无创产前诊断领域,相比于传统的有创产前诊断,无创产前诊断不仅安全性高,其准确度和灵敏度也很高。无创产前诊断主要用于检测胎儿的染色体非整倍性疾病,如21-三体综合征、18-三体综合征以及13-三体综合征等。目前,使用高通量测序技术进行无创产前诊断的方法主要是Z-score法。该方法首先使用怀有正常胎儿的孕妇的相应染色体含量建立一个正常分布,然后将待测样本的相应染色体的含量与该分布进行比较,最后得出诊断结果。由于该方法需要使用大量的正常样本建立正常分布,这不仅耗时长,且成本高。除此以外,每次测序的实验环境(如实验室的温度、湿度等)无法保证一致,因此可能会引入噪声,对结果造成一定的影响。针对这些问题,我们提出了一种新的分析方法,该方法只需一个已知正常的样本即可判断待测样本是否患病,且参考样本和受试样本的DNA信息都在同一次测序中得到。这样不仅减少了测序的成本、节约时间,且能够尽可能地避免引入噪声。我们使用该方法检测了 44个已知核型的样本(共计13次测序实验),其对于13-三体综合征的检测的特异性和灵敏性分别为100%和95.181%,对于18-三体综合征的检测的特异性和灵敏性分别为100%和100%,对于21-三体综合征的检测的特异性和灵敏性分别为90%和100%。

二、基因组多态性、单核苷酸多态性和“国际人类基因组单倍型图谱计划”(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基因组多态性、单核苷酸多态性和“国际人类基因组单倍型图谱计划”(论文提纲范文)

(1)TNF,GRN和ERAP1基因多态性与强直性脊柱炎的关联性研究(论文提纲范文)

中文摘要
English Abstract
符号说明
第一部分 中国汉族人群TNF和GRN基因多态性与强直性脊柱炎的关联性研究
    前言
    材料与方法
    结果
    讨论
    结论
    参考文献
第二部分 ERAP1基因多态性与强直性脊柱炎易感性关系的Meta分析
    前言
    研究方法
    结果
    讨论
    结论
    参考文献
致谢
攻读博士学位期间发表的论文
学位论文评阅及答辩情况表
外文论文Ⅰ (已发表)
外文论文Ⅱ

(2)新疆地区变应性鼻炎吸入变应原谱及相关拷贝数变异分析(论文提纲范文)

中英文缩略词对照表
摘要
ABSTRACT
前言
第一部分 新疆地区5019例变应性鼻炎患者吸入变应原谱分析
    1 研究内容与方法
        1.1 研究对象
        1.2 研究方法(皮肤点刺试验)
        1.3 技术路线图
        1.4 统计方法
    2 结果
    3 讨论
    4 小结
第二部分 基于低深度全基因组测序筛选致变应性鼻炎的拷贝数变异
    1 研究内容与方法
        1.1 研究对象
        1.2 研究方法
        1.3 质量控制
        1.4 技术路线图
        1.5 统计学方法
    2 结果
    3 讨论
    4 小结
第三部分 13个基因拷贝数变异与新疆地区汉族变应性鼻炎的相关性研究
    1 研究内容与方法
        1.1 研究对象
        1.2 研究方法
        1.3 质量控制
        1.4 技术路线图
        1.5 统计方法
    2 结果
    3 讨论
    4 小结
结论
致谢
参考文献
综述 拷贝数变异的研究进展
    参考文献
攻读博士学位期间获得的学术成果
个人简历
导师评阅表

(3)胃癌危险因素的定量评估及发病风险预测模型构建(论文提纲范文)

摘要
Abstract
英文缩略词表
引言
第一部分 遗传和非遗传因素与胃癌的发病风险及流行病学评价
    1 前言
    2 材料与方法
        2.1 胃癌危险因素的检索
        2.2 数据提取
        2.3 积累证据的质量评估
        2.4 统计学分析
    3 结果
        3.1 定量系统评估文献识别
        3.2 纳入研究基线特征
        3.3 定量合并结果
        3.4 危险因素的流行病学评价
    4 讨论
        4.1 非遗传因素
        4.2 遗传因素
        4.3 流行病学评价
        4.4 小结
    参考文献
第二部分 基于多基因风险评分的胃癌风险预测模型构建
    1 前言
    2 材料与方法
        2.1 生物信息学筛选胃癌相关lncRNAs
        2.2 风险预测模型相关SNPs的选取
        2.3 生物学实验
        2.4 研究方法
        2.5 胃癌风险预测模型的构建与评价
        2.6 质量控制
        2.7 统计学分析
    3 结果
        3.1 研究对象的基线特征
        3.2 基因分型结果
        3.3 Hardy-Weinberg equilibrium检验
        3.4 胃癌与遗传易感性关联
        3.5 风险预测模型构建
        3.6 风险模型的构建及评价
    4 讨论
        4.1 风险预测模型与肿瘤
        4.2 遗传关联与胃癌
        4.3 胃癌风险模型的构建
        4.4 模型参数优化与拟合
        4.5 拟合优度与模型评价
        4.6 小结
创新性和局限性
    创新性
    局限性
全文结论
参考文献
附录
    1.1 13维危险因素组合程序
    1.2 22维风险基因组合程序
    1.3 PRS主程序
    1.4 NRI和IDI程序
    1.5 遗传和非遗传因素与胃癌的发病风险及流行病学评价纳入参考文献列表
        参考文献
综述 多基因风险评分在肿瘤研究中的应用及进展
    参考文献
个人简历
致谢

(4)20个微单倍型遗传标记的法医学应用研究(论文提纲范文)

中英文缩略词对照表
摘要
ABSTRACT
前言
研究内容与方法
    1.研究对象
    2.内容与方法
        2.1 微单倍型遗传标记的筛选
        2.2 微单倍型遗传标记的遗传多态性分析
        2.3 微单倍型遗传标记的NGS检测
        2.4 微单倍型遗传标记的法医学应用
    3.统计方法
        3.1 微单倍型的法医遗传学参数分析
        3.2 微单倍型的测序质量分析
结果
    1.微单倍型基因座的筛选结果
        1.1 SNP的 Hiseq测序筛选结果
        1.2 候选微单倍型基因座的基本信息
        1.3 候选微单倍型基因座的法医群体遗传多态性
    2.微单倍型基因座的NGS检测
        2.1 扩增引物
        2.2 测序质量
        2.3 测序结果
    3.微单倍型基因座法医群体遗传学参数
讨论
小结
致谢
附录
参考文献
综述
    参考文献
攻读硕士学位期间发表的学位论文
导师评阅表

(5)人体微量营养素缺乏风险关联SNP高通量微流体芯片方法研究与初步应用(论文提纲范文)

摘要
Abstract
缩略词表
前言
第一章 从血液和唾液中自动化提取DNA方法的优化
    1 材料与方法
    2 各种样本DNA提取方法的评估
    3 统计方法
    4 结果
    5 讨论
第二章 竞争性等位基因特异性PCR引物设计方法
    1 引物设计原理
    2 设计方法
    3 SNP纳入原则
    4 引物设计结果
    5 讨论
    6 结论
第三章 人体微量营养素缺乏风险关联SNP高通量微流体芯片方法的建立
    1 材料和方法
    2 微流体芯片检测方法的评估
    3 统计方法
    4 血液中提取的DNA在芯片上的评估结果
    5 唾液中提取的DNA在芯片上的评估结果
    6 讨论
    7 结论
第四章 MDR-SNPs位点地域分布特征及关联分析初探
    1 材料和方法
    2 结果
    3 讨论
全文讨论
创新点
结论
未来工作计划
参考文献
综述 单核苷酸多态性基因分型技术与人类营养风险评估
    参考文献
附录
个人简历
致谢
发表文章

(6)非洲栽培稻与亚洲栽培稻中非生物胁迫抗性基因的功能性核苷酸多态性(论文提纲范文)

摘要
Abstract
缩略词表
1 前言
    1.1 水稻基因组学及功能基因的研究进展
        1.1.1 水稻基因组学研究进展
        1.1.2 水稻功能基因的研究进展
        1.1.3 重要功能基因的克隆
    1.2 水稻抗逆种质资源发掘及抗性基因鉴定的研究进展
        1.2.1 水稻耐盐种质资源发掘及耐盐基因鉴定的研究进展
        1.2.2 水稻耐旱种质资源发掘及耐旱基因鉴定的研究进展
        1.2.3 水稻耐冷种质资源发掘及耐冷基因鉴定的研究进展
        1.2.4 水稻中重要耐盐、耐旱和耐冷基因工程研究进展
    1.3 遗传多样性的研究进展
        1.3.1 遗传变异的类型及其检测方法
        1.3.2 功能性核苷酸多态性
        1.3.3 特异水稻种质资源的遗传多样性
    1.4 研究的目的与意义
        1.4.1 研究的目的
        1.4.2 研究的意义
2 材料与方法
    2.1 实验材料及数据来源
    2.2 实验方法
        2.2.1 主要实验仪器及试剂配置
        2.2.2 材料的培养与叶片总DNA的提取
        2.2.3 目标序列的获得与测序
        2.2.4 数据分析
3 结果与分析
    3.1 耐盐基因ZFP179 的遗传多样性分析
        3.1.1 耐盐基因ZFP179 转录区域的序列多态性分析
        3.1.2 耐盐基因ZFP179 单倍型的网络图
        3.1.3 耐盐基因ZFP179 不同转录区域间的遗传距离遗传
        3.1.4 耐盐基因ZFP179 转录区域的系统进化分析
        3.1.5 耐盐基因ZFP179 的氨基酸序列多态性分析
        3.1.6 耐盐基因ZFP179 的密码子偏好性分析
    3.2 耐旱基因OsRCI2-5 的遗传多样性分析
        3.2.1 耐旱基因OsRCI2-5 转录区域的序列多态性分析
        3.2.2 耐旱基因OsRCI2-5 单倍型的网络图
        3.2.3 耐旱基因OsRCI2-5 不同转录区域间的遗传距离遗传
        3.2.4 耐旱基因OsRCI2-5 转录区域的系统进化分析
        3.2.5 耐旱基因OsRCI2-5 的氨基酸序列多态性分析
        3.2.6 耐旱基因OsRCI2-5 的密码子偏好性分析
    3.3 耐旱基因OsDT11 的遗传多样性分析
        3.3.1 耐旱基因OsDT11 转录区域的序列多态性分析
        3.3.2 耐旱基因OsDT11 单倍型的网络图
        3.3.3 耐旱基因OsDT11 不同转录区域间的遗传距离遗传
        3.3.4 耐旱基因OsDT11 转录区域的系统进化分析
        3.3.5 耐旱基因OsDT11 的氨基酸序列多态性分析
        3.3.6 耐旱基因OsDT11 的密码子偏好性分析
    3.4 耐冷基因qLTG3-1 的遗传多样性分析
        3.4.1 耐冷基因qLTG3-1 转录区域的序列多态性分析
        3.4.2 耐冷基因qLTG3-1 单倍型的网络图
        3.4.3 耐冷基因qLTG3-1 不同转录区域间的遗传距离遗传
        3.4.4 耐冷基因qLTG3-1 转录区域的系统进化分析
        3.4.5 耐冷基因qLTG3-1 的氨基酸序列序列多态性分析
        3.4.6 耐冷基因qLTG3-1 的密码子偏好性分析
    3.5 选择压力分析
    3.6 不同单倍型分组间不同抗逆性状的多重比较分析
4 结论与讨论
    4.1 水稻基因的克隆与测序
    4.2 高度保守的OsRCI2-5 基因
    4.3 多态性丰富的qLTG3-1 基因
    4.4 非生物胁迫抗性基因在稻属物种中的分化
    4.5 筛选聚合多个有利等位基因的核心种质材料
    4.6 存在的问题及应对措施
    4.7 本研究的设想与展望
参考文献
附录
致谢

(7)Y染色体遗传标记在法医学中的应用研究(论文提纲范文)

摘要
Abstract
英文缩略语
第一部分 :运用NGS检测Y-STR位点的法医学意义
    1 前言
    2 材料与方法
        2.1 实验材料
        2.1.1 实验样品
        2.1.2 主要试剂与耗材
        2.1.3 主要仪器
        2.1.4 主要软件、计算机语言及网络工具
        2.2 实验方法
        2.2.1 DNA提取及质量检测
        2.2.2 目的片段扩增及质量检测
        2.2.3 文库构建及质量检测
        2.2.4 序列测定及数据处理
    3 结果
        3.1 琼脂糖检测结果
        3.1.1 目的片段扩增及质量检测结果
        3.1.2 文库质量检测结果
        3.2 捕获区域序列
        3.3 测序结果质量分析
        3.3.1 测序数据统计
        3.3.2 参考基因组比对结果
        3.4 STR位点测序及试剂盒分型结果
        3.4.1 全基因组测序结果
        3.4.2 区域捕获测序结果
        3.4.3 区域捕获测序对无关个体测序结果及试剂盒分型结果
        3.4.4 区域捕获测序对父子样品测序结果
        3.4.5 混合样品测序结果及试剂盒分型结果
        3.5 SNP位点测序结果
    4 讨论
        4.1 文库构建
        4.2 STR位点测序结果分析
        4.2.1 无关样品测序结果分析
        4.2.2 父子样品测序结果分析
        4.2.3 混合样品测序结果分析
        4.3 SNP分析
    5 结论
第二部分 :DYF155S1位点重复序列排列的种族与个体差异
    1 前言
    2 材料与方法
        2.1 实验材料
        2.1.1 实验样品
        2.1.2 主要试剂与耗材
        2.1.3 主要仪器设备及分析软件
        2.2 实验方法
        2.2.1 DNA提取
        2.2.2 PCR扩增
        2.2.3 PCR产物序列测定
    3 结果
        3.1 样品的PCR分型
        3.2 重复序列测序结果
        3.3 数据统计结果
    4 讨论
    5 结论
第三部分 :延边朝鲜族19个Y-STR的多态性分布
    1 前言
    2 材料和方法
        2.1 实验材料
        2.1.1 实验样品
        2.1.2 主要试剂及材料
        2.1.3 主要仪器及分析软件
        2.2 实验方法
        2.2.1 DNA的提取
        2.2.2 模板DNA的质量控制
        2.2.3 PCR扩增
        2.2.4 PCR反应循环参数
        2.2.5 扩增产物的检测
        2.2.6 扩增产物分型
        2.2.7 统计分析
    3 结果
        3.1 Y染色体STR分型结果
        3.2 Y染色体STR基因座的等位基因频率分布
        3.2.1 19个Y染色体STR基因座的GD值
        3.2.2 辽宁汉族群体与YHRD数据库中其他群体间的遗传距离
    4 讨论
    5 结论
本研究创新性的自我评价
参考文献
综述
    参考文献
攻读学位期间取得的研究成果
致谢
个人简历

(8)GWAS定位水稻成熟种子组培力相关基因及功能分析(论文提纲范文)

摘要
Abstract
英文缩略表
第一章 水稻成熟种子愈伤诱导相关性状的GWAS分析和候选基因功能研究
    1 前言
        1.1 研究问题的来源
        1.2 植物的组织培养
        1.3 愈伤组织的种类
        1.3.1 植物受伤形成愈伤组织
        1.3.2 培养外植体形成愈伤组织及其机制研究
        1.4 水稻的组织培养发展和研究
        1.4.1 数量性状和QTL定位
        1.4.2 水稻组培力的QTL定位
        1.4.3 已报道控制水稻组织培养力的基因
        1.4.4 microRNA对水稻组织培养的作用
        1.5 全基因组关联分析的原理和应用
        1.5.1 全基因组关联分析法的产生
        1.5.2 作物的全基因组关联分析研究
        1.6 微核心种质资源
        1.7 RNA干涉
    2 本研究的目的和意义
    3 材料与方法
        3.1 供试材料
        3.1.1 组织培养所用培养基
        3.1.2 载体与菌株
        3.1.3 水稻突变体
        3.2 实验方法
        3.2.1 水稻成熟种子愈伤诱导
        3.2.2 愈伤诱导性状的观察与数据统计
        3.2.3 全基因组关联分析
        3.2.4 盾片及愈伤组织取样和RNA抽提
        3.2.5 RNA反转录
        3.2.6 荧光实时定量PCR
        3.2.7 突变体阳性检测
        3.2.8 构建RNAi载体
        3.2.9 载体遗传转化
        3.2.10 水稻叶片DNA的小量抽提
        3.2.11 转化植株的阳性和纯杂合检测
        3.2.12 激素处理及取样方法
    4 结果与分析
        4.1 529群体诱导相关性状鉴定与分析
        4.2 诱导相关性状的GWAS分析结果
        4.3 诱导性状GWAS结果与已定位QTLs比对
        4.4 显着loci内的候选基因筛选
        4.4.1 与拟南芥中诱导相关基因的比对
        4.4.2 直系同源基因的表达量检测
        4.4.3 14个候选基因的挑选和表达量检测
        4.5 突变体纯合鉴定以及表型检测
        4.6 RNAi材料家系筛选和表型检测
        4.7 CRL1和OsIAA10的单倍型分析
        4.8 OsIAA10的功能研究
        4.8.1 OsIAA10的RNAi家系不响应2,4-D
        4.8.2 OsIAA10RNAi材料的激素处理
    5 讨论
        5.1 显着loci与水稻愈伤诱导相关性状的QTLs比对
        5.2 与拟南芥诱导相关基因同源的候选基因功能分析
        5.3 本研究发现影响水稻诱导性状的基因
        5.4 OsIAA10的功能
        5.5 水稻愈伤发生通过根发育途径
第二章 水稻成熟种子愈伤分化的GWAS研究
    1 前言
        1.1 体细胞胚发育
        1.2 影响胚发育的因素
        1.3 胚发育的调控与分子机制
        1.4 水稻愈伤分化的研究进展
    2 本研究的目的和意义
    3 材料和方法
        3.1 供试材料和分化培养基
        3.2 愈伤分化培养与性状观察统计
        3.2.1 愈伤接种培养与绿色芽点生成性状观察统计与数据分析
        3.2.2 愈伤分化性状观察统计
        3.3 绿色芽点生成和愈伤分化相关性状的GWAS分析
    4 结果与分析
        4.1 绿色芽点生成和愈伤分化性状统计分析
        4.2 绿色芽点相关性状的GWAS扫描结果
        4.3 愈伤分化相关性状GWAS扫描
        4.4 分化相关性状显着关联loci与已定位QTLs比对
        4.5 候选基因与水稻愈伤分化相关基因的比对
        4.6 PSR1在Aus群体中的单倍型分析
    5 讨论
        5.1 三次重复组织培养实验的一致性
        5.2 绿色芽点的形成和愈伤再生植株的联系
        5.3 Aus群体优秀的组织培养力及其起源
参考文献
附录Ⅰ 载体图
附录Ⅱ 组织培养试剂配制与培养基配方
    2.1 相关试剂配制
    2.2 组培培养基和粳稻农杆菌转化培养基配方
在读期间发表文章
参与会议摘要
致谢

(9)精神神经内分泌相关障碍的高通量遗传学研究(论文提纲范文)

摘要
ABSTRACT
文中常用缩写中英文对照表
第一章 绪论
    1.1 遗传性疾病
    1.2 人类基因组概述
    1.3 遗传性疾病的研究方法
        1.3.1 连锁分析
        1.3.2 关联研究
        1.3.3 多重检验校正、统计效能和哈迪-温伯格平衡
        1.3.4 全基因组关联分析
        1.3.5 构建分子网络
        1.3.6 新一代测序技术的应用
        1.3.7 致病性基因的确定
    1.4 精神神经内分泌障碍
        1.4.1 精神障碍的概述
        1.4.2 精神障碍的病因与发病机制
        1.4.3 神经内分泌学的概述
        1.4.4 精神障碍与神经内分泌
第二章 汉族人群中SP4与精神分裂症和重性抑郁障碍的 遗传易感性分析
    2.1 前言
    2.2 材料与方法
        2.2.1 试剂与仪器
        2.2.2 研究对象
        2.2.3 血液样本采集与DNA抽提
        2.2.4 研究基因位点的选择
        2.2.5 基因分型方法
        2.2.6 统计分析
    2.3 实验结果
        2.3.1 单个位点关联结果
        2.3.2 单倍型分析
    2.4 讨论
第三章 精神分裂症的全基因组关联分析研究
    3.1 前言
    3.2 材料与方法
        3.2.1 研究对象的招募
        3.2.2 中国GWAS数据的基因分型、质量控制和基因推定填补
        3.2.3 PGC2的GWAS数据集
        3.2.4 重复验证数据集
        3.2.5 统计效能计算
        3.2.6 统计方法和生物信息学分析
        3.2.7 中国GWAS数据的LD评分回归
        3.2.8 多基因评分分析
        3.2.9 通路分析
        3.2.10 数据可用性
        3.2.11 URLs
    3.3 实验结果
        3.3.1 中国人群GWAS筛查结果
        3.3.2 中国人群和PGC2全基因组荟萃分析结果
        3.3.3 与重复验证样本的组合分析结果
        3.3.4 跨种族之间的异同
        3.3.5 精神分裂症相关基因座的潜在生物学机制
        3.3.6 改善精神分裂症相关基因座的精细定位分辨率
        3.3.7 生物学通路和基因集
        3.3.8 多基因风险评分分析
        3.3.9 中国人群精神分裂症与重性抑郁障碍的遗传相关性
    3.4 讨论
第四章 中国人群原发性痛经的全基因组关联分析研究
    4.1 前言
    4.2 材料与方法
        4.2.1 试剂与仪器
        4.2.2 研究对象
        4.2.3 研究设计
        4.2.4 Affymetrix全基因组芯片实验
        4.2.5 Illumina全基因组芯片实验
        4.2.6 Sequenom公司Mass ARRAY平台的SNP分型方法
        4.2.7 基因分型和质量控制(QC)
        4.2.8 基因推定填补(imputation)分析
        4.2.9 人群层化分析
        4.2.10 关联和荟萃分析
        4.2.11 GWAS基因位点的生物信息学分析和功能注释
        4.2.12 基于基因和通路的关联分析
        4.2.13 遗传度分析
        4.2.14 数据可用性
    4.3 实验结果
        4.3.1 原发性痛经GWAS易感基因位点
        4.3.2 易感基因位点的功能影响
        4.3.3 全基因组的基因和通路分析
        4.3.4 原发性痛经的SNP遗传度
        4.3.5 子宫内膜异位变异对原发性痛经的影响
    4.4 讨论
第五章 库欣病致病相关基因的遗传研究
    5.1 前言
    5.2 材料与方法
        5.2.1 试剂与仪器
        5.2.2 研究对象
        5.2.3 全外显子测序
        5.2.4 Sanger测序验证候选基因
        5.2.5 蛋白结构同源建模
    5.3 实验结果
        5.3.1 总体测序质量
        5.3.2 USP48和BRAF基因突变
    5.4 讨论
第六章 回顾与展望
参考文献
致谢
攻读学位期间发表或成文的学术论文

(10)复杂疾病致病机制研究中数据分析算法的开发与应用(论文提纲范文)

摘要
ABSTRACT
文中常用缩写中英文对照表
1 绪论
    1.1 复杂疾病概述
    1.2 人类基因组概述
        1.2.1 单核苷酸多态性及人类基因组计划
        1.2.2 人类基因组的拷贝数变异
        1.2.3 连锁不平衡、单倍型及国际人类基因组单倍型图计划
    1.3 复杂疾病遗传机制研究的思路
        1.3.1 使用DNA芯片开展高通量实验
        1.3.2 基因型数据质量控制、人群层化分析
        1.3.3 功能变异位点分析:单因素分析策略
        1.3.4 基因相互作用分析:多因素分析策略
        1.3.5 分子网络构建
    1.4 复杂疾病遗传学的研究现状
    1.5 二代测序技术在疾病诊断中的应用
    1.6 开展复杂疾病遗传学研究的必要性
2 基于GPU的人群结构分析软件SHESISPCA的开发
    2.1 引言
        2.1.1 GPU概述
        2.1.2 全基因组关联分析中的人群层化问题
        2.1.3 主成分分析在检测人群层化中的应用
        2.1.4 主成分分析(PCA)的主要步骤
        2.1.5 现有的检测人群层化的软件
        2.1.6 开发SHEsisPCA的必要性
    2.2 方法
        2.2.1 基于GPU的主成分分析软件的开发
        2.2.2 基于X-means的聚类分析软件的开发
        2.2.3 研究中使用的数据
    2.3 结果
        2.3.1 SHEsisPCA的精度
        2.3.2 SHEsisPCA的速度
        2.3.3 使用SHEsisPCA分析人群结构
        2.3.4 使用SHEsisPCA得到匹配的病例和对照样本
    2.4 讨论
3 多倍体多等位基因物种关联分析平台SHESISPLUS的构建
    3.1 引言
        3.1.1 SHEsis在线平台
        3.1.2 开发SHEsisPlus的必要性
        3.1.3 SHEsisPlus的功能亮点
    3.2 SHESISPLUS的算法实现
        3.2.1 多倍体物种的单倍型推断算法
        3.2.2 基于熵的基因相互作用分析算法
        3.2.3 单位点关联分析
        3.2.4 哈迪-温伯格平衡检验
        3.2.5 连锁不平衡分析
    3.3 SHESISPLUS算法的评估
        3.3.1 单倍型推断算法评估
        3.3.2 基因相互作用分析算法评估
    3.4 SHESISPLUS在线分析平台的构建
        3.4.1 核心主程序的实现
        3.4.2 客户端(网页界面)的实现
        3.4.3 服务器端实现
    3.5 SHESISPLUS的应用:血清尿酸水平与遗传变异的关联分析
        3.5.1 样本来源及样本信息收集
        3.5.2 SNP的选择及基因分型
        3.5.3 统计学分析
        3.5.4 结果
    3.6 讨论
4 前列腺癌的全基因组基因相互作用的跨种族研究
    4.1 引言
        4.1.1 前列腺癌概述
        4.1.2 前列腺癌的遗传学研究现状
        4.1.3 开展前列腺癌的全基因组基因相互作用的跨种族研究的必要性
    4.2 材料与方法
        4.2.1 数据来源
        4.2.2 基因型推断
        4.2.3 全基因组数据的质量控制
        4.2.4 样本的人群结构分析
        4.2.5 基因相互作用分析
        4.2.6 Meta分析
        4.2.7 SNP位点的功能注释
        4.2.8 药物靶标富集分析
        4.2.9 数据处理流程
    4.3 结果
        4.3.1 基因相互作用分析结果
        4.3.2 上游分析
        4.3.3 表达数量性状位点分析以及调控元件搜索
        4.3.4 药物靶标富集分析
    4.4 讨论
5 一种新的胎儿染色体三体无创产前诊断方法
    5.1 引言
        5.1.1 21-三体综合征
        5.1.2 其他染色体非整倍性疾病
        5.1.3 无创产前诊断概述
        5.1.4 现有的染色体非整倍性疾病的无创诊断方法
        5.1.5 Ion Torrent PGM测序仪简介
        5.1.6 开发基于Ion Torrent PGM的无创产前诊断的分析策略的必要性
    5.2 材料与方法
        5.2.1 样本采集
        5.2.2 样品处理及DNA抽提
        5.2.3 使用Ion Torrent PGM测序仪对细胞游离DNA进行测序
        5.2.4 数据处理主要流程
        5.2.5 数据的质量控制
        5.2.6 统计学分析
        5.2.7 检测13-三体综合征和18-三体综合征时的GC含量矫正
        5.2.8 确定染色体区域的划分数目
    5.3 结果
        5.3.1 测序质量
        5.3.2 胎儿的13/18/21-三体综合征的检测结果
    5.4 讨论
总结与展望
参考文献
附录
致谢
攻读博士期间已发表或录用的论文

四、基因组多态性、单核苷酸多态性和“国际人类基因组单倍型图谱计划”(论文参考文献)

  • [1]TNF,GRN和ERAP1基因多态性与强直性脊柱炎的关联性研究[D]. 胡乃文. 山东大学, 2020(04)
  • [2]新疆地区变应性鼻炎吸入变应原谱及相关拷贝数变异分析[D]. 王燕. 新疆医科大学, 2020(03)
  • [3]胃癌危险因素的定量评估及发病风险预测模型构建[D]. 段富交. 郑州大学, 2020(02)
  • [4]20个微单倍型遗传标记的法医学应用研究[D]. 阿丽耶·库热什. 新疆医科大学, 2020(07)
  • [5]人体微量营养素缺乏风险关联SNP高通量微流体芯片方法研究与初步应用[D]. 张春红. 中国疾病预防控制中心, 2019(10)
  • [6]非洲栽培稻与亚洲栽培稻中非生物胁迫抗性基因的功能性核苷酸多态性[D]. 席锟. 华中农业大学, 2019(02)
  • [7]Y染色体遗传标记在法医学中的应用研究[D]. 宣金锋. 中国医科大学, 2019(01)
  • [8]GWAS定位水稻成熟种子组培力相关基因及功能分析[D]. 张昭阳. 华中农业大学, 2018(01)
  • [9]精神神经内分泌相关障碍的高通量遗传学研究[D]. 陈剑华. 上海交通大学, 2018(01)
  • [10]复杂疾病致病机制研究中数据分析算法的开发与应用[D]. 沈佳薇. 上海交通大学, 2016(03)

标签:;  ;  ;  ;  ;  

基因组多态性、单核苷酸多态性和国际人类基因组单倍型作图计划
下载Doc文档

猜你喜欢