GWAS全基因组关联分析第三期:关联分析_abio生物试剂品牌网

abiopp8个月前未命名76

经过前面两期的讲解,我们了解了GWAS分析需要的数据类型和数据质控方法,终于来到我们的核心内容:关联分析。

GWAS分析一般会构建回归模型检验标记与表型之间是否存在关联,其中:
① 零假设(H0 null hypothesis)是标记的回归系数为零, 标记(即SNP)对表型没有影响。
② 备择假设(H1,Alternative Hypothesis)是标记的回归系数不为零,标记(即SNP)和表型相关。

在第一期中我们提到表型数据的类型包括三种:数量性状、质量性状和分级性状,我们在进行关联分析之前,需要根据不同类型的表型选择合适的关联分析方法,同时为了减少假阳性,通常对p值进行矫正。


1 连续性状 

连续性状是指那些在群体中呈现连续分布的性状,如身高、体重、血等。可以选择的方法有T检验(Student’s test)和线性回归(linear regression)。

--assoc,卡方检验+优势比,表型若为数字则视为字符,不允许有协变量;
--linear,线性回归,表型为纯数字,允许有协变量,如果考虑协变量,加上--covar即可。

# assoc关联分析不校正/校正p值
plink --bfile test --assoc --out result_assoc
plink --bfile test --assoc --adjust --out result_assoc
注意:会多出一个*.assoc.adjusted后缀文件。

# linear关联分析不考虑协变量、不校正/校正p值
plink --bfile test --linear --out result_linear
plink --bfile test --linear --adjust --out result_linear
注:协变量使用 --covar 参数添加。


2 阈值性状 

阈值性状即表型值数据是两类数据:1和2(其中0和-9都表示缺失),比较常见的是对照组(用1表示)和实验组(用2表示)。可以选择的方法有卡方检验和逻辑斯蒂回归(X2关联分析和logistic分析)

--assoc,卡方检验+优势比,不允许有协变量;
--logistic,逻辑回归,允许有协变量,如果考虑协变量,加上--covar即可。
注:这里的协变量比如性别、年龄等信息。

# assoc关联分析不校正/校正p值
plink --bfile test --assoc --out result_assoc
plink --bfile test --assoc --adjust --out result_assoc
注意:会多出一个*.assoc.adjusted后缀文件。

# logistic关联分析不考虑协变量、不校正/校正p值
plink --bfile test --logistic --out result_logistic
plink --bfile test --logistic --adjust --out result_logistic
注:协变量使用 --covar 参数添加。


3 分级性状 

我们将通过人为观察而可以进行分类的离散型变量统称为分级性状。但要注意一点,分级性状最终的定义,还是部分依赖于我们的经验。 例如,对于植物的抗病性,我们既可以按照叶片病斑的面积(0~100%),将其定义为连续型的数值型性状,也可以人为设定阈值将其定义为分级性状(高、中、低)。可以选择的方法有卡方检验和逻辑斯蒂回归(X2关联分析和logistic分析)。

--assoc,卡方检验+优势比,不允许有协变量;
--logistic,逻辑回归,允许有协变量,如果考虑协变量,加上--covar即可。

# assoc关联分析不校正/校正p值
plink --bfile test --assoc --out result
plink --bfile test --assoc --adjust --out result_adjust

# logistic关联分析不考虑协变量、不校正/校正p值
plink --bfile test --logistic --out result_logistic
plink --bfile test --logistic --adjust --out result_logistic
注:协变量使用 --covar 参数添加。

到这一步我们终于得到了梦寐以求的显著性结果,可以对结果表格进行pvalue筛选过滤假阳性,也可以进行可视化直观展示(即鼎鼎大名的Q-Q plot和Manhattan图),那如何进行可视化呢?别急,我们留到下一期。

{"weibo":"1","wechat":"1","qq":"1","qzone":"1","douban":"1","linkedin":"1","diandian":"1","facebook":"1","twitter":"1","google":"1"}

相关文章

解析乳酸化修饰作为肿瘤研究新靶点的关键机制与治疗潜力_abio生物试剂品牌网

解析乳酸化修饰作为肿瘤研究新靶点的关键机制与治疗潜力_abio生物试剂品牌网

在肿瘤研究领域,一项曾经被视为“代谢废物”的物质——乳酸,正以全新的角色登上科学舞台。随着蛋白质组学技术的突破,乳酸衍生的赖氨酸乳酸化(Kla)修饰成为连接代谢重编程与肿瘤发展的关键纽带。近期,《Na...

Dragonfly三维成像揭开骨骼矿物层状镶嵌结构之谜_abio生物试剂品牌网

Dragonfly三维成像揭开骨骼矿物层状镶嵌结构之谜_abio生物试剂品牌网

加拿大Dragonfly软件如何助力科学家首次捕获Hyp小鼠骨骼的“矿物镶嵌艺术” 文献索引 Buss, D. J., Reznikov, N., & McKee, M. D. (2020)...

犬红细胞单克隆抗体基础特性、制备流程与应用领域_abio生物试剂品牌网

犬红细胞单克隆抗体基础特性、制备流程与应用领域_abio生物试剂品牌网

犬红细胞单克隆抗体(Canine Red Blood Cell Monoclonal Antibody,cRBC-McAb)是针对犬红细胞(canine Red Blood Cell,cRBC)表面特...

犬冠状病毒单克隆抗体靶向抗原、制备技术、特异性优化及应用场景_abio生物试剂品牌网

犬冠状病毒单克隆抗体靶向抗原、制备技术、特异性优化及应用场景_abio生物试剂品牌网

犬冠状病毒(Canine Coronavirus, CCV)单克隆抗体(Monoclonal Antibodies, mAbs)在病毒检测、致病机制研究及防控技术开发中具有重要价值。以下从抗体靶向抗原...

高分辨率微电极阵列系统(HD-MEA)一次性捕捉海马多种神经元的电信号_abio生物试剂品牌网

高分辨率微电极阵列系统(HD-MEA)一次性捕捉海马多种神经元的电信号_abio生物试剂品牌网

HD-MEA记录海马脑片 海马是学习记忆、情绪调控的重要脑区,其内部不同脑区(CA1、CA3、DG)和各类神经元(锥体细胞、抑制性中间神经元等)协同工作,形成复杂的环路。迄今已通过形态、分子标志和电生...

伴放线放线杆菌检测中核酸探针杂交技术的应用研究_abio生物试剂品牌网

伴放线放线杆菌检测中核酸探针杂交技术的应用研究_abio生物试剂品牌网

摘要 核酸探针杂交技术,建立了一种快速、高灵敏度的伴放线放线杆菌(Actinobacillus actinomycetemcomitans,Aa)检测方法。通过设计特异性探针,优化杂交条件,结合威...