就这么牛气样本再少也能搞定癌症突变特征
继上次推出了肿瘤CNV分析思路指引(干货—肿瘤拷贝数变异这样分析才准确!),反响不错!所以小编深受鼓舞,拽着年的尾巴马不停蹄地再为您送上干货一车!此次推出肿瘤突变特征分析新方法,大样本量研究以及单样本分析皆可适用,细细看来~
大家都知道,癌症由体细胞突变引发,体细胞突变则是由不同生物学过程导致,可能是外源性诱因如吸烟、紫外线照射等,也可能是内源性诱因如APOBEC酶激活、DNA错配修复缺陷等,这些不同的突变过程形成了特定DNA突变模式,也即突变特征。比如,COSMIC数据库中共收集了与癌症发生相关的30种已知突变特征。通过分析突变特征可以揭示导致肿瘤发生的诱因,指导个性化医疗。
一般我们考虑突变位点上下游各1bp的碱基的三核苷酸序列,针对96种(4*6*4)突变类型对肿瘤样本进行突变特征分析。
经典古法—NMF非负矩阵分解
以往的突变特征分析是通过NMF非负矩阵分解算法[1,2],首先预分解确定最适的突变特征分解数目,将n个样本的96*n阶矩阵V分解形成特征矩阵W和加权矩阵H,分解出的突变特征与COSMIC数据库中已知的特征相比较,寻找相似的突变特征,然后利用数据库中的突变模式解释样本突变模式。但是,样本量和突变数量会影响突变特征分解的数目和准确性,如图1A,当50个WGS平均突变数量为,可准确分解成5个突变特征;而如图1B所示,当每个样本平均突变数量为96,要想同样分解成5个突变特征则需要至少个样本才可实现[2]!
图1A图表示50个WGS在不同突变数量条件下的突变特征分解情况;B图表示突变数量较少的情况下不同样本量的突变特征分解情况[2]
厉害了我的哥,要介么多样本?!然而,我的罕见癌种研究,病例有限,突变特征分析肿么办?
莫急,你要的诺禾都会给你!小编这就为您介绍可以针对小样本量或单个样本进行突变特征解析的神器—deconstructSigs[3]。
给力新法—deconstructSigs算法
该算法同时输入n个样本突变频率的96*n阶矩阵V,以及k种已知特征突变频率的96*k阶矩阵S,基于T和S的最小误差平方和SSE选取最能代表样本信息的突变特征,重构矩阵R,并依次进行迭代,直至前后两次迭代的SSE0.为止,最终得到每种突变特征的权重矩阵W。
图2A图单样本突变特征贡献图;B图为整体突变特征贡献图;C图为96种突变类型的频率[4]
那么,deconstructSigs分解特征准确性如何?数据来说话,看下图
图3deconstructSigs和NMF算法的突变特征一致性[3]
将NMF非负矩阵分解(WTSIframework)得到的突变特征作为deconstructSigs算法中的S矩阵,对同一批样本进行突变特征分析,从结果来看两种算法分解得到的突变特征权重高度一致。
OK!靠谱!再来看deconstructSigs如何用到实处显奇能:
用于肿瘤亚型比较:
多发性肺癌研究中[4],比较了2个cluster的突变特征,发现cluster1中分解出4个特征:signature1(年龄)、3(DNA双链断裂修复失败)、9(聚合酶η和AID活性)和12(unknown);而cluster2种几乎仅分解出signature9,说明2个cluster样本的癌症发生原因不同。
用于肿瘤进化分析:
食管鳞癌研究中[5],对主干突变和分支突变分别进行特征分解及主要特征的占比分析,发现与主干相比分支突变中signature1比例有降低趋势,而signature3,15比例升高,说明年龄相关特征主要肿瘤主克隆中发挥作用,DNA损伤相关特征在亚克隆中发挥作用。
此外,除了deconstructSigs算法,还有今年刚提出的另外一种算法供您选择—MutationalPatterns[6]。该软件与deconstructSigs功能类似,也可以进行多样本和单样本的突变特征分析,并给出每个样本已知突变特征的占比。与NMF和deconstructSigs不同的是,该软件还考虑了在基因组不同位置的突变,如CpG岛的CT突变、promoter区突变以及与甲基化的关系等,也可同时对DNA正链和负链的突变情况进行种(96*2)突变类型的特征分析。MutationalPatterns结果与deconstructSigs一致性也较高,运行速度更快。
以上就是关于肿瘤突变特征分析的三种算法:NMF非负矩阵分解、deconstructSigs以及MutationalPatterns算法。我们力求做到与时俱进,不断进行信息分析优化升级,以满足不同的研究需求。希望您有所收获,以更加自信的姿态迎接新年到来!
最后,小编谨代表诺禾全体员工祝您元旦快乐!
,文章多发!
参考文献
[1]AlexandrovLB,Nik-ZainalS,WedgeDC,etal.Signaturesofmutationalprocessesinhumancancer[J].Nature,,():-.
[2]AlexandrovLB,Nik-ZainalS,WedgeDC,etal.DecipheringSignaturesofMutationalProcessesOperativeinHumanCancer.CellReports.;3(1):-.
[3]RosenthalR,McgranahanN,HerreroJ,etal.DeconstructSigs:delineatingmutationalprocessesinsingletumorsdistinguishesDNArepairdeficienciesandpatternsofcarcinomaevolution[J].GenomeBiology,,17(1):31.
[4]MaP,FuY,CaiMC,etal.Simultaneousevolutionaryexpansionandconstraintofgenomicheterogeneityinmultifocallungcancer[J].NatureCommunications,,8(1):.
[5]HaoJJ,LinDC,DinhHQ,etal.Spatialintratumoralheterogeneityandtemporalclonalevolutioninesophagealsquamouscellcarcinoma.[J].NatureGenetics,,48(12):1.
[6]FBlokzijl,RJanssen,RVBoxtel,etal.MutationalPatterns:北京治疗白癜风的医院在哪白殿疯的原因
转载请注明:http://www.shijichaoguyj.com/wxjq/1628.html