病毒宏基因组的分析流程与一般宏基因组数据分析流程相似,包括原始数据的预处理、基因组装、功能分类和基因预测等。但病毒序列存在高变异性。测序序列中也可能存在原病毒的序列,原病毒以溶原态存在于宿主染色体内,这将会影响病毒基因组与宿主的分离[15].
对于发现新病毒可以将单个序列和contigs在blastn的nr数据库中比对,如果比对结果无法判断出是何种序列,则在blastx的nr数据库中比对,比对的E值如果大于e-5则被认为是目前无法确定的生物的基因序列。如果比对的结果小于e-5又与其最近的那一条的相似性较低,则可能是我们需要关注的目标[3].
2、病毒宏基因组学方法的优势和局限
2.1优势
传统方法只能以已知病毒为目标,难以发现新病毒,而病毒宏基因组学方法结合新一代测序技术和随机PCR1的病毒;研究的病毒直接从环境中获取,不需要分离培养;可以对环境中过于分散、丰度低的病毒进行系统分析和鉴定。
2.2局限
应用病毒宏基因组学方法进行研究,依然存在一些问题需要进一步探索,如从大量环境中提取样本方式,随机扩增方法和引物的选择能否做到无偏差覆盖所有病毒,海量测序数据的处理,依赖样品复杂度的生物信息分析等。
3、病毒宏基因组学的应用
病毒宏基因组学以其显着的优势在病毒研究的各个方面得到广泛应用,如人类、动植物健康,水、环境问题、病毒领域的研究等等。改变着人们对病毒的认识,给涉及病毒的许多问题提供新的`解决思路。
3.1临床应用
2008年[16]病毒宏基因组学在人体临床检查中第一次应用,结合深度测序检测器官移植相关的致死疾病的病原体。利用病毒宏基因组学对人体的唾液、呼吸道、血液、排泄物的检测分析,可以发现未知和潜在的致病病毒。
Law等[17]对一些肝病患者的血浆进行研究,发现病毒宏基因组学方法快速准确,还能将检测范围扩大到其它体液。
单同领[18]根据病毒宏基因组学的方法分析了儿童和猪肠道病毒群落,并且确定了致病原的信息。
Zhang等[19]应用宏基因组学在人的粪便中发现了大量的植物病毒。
Willner等[20]应用宏基因组学分析了健康和呼吸道感染的人的呼吸道分泌物中的DNA病毒群落。
2010年[21]在没有先验信息的条件下,应用病毒宏基因组学获得了流感病毒的全部基因。研究者还通过监测特定区域内已知传染人、动植物病毒的昆虫媒介携带的病毒[22],来检测相关病毒的流行和预防,为突发病原体的鉴定提供方向。蝙蝠作为很多人兽共患病(例如埃博拉病毒、严重急性呼吸系统综合征(SARS)病毒和尼帕病毒)的自然传播宿主,故蝙蝠体内的病毒多样性成为学者研究的热点。
2010年,Li等[23]和Donaldson等[24]应用病毒宏基因组学的方法分别研究了北美蝙蝠粪便中的病毒群落。发现了大量新的哺乳动物病毒、昆虫病毒和植物病毒,Donaldson还发现了一株新的冠状病毒。
2013年,杨凡力等[25]应用病毒宏基因组学的方法研究吉林、云南、湖南采集的蝙蝠组1小双节RNA病毒、圆环病毒等新病毒。
2000年用病毒宏基因组学方法对埃博拉病毒进行了鉴定[26].
3.2环境问题
病毒能够抵抗很多常规水处理系统在水中顽固存留,利用病毒宏基因组学快速检测水环境中的病原体,得到的宏基因组数据可以作为排泄物污染的指标,以此检测水质量。
Rosario等[27]应用宏基因组学在废水处理厂的污水中发现了大量的来自动植物和人的致病性病毒,从而认为污水可能是病毒传播的一种途径。
3.3病毒研究
目前科学家正在发展功能病毒宏基因组学,来发掘新病毒的功能酶[28],用于诊断和生物科学研究。利用病毒宏基因组学可以开发不同环境中的各种病毒如海洋、温泉、岩石层、地下和高温环境等,为研究病毒学的分类和进化提供方法。
通过对环境病毒宏基因组学的研究,可以了解环境中病毒的有机构成、进化关系,进而掌握病毒的分布、变化动态和进化情况,追踪一些病原体的原始自然宿主,以便及时防控和预测一些常发和新发病毒病,还可以通过改变病变环境中的微生物群落来对抗病理性群落,从而达到改善病情甚至是治疗的效果[29].