全基因组从头测序(Whole Genome de novo Sequencing ),是指对基因组序列未知或无近缘物种基因组信息的某个物种,构建不同插入片段的基因组DNA文库并对文库进行序列测定,然后利用生物信息学方法进行拼接、组装和注释,从而获得该细菌的全基因组序列图谱。洪祥提供基因组框架图测序,采用小片段建库,Illumina深度测序和初步的基因组组装策略,性价比高,满足微生物基因组研究基本需求。
技术流程
分析内容
序号 | 分析项目 | 类别 | 备注 |
1 | 数据整理 | A | |
2 | 数据质控 | A | |
3 | 高质量数据获取 | A | |
4 | 基因组序列拼接与分析 | A | |
5 | 蛋白编码基因预测 | A | |
6 | 非编码RNA预测 | A | |
7 | 其他非编码RNA预测 | A | |
8 | CRISPRs 预测 | A | |
9 | 蛋白编码基因的序列比对 | A | |
10 | 蛋白编码基因的GO注释 | A | |
11 | 蛋白编码基因的eggNOG注释 | A | |
12 | 蛋白编码基因的KEGG注释 | A | |
13 | 蛋白编码基因的Swiss-Prot注释 | A | |
14 | 原噬菌体预测 | B | |
15 | 基因岛预测 | B | |
16 | 致病菌毒力因子(VFDB)分析 | B | |
17 | 抗生素抗性(CARD)分析 | B | |
18 | 信号肽预测 | B | |
19 | 跨膜螺旋预测 | B | |
20 | 蛋白编码基因的Pfam 注释 | B | |
21 | 蛋白编码基因的CDD 注释 | B | |
22 | 蛋白编码基因的InterProscan 注释 | B | |
23 | 基因组ANI比较分析 | B | 参考基因组数据≥1 |
24 | 泛基因组分析 | B | 参考基因组数据≥10 |
25 | 基因家族分析 | B | 参考基因组数据≥1 |
26 | 基于 16s rDNA 的系统发育树重构 | B | 参考基因组数据≥2 |
27 | 基于单拷贝基因的系统发育树重构 | B | 参考基因组数据≥2 |
28 | 基于 Mauve 的全基因组序列比对 | B | 参考基因组数据≥1 |
29 | 全基因组关联分析(GWAS) | B | 参考基因组数据≥60 |
30 | 基因组数据上传 | B | 提供相关数据 |
备注:不同项目具体分析内容不同
A:标准分析内容
B:高级分析内容
样本要求
1) 样品类型: DNA/菌体;
2) 样品需求量: 菌体样本≥5g,基因组DNA:≥2μg
3) 样品纯度: OD值260/280应在1.7-2.0
4) 样品浓度: ≥30ng/µL;
5) 样品包装: 用封口膜密封样品, DNA低温运输(-20°C)
应用领域
1.致病基因挖掘
挖掘与人类健康、畜牧业安全、植物保护、林业农业安全、生物除草相关病原菌的致病基因;
2.解读工业菌基因及机制
解读与酸奶发酵、能源利用、药物生产相关的工业菌中新菌株或优势菌株的功能基因及高产/环境适应机制;
3.探索进化、药用机制
探索物种进化机制(全基因组水平或线粒体和叶绿体水平)、古细菌的极端环境适应及进化理论、食用真菌的营养和药用机理。