选择读取深度

在规划您的库组测序实验时,您需要考虑适合您的样本的读取深度。测序深度/覆盖率受读取长度、测序平台以及您使用的是单端还是双端测序的影响。

覆盖率越高越好,但测序覆盖率越高,成本也越高。此外,合并样本会降低每个样本的覆盖率,但会降低总体成本。本页将帮助您确定最适合您项目的读取深度测序策略。

有关新一代测序 (NGS) 工作流程的更多背景信息,请参阅我们的NGS 概述文章

双端与单端

对于免疫组库应用,我们建议使用双端测序。在双端测序中,片段从两端进行测序,通常循环长度相等。例如,如果使用 500 循环试剂盒,则每个样本将从读取一处读取 250 个循环,然后从读取二处读取 250 个循环。

双端读取有助于序列组装和错误校正。此信息可用于扩展测序读取以覆盖整个 CDR3 区域,并可靠地识别 V 和 J 种系片段。我们还使用双端信息来验证 CDR3 片段是否真实。

当产物长度超过读取两个方向所需的循环数时,可能需要单端测序。虽然使用iRepertoire 引物系统生成的文库与 Illumina 双端测序兼容,但某些项目(例如定制噬菌体展示)可能需要单端测序。您也可以选择对库进行单端测序,以降低测序成本、将更多样本汇集到流动槽中或两者结合。有关哪些 Illumina 平台可以执行 SER 和/或 PER 的详细信息,请参阅我们的测序页面

覆盖率和阅读量估算

我们建议您规划实验,以便为每个细胞获取 5-10 个读数,这样理论上每个细胞都会根据泊松模型进行测序。例如,如果您的样本包含约 500,000 个 T 细胞,我们建议您为该样本分配约 250 万个读数。

为了计算估计读取输出 (ERO),将过滤后估计的测序读取的平均数量除以合并的样本数量 (S)。  

 Illumina NextSeq 中通量通道:1 x 10^8 / S = ERO

 Illumina MiSeq V2-500 循环流动槽:1 x 10^6 / S = ERO

例如,Illumina NextSeq 中通量通道汇集了 40 个样本,每个样本的 ERO 为 250 万个读数。由于测序运行参数的变化超出操作员的控制范围,估计值可能高于或低于实际输出。

读取长度

iRepertoire 的不同扩增系统旨在产生 100/150 或 250 bp 的双端读取 (PER),所有系统均覆盖 CDR3 区域。虽然长读取引物覆盖更多的 B 细胞受体或 T 细胞受体转录本,但短读取系统可能适用于某些应用,并且通常更具成本效益。

如果对 V 基因的使用感兴趣,我们的软件通常可以使用长读和短读格式调用 V 基因;但是,使用长读格式可以提高对密切相关的 V 等位基因调用的准确性。对于希望重建具有紧密结合特异性的受体的研究人员来说,拥有近乎完整的 V 区(由长读提供)将是有利的。

有关我们的特定扩增选项的更多信息,请参阅我们的引物系统页面

独特的 CDR3 发现

如果您的目标是发现独特的 CDR3,那么除了读取深度之外,还有其他重要因素需要考虑,即反应化学的耗竭。测序深度很重要,但 RNA 输入和酶活性是上游的限制因素。一旦考虑到这些因素,测序深度就可以改善发现。对于发现独特的 CDR3,按重要性列出的五个主要因素是 1) 样本来源;2) RNA 质量 3) RNA 浓度;4) 反应大小;5) 测序深度。

如果样本或 RNA 源的序列有限,则无需进行深度测序。例如,如果你有一个杂交瘤样本,你可能有 200 万个细胞,但它们都是同一个克隆——在这种情况下,无需进行深度测序。

如果目标是发现独特的 CDR3,并且独特细胞的输入数量很高,则建议将反应体积加倍,从而将 RNA 输入量加倍。具体来说,对于 FFPE,从 1 卷 FFPE 样本中通常只能发现几千个 (~5k) uCDR3。为了能够发现稀有克隆,我们建议每个 FFPE 样本读取 500K 到 100 万个。