选择读取深度 – 方域生物

在规划您的库组测序实验时，您需要考虑适合您的样本的读取深度。测序深度/覆盖率受读取长度、测序平台以及您使用的是单端还是双端测序的影响。

覆盖率越高越好，但测序覆盖率越高，成本也越高。此外，合并样本会降低每个样本的覆盖率，但会降低总体成本。本页将帮助您确定最适合您项目的读取深度测序策略。

有关新一代测序 (NGS) 工作流程的更多背景信息，请参阅我们的NGS 概述文章

双端与单端

对于免疫组库应用，我们建议使用双端测序。在双端测序中，片段从两端进行测序，通常循环长度相等。例如，如果使用 500 循环试剂盒，则每个样本将从读取一处读取 250 个循环，然后从读取二处读取 250 个循环。

双端读取有助于序列组装和错误校正。此信息可用于扩展测序读取以覆盖整个 CDR3 区域，并可靠地识别 V 和 J 种系片段。我们还使用双端信息来验证 CDR3 片段是否真实。

当产物长度超过读取两个方向所需的循环数时，可能需要单端测序。虽然使用iRepertoire 引物系统生成的文库与 Illumina 双端测序兼容，但某些项目（例如定制噬菌体展示）可能需要单端测序。您也可以选择对库进行单端测序，以降低测序成本、将更多样本汇集到流动槽中或两者结合。有关哪些 Illumina 平台可以执行 SER 和/或 PER 的详细信息，请参阅我们的测序页面。

覆盖率和阅读量估算

我们建议您规划实验，以便为每个细胞获取 5-10 个读数，这样理论上每个细胞都会根据泊松模型进行测序。例如，如果您的样本包含约 500,000 个 T 细胞，我们建议您为该样本分配约 250 万个读数。

为了计算估计读取输出 (ERO)，将过滤后估计的测序读取的平均数量除以合并的样本数量 (S)。  

Illumina NextSeq 中通量通道：1 x 10^8 / S = ERO

 Illumina MiSeq V2-500 循环流动槽：1 x 10^6 / S = ERO

例如，Illumina NextSeq 中通量通道汇集了 40 个样本，每个样本的 ERO 为 250 万个读数。由于测序运行参数的变化超出操作员的控制范围，估计值可能高于或低于实际输出。

读取长度

iRepertoire 的不同扩增系统旨在产生 100/150 或 250 bp 的双端读取 (PER)，所有系统均覆盖 CDR3 区域。虽然长读取引物覆盖更多的 B 细胞受体或 T 细胞受体转录本，但短读取系统可能适用于某些应用，并且通常更具成本效益。

如果对 V 基因的使用感兴趣，我们的软件通常可以使用长读和短读格式调用 V 基因；但是，使用长读格式可以提高对密切相关的 V 等位基因调用的准确性。对于希望重建具有紧密结合特异性的受体的研究人员来说，拥有近乎完整的 V 区（由长读提供）将是有利的。

有关我们的特定扩增选项的更多信息，请参阅我们的引物系统页面。

独特的 CDR3 发现

如果您的目标是发现独特的 CDR3，那么除了读取深度之外，还有其他重要因素需要考虑，即反应化学的耗竭。测序深度很重要，但 RNA 输入和酶活性是上游的限制因素。一旦考虑到这些因素，测序深度就可以改善发现。对于发现独特的 CDR3，按重要性列出的五个主要因素是 1) 样本来源；2) RNA 质量 3) RNA 浓度；4) 反应大小；5) 测序深度。

如果样本或 RNA 源的序列有限，则无需进行深度测序。例如，如果你有一个杂交瘤样本，你可能有 200 万个细胞，但它们都是同一个克隆——在这种情况下，无需进行深度测序。

如果目标是发现独特的 CDR3，并且独特细胞的输入数量很高，则建议将反应体积加倍，从而将 RNA 输入量加倍。具体来说，对于 FFPE，从 1 卷 FFPE 样本中通常只能发现几千个 (~5k) uCDR3。为了能够发现稀有克隆，我们建议每个 FFPE 样本读取 500K 到 100 万个。

双端与单端

覆盖率和阅读量估算

读取长度

独特的 CDR3 发现

相关文章

样本提交指南

血液采集和样本注意事项

细胞分选指南