基因测序领域硝烟再起。2022年被称为“大动荡的一年”[1],一波新的竞争者鱼跃入市,向行业领导者Illumina(美国加利福尼亚州圣地亚哥)发起冲击。由Illumina和新入市竞争者研发的新系统正准备降低基因组测序成本,使其逼近人们口中常提到的每个基因组100美元的目标。测序成本的降低是个大新闻,因为在过去几十年中,测序成本的大幅降低推动了基因组学革命,而在最近几年,其降低幅度便停滞不前(图1)。更低的成本将使更多的用户以及与生物学、生物技术和医学等领域有关的应用能够负担得起测序费用。

《图1》

图1 过去20年中,基因测序成本急剧下降,尤其是在2005年前后,大规模平行“下一代”测序技术被商业化之后。从2006年到2015年,每个基因组的测序成本从1000万美元下降到1000美元左右。在不到十年的时间里减少了一万倍——速度远超摩尔定律(摩尔定律假定计算机芯片密度约每两年翻一番)。然而,测序成本逐渐稳定在每个基因组500~600美元,且近年来成本的下降趋势明显放缓。资料来源:美国国家人类基因组研究所(公共领域)。

基因测序被用于确定组成DNA分子的四个核酸碱基(腺嘌呤、胸腺嘧啶、胞嘧啶和鸟嘌呤)的序列。这些序列是了解众多生物现象的关键,其涵盖范围可从遗传性疾病到其进化起源,再到病毒大流行,这也使基因测序成为生物学、生物技术和医学等领域不可或缺的工具[2]。20世纪80年代末,第一代自动基因测序仪问世。20世纪90年代至21世纪初,第一代测序仪在人类基因组计划和美国国家人类基因组研究所基因组技术计划等措施的刺激下经历了迅速改进[3]。

2005年前后,随着大规模平行或“下一代”基因测序(NGS)技术的出现,基因测序技术飞跃至新的高度。第一代测序仪(也被称为Sanger测序仪)一次最多只能读取几百个短DNA片段,而NGS平台则可同时进行数十亿个片段的测序工作,吞吐量实现飞跃[4]。Sanger测序仪历经数年才勾勒出人类基因组初稿;如今现代NGS机器可在一天内完成对整个人类基因组的测序[5]。

虽然各大厂商采用的具体技术不同,但Illumina和大多数其他NGS厂商均使用了某种版本的短读边合成边测序技术[4]。在该测序过程中,从生物源(如血样)中提取到的长DNA链被切成无数个小片段(通常每个片段含有150个到几百个碱基),这些片段会被固定在一个基质(塑料珠粒或玻璃载玻片)上,然后被拷贝(扩增),形成许多相同片段的基因簇。这些聚集的基因片段可作为模板,用于合成新的互补的DNA链。在酶和化学试剂的帮助下,逐一加入碱基,同时通过各种方法来对碱基的加入情况进行检测。用荧光标签来标记碱基是一种常见的方法,当碱基被加入时荧光标签便会发光。一台相机会对荧光信号进行记录,然后通过软件分析推断出序列,同时将这些片段重新组合成一个完整的基因组。所有这些均为批量完成。数十亿个由多个基因组组成的片段会被装入反应容器(称为流动池)并进行批量处理,通过规模操作来降低成本。

2005年,454 Life Sciences公司(已停业)推出第一台被广泛使用的商用NGS测序仪[6]。其他公司,如Solexa,也迅速推出了自己的NGS测序平台。2007年,Illumina进入测序市场,并耗资6.5亿美元收购了Solexa [7],Solexa的创新技术后来成为Illumina测序平台的核心技术[8]。经过Illumina数年的完善和改进,该技术的使用变得更为快速、便宜且更容易。在激烈的竞争中,Illumina击败了其他一众供应商,其中包括454 Life Sciences、Life Technologies(美国加利福尼亚州卡尔斯巴德)、Ion Torrent(现在属于Thermo Fisher Scientific,位于美国马萨诸塞州沃尔瑟姆)以及Complete Genomics(美国加利福尼亚州圣何塞),测序成本也从2006年的每个人类基因组1000万美元骤降至2015年的1000美元左右(图1)[3,910]。到2015年前后,Illumina便主导了测序仪市场,其市场份额曾一度超过90% [11]。大约在同一时间,测序成本在经过十年的惊人进步后开始趋于平稳,近年来每个人类基因组的测序成本一直维持在500~600美元左右。

值得注意的是,这个数字仅指测序仪的操作成本——仅仅包含测序过程中所消耗的化学试剂的费用,并不包括测序的许多其他费用,如机器的购置、测序前DNA样本的制备、测序仪产生的数据的计算分析以及结果的临床解释。最后阶段,即临床解释环节,往往是最昂贵的部分,因为在该环节人类专家会试图进行基因解密,例如,解释基因变异的医学意义[1,9]。同样重要的是,人们通常所指的每基因组成本是建立在最优高通量的基础之上,这需要大型的测序仪进行满负荷运行,并一次对几十个基因组进行处理。使用较小的测序仪或通过大型测序仪的部分运行对较小的批次进行测序,成本往往会高出很多。

尽管如此,每基因组的成本依旧提供了一个基准,方便在类似条件下对测序仪的发展以及比较进行衡量。但问题是,长期以来这一基准一直保持不变,这已成为该行业的一个问题。对于许多潜在的应用来说,测序费用依旧过于昂贵,尤其是对于预算不高或低于工业规模要求的用户。例如,通过对某位患者的基因组进行测序以诊断遗传疾病;小基因组测序(例如,对诸如SARS-CoV-2的病毒进行测序,该病毒约含有3万个碱基,而人类基因组有30亿个碱基);小规模实验室以及设施的测序工作。实验室诊断咨询公司BaseX Scientific(美国北卡罗来纳州教堂山)的创始人Brian Krueger表示:“目前针对较小规模且费用更低的测序需求大量存在,但这种需求一直被压抑。”他曾在杜克大学(美国北卡罗来纳州达勒姆)、哥伦比亚大学(美国纽约)和生命科学公司Labcorp(美国北卡罗来纳州伯灵顿)建立并管理大型测序中心,他表示:“目前的测序成本令许多潜在使用者望而却步。”

许多分析家认为成本降低速度的减缓归根结底是由于近几年来测序市场竞争的松懈。Illumina公司的NGS系统已经成为日常测序事实上的行业标准,世界上约90%的序列数据均由该平台产出,且销量占目前所有测序仪销量的约80% [1112]。剩余20%的销售额被较小规模的NGS供应商、“第三代”测序仪供应商以及少数第一代测序系统销售商所瓜分。所谓的“第三代”测序仪虽然可以提供一些应用所需的长读能力,但在成本和吞吐量方面根本无法与NGS系统竞争。

Illumina的一些专利目前已经过期或即将过期[1,12]。此外,2022年,Illumina与中国基因组学公司BGI集团(中国深圳)之间长达数年的专利侵权之争终于尘埃落定,而BGI子公司MGI科技有限公司(中国深圳)生产的测序仪也首次进入美国市场进行销售[13]。而近几年美国和欧洲的反垄断监管机构也叫停了Illumina的几项重要收购[12,1415]。

以上种种均为2022年的市场“动荡”奠定了基础。“在Illumina数年的近乎垄断之后,我们终于再次迎来了测序市场的竞争。”基因组学商业咨询公司SanDiegOmics(美国加利福尼亚州圣地亚哥)负责人、Illumina前产品经理Shawn Baker说道,“这对消费者来说是个好消息,他们将拥有更多的选择,获得更好的经济效益。”

2022年3月,测序初创公司Element Biosciences(美国加利福尼亚州圣地亚哥)推出了Aviti系统,这台紧凑型台式设备非常适合中端测序。据Element称,Aviti测序平台的单个基因组测序成本可媲美Illumina NovaSeq 6000高通量系统(即每基因组560美元),且它一次可只对三个基因组进行测量(而NovaSeq则需测量几十个基因组)[16]。最近,该公司宣布了Aviti系统的一个新功能,宣称全基因组测序的成本将进一步下降至200美元[17]。

2022年5月,Ultima Genomics(美国加利福尼亚州纽瓦克)——一家得到了6亿美元风险投资的初创公司——声称已经研发出新的技术,可实现市场期待已久的每基因组100美元的测试成本,一时风头无两[18]。与Illumina的旗舰平台NovaSeq系统一样,Ultima的UG 100平台同样以大批量测序为基础,但它对测序仪的结构进行了新的改造,用类似于那些用于电脑芯片制造的硅片取代了Illumina以及大多数竞争系统所采用的流动池。Ultima认为,像光盘一样旋转的硅片可以更有效地对试剂进行分配,提升成像率,从而大大减少材料利用,降低成本。

2022年8月,MGI开始在美国首次推出其DNBSEQ测序仪系列[19]。这些测序仪均通过Complete Genomics公司销售,该公司于2013年被BGI收购。该系列既有小型台式系统,又包含大型的测序仪,在吞吐量和单个基因组成本方面与Illumina的整个产品系列不相上下[20]。

2022年9月,Illumina发布了历年来对其产品线进行的最大革新:NovaSeq系列增加了新的高通量产品(图2)[21]。Illumina称,新的NovaSeq X和NovaSeq X Plus系统将于2023年投入商业使用,该举将为测序市场注入一系列创新技术,包括可使“速度最高提高两倍,精度最高提高三倍”的新试剂[9,2223],更快速、更高分辨率的光学器件[24]以及更密集的流动池。Illumina表示,该创新系列的测序结果在产量和成本方面都有很大的改进。该公司声称,高端NovaSeq X Plus系统每年可完成20 000个人类全基因组的测序工作,而每个基因组的测序成本可降至200美元[25]。相比之下,Illumina目前最顶级的NovaSeq 6000系统每年可以完成7500个基因组的测序工作,每个基因组的测序成本为560美元。新试剂的另一个优点是它们可在室温环境下运输,无需特别冷藏处理,这对发展中国家和异地客户来说无疑是个福音,因为过去这些地方缺乏可靠的冷链(温控供应链)支持,限制了测序工作的进行[26]。

《图2》

《图2》

图2 Illumina的NovaSeq系列产品是世界上大多数基因组中心高通量测序工程的主力设备。Illumina宣传其新NovaSeq X系列(a),于2022年发布,定于2023年下半年出厂,将标准进行了极大提高,可实现目前顶级NovaSeq 6000系统(b)2.5倍的吞吐量,同时每个基因组的测序成本也会降低一半以上。资料来源:Illumina, Inc.

专家提醒说,这些供应商的说法还有待实践考证。许多新产品还未上市;其他产品也才刚刚出厂。“他们是否能实现自己口中的成本目标我们不得而知,这需要客户拿到产品后进行实践验证。”生物技术公司Ginkgo Bioworks(美国马萨诸塞州波士顿)首席科学家Keith Robison表示。他在自己的博文“Omics!Omics!”中对测序行业进行了追踪。许多新产品的细节仍然模糊不清,其真实性也难被衡量,比如Ultima承诺的100美元的单个基因组测序成本[9,27]。至于Element宣称的200美元的单个基因组测序成本,Baker表示只有在小范围的中等通量的情况下才有可能实现,这可能也满足不了很多客户的需求。对另一个新进入者Singular Genomics(美国加利福尼亚州拉霍亚),Baker也持有类似的怀疑。Singular Genomics在2021年年底宣布推出G4系统,但该设备直到近期才开始出厂。虽然Singular声称G4的速度(每次运行不到24小时)和灵活性将使中型实验室和测序中心中不断变化的单个样本组合变得更易处理,但“市场对这种灵活性的重视程度尚且不明”,Baker道。

虽然不确定性因素依旧存在,但有一点为市场公认,成本的降低将更有利于小型机构以及发展中国家使用测序技术,而且重要的是,测序技术能够被一系列有前景的应用更为广泛地使用[28],这些应用包括:

• 无创产前基因检测:对母体血液中的胎儿DNA进行测序,确定基因异常,确保受影响的新生儿得到及时治疗[9];

• 癌症诊断与监测(使用一种名为“液体活检”的技术):肿瘤和其他恶性肿瘤拥有特征性的遗传标记,这些标记会在血液中循环,可被测序捕捉,实现早期癌症检测,改善对治疗影响的监测[1,29];

• 更广泛的人群研究:更低成本的测序将会促进更大基因组数据库的建立,为人类的遗传多样性、进化和疾病提供新的洞察[18];

• 个性化医疗:个人常规基因测序将帮助医生和遗传咨询师根据每个人的独特基因特征定制医疗保健计划[18];

• 基因组监测:测序可用于监测生物群落和微生物组中新出现的病原体、新的基因变体等变化的生态系统、食品供应、废水等环境因素 [30]。