北京时间 2 月 23 日消息,日前《自然》杂志最新列举 2022 年七项重要科学技术,将对科学领域产生重大影响,其中包括:
1、完整版基因组
2019 年,美国加州圣克鲁兹分校基因组学研究员凯伦?米加(Karen Miga)和马里兰州贝塞斯达国家人类基因组研究所研究员亚当?菲利普(Adam Phillippy)启动了“端粒至端粒(T2T)”的联合研究项目,当时大约全球十分之一的人类基因组仍未完成测序,然而,现在该数据已降至零。2021 年 5 月,该联合研究项目声称发现第一个端粒至端粒的人类基因组序列,使用人类共识基因组序列图谱 GRCh38 增加了近 2 亿新碱基对,并为人类基因组计划写上了最后一章。
最早发布于 2013 年的 GRCh38 基因组序列图谱是一个具有价值的研究工具,它是绘制基因序列读数的“脚手架”,但它也存在许多漏洞,其主要问题在于基因序列读数虽然精确,但过于简短,无法明确绘制高度重复的基因组序列,包括:覆盖染色体末端的端粒,细胞分裂期间协调新复制 DNA 分裂的着丝粒(centromeres)。
长读测序技术被证明是改变游戏规则的技术,该技术是美国太平洋生物科学公司和英国牛津纳米孔技术公司共同开发的,它能在一次性基因序列读取中,对数万至数十亿个碱基对进行排序,但至少在测序初期,并不是没有错误。
时值 2020 年,T2T 项目研究人员重建了他们的第 2、3 条单独染色体 ——X 和 8,然而,太平洋生物科学公司的测序工作已取得重大进展,T2T 科学家能检测到长时间重复序列的微小变化,这些微妙的“指纹”使长而重复的染色体片段变得更易处理,基因组剩余部分则很快排列起来,牛津纳米孔技术公司还捕获了许多调节基因表达的 DNA 修饰,同时,T2T 基因测序能在基因组范围内绘制“表观遗传标记”。
已测序的 T2T 基因组源自包含两组相同染色体的细胞株,正常的二倍体人类基因组的每个染色体有两个版本,目前研究人员正在研究“阶段策略”,能够自信地将每个序列分配给合适的染色体副本。
T2T 项目首席研究员之一、纽约洛克菲勒大学遗传学家埃里希?贾维斯(Erich Jarvis)说:“我们的目标是掌握平均 97% 的人类等位基因多样性,我认为未来 10 年之内,我们能将端粒至端粒基因组测序作为常规操作,同时,我们希望利用完整的基因组装配能力提供地球每种脊椎动物的完整基因组序列。”
2、解析蛋白质结构
此前研究人员很难衡量蛋白质结构功能,在过去两年时间里,科学实验和计算领域取得的进步,为研究人员以前所未有的速度和分辨率解析蛋白质结构。由 DeepMind 子公司 Alphabet 开发的 AlphaFold2 结构预测算法基于“深度学习”策略,能推算出氨基酸序列折叠蛋白质的结构。该算法自 2021 年 7 月发布以来,已被应用于蛋白质组学,用于确定人类和 20 个模型生物中表达的所有蛋白质结构,以及 Swiss-Prot 数据库中近 44 万个蛋白质结构,大幅增加了高可信度建模数据的蛋白质数量。
与此同时,低温电子显微镜的技术改进使研究人员能以实验方法解决最具挑战性的蛋白质和复合物,低温电子显微镜采用电子束扫描快速冻结的分子,生成多个方向的蛋白质图像,然后可以通过计算重新组装成一个蛋白质 3D 结构。
2020 年,低温电子显微镜硬件和软件的改进使研究团队能够生成分辨率小于 1.5 埃的水平解析蛋白质结构,捕捉到单个原子的位置。纽约结构生物学中心西蒙斯电子显微镜中心副主任布里奇特?卡拉格(Bridget Carragher)说:“此前我们曾深入讨论‘原子分辨率’这个术语,但它仅是接近原子,目前我们实验证实获得原子等级清晰度解析蛋白质结构是可行的。”
还有一种相关方法,即低温电子断层扫描(cryo-ET),它可以捕捉冷冻细胞薄片中自然蛋白质特征,但利用该技术解析复杂而拥挤的图像仍存在困难。卡拉格说:“采用机器学习世界的先进算法是必不可少的,相信未来我们能解决棘手的科学难题。”
3、量子模拟
原子在特定条件下,能被诱导至一个高度激发状态,直径达到 1 微米或者更大。目前物理学家现已证实,通过对数百个原子阵列进行这种可控激发,可以解决一些具有挑战性的物理问题,实现传统计算机“极限升级”。
量子计算机以量子位的形式管理数据,利用“量子纠缠”物理现象进行数据耦合,量子位可以在一定距离内相互影响,这些量子位可大幅提高计算能力。
目前,已有几个研究团队成功利用单个离子作为离子位,但这些离子的电荷很难在高密度下组装,物理学家正在探索另一种方法,其中包括法国国家科学研究中心的安东尼·布罗维(Antoine browwaeys)和美国哈佛大学的米哈伊尔?卢金(Mikhail Lukin),他们使用光学镊子精确地将不带电原子定位在紧密排列的 2D 和 3D 阵列中,然后应用激光将这些粒子成为大直径的“里德堡原子(Rydberg atoms)”,使其与它们邻近粒子纠缠在一起。
韩国高级科学技术研究所物理学家 jaaewook Ahn 称,里德堡原子系统是独立可控的,它们的相互作用可以打开和关闭,反之赋予了可编程性。量子模拟技术在短短几年时间里就获得了重大突破进展,技术进步提高了里德堡原子阵列的稳定性和性能,以及从几十个量子位快速扩展至几百个。
据悉,量子模拟领域的先驱者已成立了公司,正在开发实验室使用的里德堡原子阵列系统,布罗维估计这种先进量子模拟器可以在一两年内投入商业应用,但这项工作也可能为量子计算机的更广泛应用铺平道路,包括:经济学、物流和数字加密领域等。
4、精准基因操控
尽管 CRISPR–Cas9 技术拥有强大的基因组编辑能力,但该技术更容易基因失活,而不是达到基因修复,因为尽管针对 Cas9 酶的基因组序列相对精确,但细胞对该技术产生的双链切割修复却并不精确,CRISPR–Cas9 修复通过一种称为“非同源端连接”的过程进行,通常会被微小的基因插入或者删除所混淆。
美国哈佛大学化学生物学家大卫?刘指出,大多数遗传疾病需要的是基因修正,而不是基因破坏。目前他和研究同事现已开发两种颇有希望的基因操控方法,第一种叫做碱基编辑(base editing),将一种催化受损 Cas9 与一种酶结合,该酶可以帮助一种核苷酸转化为另一种核苷酸,例如:胞嘧啶转化为胸腺嘧啶,腺嘌呤转化为鸟嘌呤,但目前该方法仅对特定碱基对有效;
第二种叫做精准编辑(Prime editing),将 Cas9 与逆转录酶连接起来,并引导 DNA 将所需编辑内容精准插入基因组序列。通过一个多阶段的生化过程,这些成分将引导 RNA 复制成 DNA,最终取代目标基因组序列。重要的是,碱基编辑和精准编辑都仅剪切一条 DNA 链,这对细胞而言是一个更安全、破坏性更小的过程。
碱基编辑技术首次公布于 2016 年,现已投入临床应用,由大卫?刘创建的 Beam Therapeutics 公司已获美国食品药物管理局批准,首次应用于人类镰状细胞病基因修复。相比之下,精准编辑仍是一项新技术,但改进的迭代技术不断出现,该技术的应用前景也非常明确。
韩国首尔延世大学医学院基因组编辑专家 Hyongbum Henry Kim 现已证实,使用精准编辑技术来纠正老鼠视网膜基因突变,可达到 16% 的治愈率。他说:“如果我们使用最近报道的更先进技术,治疗效率将获得大幅提高,在某些情况下,如果能以 10%,甚至以 1% 的基因进行替换,就可以治愈该疾病。”
5、靶向基因治疗
基于核酸的药物可能会对临床治疗产生某些影响,但它们在可应用的组织方面仍受到限制,大多数治疗方法要么需要局部给药,要么需要体外操作,从患者体内提取细胞,然后将其移植到患者体内。
一个显著的例子是肝脏,可以过滤血液,被证明是选择性药物输送的有效靶点,在这种情况下,静脉注射,甚至是皮下注射,均可达到该效果。
美国麻省理工学院化学工程师丹尼尔?安德森(Daniel Anderson)说:“靶向基因治疗存在很大的挑战性,仅是将药物输送至人体任何组织进了困难的,我们的身体是基因信息集合体,而不是接受新的基因信息。”
目前研究人员在开发基因治疗方面正取得稳步进展,这些方案可以帮助引导药物进入特定器官系统,而不影响其他非靶向组织。
近年来,腺相关病毒是许多基因治疗工作的首选载体,相关动物研究表明,理性选择合适的病毒,结合组织特异性基因启动子,可以实现高效、器官靶向治疗。然而,相关病毒有时难以大规模生产,并潜在引起人体免疫反应,破坏疗效或者产生身体不良反应。
脂质纳米颗粒提供了一种非病毒的替代方法,之前研究人员发表的研究报告强调了脂质纳米颗粒具有组织特异性送递的潜力,例如:研究人员能快速生成和筛选识别脂质纳米颗粒,使其有效在肺等器官实现靶向治疗。
荷兰埃因霍温理工大学生物医学工程师罗伊?范德米尔(Roy van der Meel)称,目前首次研究表明,如果对这些脂质纳米颗粒进行系统筛选,并且改变它们的成分,就可以改变它们在生物体中的分布。
6、空间多组学分析
单细胞组学的迅速发展意味着研究人员可以常规地从单个细胞中获得遗传、转录、表观和蛋白质组学的见解,有时是同时获取,但是单细胞技术在将细胞从原生环境中剥离过程中,也失去了关键信息。
2016 年,瑞典皇家理工学院乔基姆·伦德伯格(Joakim Lundeberg)设计了一种策略克服了该问题,他和同事使用条形码寡核苷酸(RNA 或者 DNA 短链)制作载玻片,该载玻片能从完整的组织切片中捕获信使 RNA,这样每个转录 RNA 可以依据条形码被分配至样本中的特定位置,他说:“无人相信我们能从组织切片中提取全转录 RNA 分析,但事实证明,该策略非常简单。”
此后空间转录组学技术倍受科学家青睐,目前已有多个商业系统进行应用,包括:10x Genomics 公司推出的 Visium 空间基因表达平台,该平台系统基于伦德伯格的最新技术。随着学术团队不断开发创新的方法,将不断增加深度和空间分辨率来绘制基因表达。
现在研究人员正在空间地图领域进一步叠加“分层组学见解”,例如:美国耶鲁大学生物医学工程师 Rong Fan 开发了一个名为 DBiT-seq16 的平台,该平台采用一个微流体系统,可以同时为数千个 mRNA 转录基因和数百个蛋白质标注寡核苷酸标签抗体。
7、基于 CRISPR 技术的诊断
CRISPR–Cas 系统技术精确切割特定核酸序列的能力源于它作为细菌“免疫系统”对抗病毒感染的作用,这种关联性激发了早期采用该技术的科学家考虑它对病毒诊断的适用性。美国麻省理工学院布罗德研究所、哈佛大学剑桥分校遗传学家帕尔迪斯?萨贝提(Pardis Sabeti)说:“利用它们在自然界中设计的功能非常有意义,毕竟它们已演化了数十亿年。”
但并不是所有 Cas 酶都是一样的,Cas9 是基于 CRISPR 的基因组操作的首选酶,但基于 CRISPR 的诊断的大部分工作都使用了被称为 Cas13 的 RNA 靶向分子家族,该分子家族是 2016 年由分子生物学家张峰(音译)首次发现的。美国加州大学伯克利分校詹妮弗?杜德纳(Jennifer Doudna)解释称,Cas13 利用其 RNA 向导通过碱基对识别 RNA 靶标,并激活核糖核酸酶活性,该活性通过使用报告 RNA 作为诊断工作进行临床应用。
据悉,她与马克斯·普朗克病原体科学研究所艾曼纽?卡彭特(Emmanuelle Charpentier)因这项研究发现共同获得 2020 年诺贝尔化学奖。这是因为 Cas13 不仅会切割向导 RNA 靶向的 RNA,还会对附近任何其他 RNA 分子进行“旁系切割”。许多基于 Cas13 的诊断使用报告 RNA,使用荧光标记抑制荧光的淬灭分子,当 Cas13 识别病毒 RNA 后被激活时,它会切断报告 RNA,并从淬灭分子中释放荧光标记,产生可检测信号。
有些病毒留下足够强的信号,可以在不进行扩增的情况下进行检测,从而简化了即时诊断。例如:2021 年 1 月,美国加州旧金山格莱斯顿病毒学研究所演示了一种基于鼻拭子的 CRISPR-Cas13 快速检测方法,可以使用手机摄像头对新冠病毒进行无扩增检测。
同时,RNA 扩增可以提高对微量病毒序列的灵敏度,研究人员现已开发一种微流体系统,仅利用几微升样本中扩增出的基因物质,就能同时筛选多种病原体。现在科学家已掌握一种同时检测 21 种病毒的方法,而每个样本的成本不足 10 美元。此外,研究人员还开发出基于 CRISPR 技术的工具,可以同时检测 169 种以上的人类病毒。
杜德纳称,其他 Cas 酶可以充实诊断工具箱,包括 Cas12 蛋白,它表现出与 Cas13 相似的特性,但其目标是 DNA 而不是 RNA。总体而言,这些技术可以检测范围更广的病原体,甚至可以有效诊断其他非传染性疾病。