继“LinearDesign”后又一重磅成果,斯微联合中国药科大学推出环状RNA结构预测及序列设计新算法“circDesign”
发布时间:2023-07-24
发布人:
阅读次数:

转载自:RNAScript

撰文:Vergil

编辑:RNAScript

排版:三姐夫



常规的非复制线性mRNA分子的优化通常涉及5'/3'端非翻译区(UTR)和开放阅读框(ORF),并以实现持久高效的翻译为目的。目前针对线性mRNA的序列设计优化方案集中于优化ORF序列以提供稳定持久的翻译,并在此基础上形成更稳定的mRNA分子二级结构。


与线性mRNA不同,除了ORF区域外,环状RNA(circRNA)通常含有用于非帽依赖性翻译启动的内部核糖体进入位点(IRES)基序。正确折叠的IRES功能基序用于募集翻译前起始复合物(PIC),也是实现circRNA高效翻译不可或缺的条件之一。


由于缺乏专门用于circRNA的结构预测和序列设计工具,以及对circRNA序列中IRES和ORF区域之间交叉相互作用的理解不足,目前circRNA的序列优化严重依赖于大量重复性的模块化筛选。


如果仍按照线性mRNA的优化思路,只关注ORF区域的优化将会忽视IRES基序与其他区域骨架序列在构成circRNA整体时所产生的不确定因素,影响整体的序列优化结果。


2023年7月10日,斯微生物研发团队与来自“LinearDesign”主要设计团队中国药科大学张亮教授Coderna.AI创始人黄亮教授联合在预印本bioRxiv上发表了题为“Improving the Circularization Efficiency, Stability and Translatability of Circular RNA by circDesign(通过circDesign提高环状RNA的环化效率、稳定性和可翻译性)的研究论文。在早前专门用于设计优化线性mRNA序列的高效人工智能(AI)算法“LinearDesign”的基础上,进一步推出了用于环状RNA结构预测与序列设计算法平台——“circDesign”,是有望提高编码蛋白质的环状RNA环化效率、稳定性和翻译效率,简化circRNA的序列优化设计的有效设计开发工具。


在本研究中,设计者团队将circDesign算法应用于基于circRNA的狂犬病(RABV)和带状疱疹(VZV)疫苗的序列优化设计中,在小鼠模型中增强了circRNA的序列稳定性和翻译效率,成功验证了circDesign平台在circRNA序列设计优化上的有效性。



作者说



斯微生物创始人、董事长李航文博士表示,斯微生物在mRNA平台搭建上持续创新,自从将人工智能算法应用在线性mRNA的序列设计上以来,取得了显著的进展。目前将人工智能算法布局在环状RNA平台上,也是国际首个通过人工智能算法优化设计环状RNA的案例,同时是斯微生物创新实力的体现。


文章第一作者,斯微生物mRNA平台研发负责人徐聪聪博士表示,此项与中国药科大学人工智能专家张亮教授,以及美国Coderna.ai公司人工智能专家黄亮教授的合作,进一步展现了人工智能算法在RNA领域应用的广阔前景,环状RNA作为一种新型RNA技术,未来在传染病预防性疫苗以及治疗性药物方面的开发方面可能与现有线性mRNA技术齐头并进,甚至在某些应用场景下具有独特的优势。


本文的共同一作,circDesign算法开发人,LinearDesign共同一作,中国药科大学张亮教授认为此项工作在与斯微生物前期合作基础上产生了新的成果,针对环状RNA的序列设计需要考虑更多的因素,目前也在积极探索针对不同RNA平台的设计算法,希望人工智能技术能够加速RNA疫苗和药物的开发。


CircDesign的应用概述和流程



非复制线性mRNA的功能元件,包括5'-UTR和3'-UTR长度相对较短,约为100nt;而人工体外合成的circRNA通常需包含长病毒和细胞IRES序列,长度为500-800nt。IRES也需要不受其他序列的干扰完成独立有效的分层折叠才得以高效招募PIC进行翻译。基于这一特性,circDesign还着重考虑减轻ORF区域与IRES基序的交叉相互作用,以实现功能性IRES的有效折叠。


同时circRNA残留的外显子片段(循环置换内含子-外显子(PIE)的残留片段)可能会给circRNA的整体功能带来不确定性,虽然目前未有深入研究报道该片段对circRNA整体功能的确切影响,但普遍认为这些片段会干扰其他元件的折叠,因此优化ORF区域时也需要采取一定的预防措施。


CircDesign的基本应用流程主要有四步骤(图1a)


1. CircDesign首先基于给定的氨基酸序列,生成大量mRNA序列库


2. CircDesign基于最小自由能(MFE)*密码子适应指数(CAI)*对circRNA的ORF区域序列进行筛选,考量ORF的稳定性和翻译效率,并将其与包括IRES、外显子片段在内的功能部分和骨架组装成完整circRNA分子;


3. 在完整circRNA分子中评估IRES的位置熵(即circRNA的折叠 )和circRNA的集合多样性,以及区域间相互作用位置熵越低,IRES结构越保守;而集合多样性越低,表明circRNA整体结构一致性更高,更可预测。两者均有助于评估获得更高的结构严密性。区域间相互作用的评估主要目的为减轻ORF对IRES独立折叠的影响


4. 在上述筛选过程后,在体外、体内模型中对设计的circRNA进行进一步的筛选评价



【最小自由能(MFE)】

RNA 分子中碱基对以及核苷酸之间均是靠氢键进行连接的,通过破坏 RNA 二级结构中不同子结构中的氢键所需要的能量值可以得到这些子结构在组合时所需要消耗的能量,这个能量被称为自由能。RNA 分子结构之所以能够稳定,其原因就是碱基配对造成了能量的降低。因此,最小自由能算法认为,自由能趋向越小的时候RNA二级结构越稳定。


【密码子适应指数(CAI)】

密码子适应指数(CAI)是指编码区同义密码子与最佳密码子使用频率的相符程度,取值在0~1之间。CAI可以用来评估外源基因在宿主内的表达水平,CAI越高,则外源基因在宿主内的表达水平越高。



图1. circDesign方法概述和编码RABV-G的环状RNA分子设计流程


以编码RABV-G为例的circRNA设计、合成和表征

设计

如上图1b所示,研究团队通过circDesign设计获得了6个编码RABV-G circRNA的ORF(CR1-CR6)序列,这6种设计均分布在低MFE区域。团队遵循了早前LinearDesign的实验设计原理,同时采用了分别来自赛默飞世尔(ThermoFisher)近岸蛋白(Novoprotein)公开平台设计的基准ORF序列(CR-Ther,CR-Novo),并使设计的每个序列MFE值(CR2, CR3 // CR4, CR5)或CAI值(CR5, CR6, CR-Ther // CR1, CR2, CR-Novo)均尽量成对保持一致,在图1b中以绿色的颜色深浅表示组装后circRNA的集合多样性。随着ORF区域的MFE降低,circRNA的集合多样性降低,表明每个序列均有明确独立折叠的结构。


研究使用来自柯萨奇病毒B3(CVB3)的IRES嵌入ORF上游驱动circRNA的蛋白质翻译。


合成

本研究中采用了I型内含子自剪接系统(Group I intron self-splicing system)利用核酶介导circRNA的环化。自剪切I型催化内含子(group I catalytic intron)通常被设计成分离的5'-内含子和3'-内含子两部分。在线性mRNA阶段时,分子两端由互补的同源臂组成,以促进活性核酶结构的折叠,并通过两个酯交换反应(Transesterification Reactions)以形成两个外显子片段(E1和E2)之间的连接。


表征

研究以CR3和CR-Novo为代表进行了参数检验表征和二级结构预测。通过circDesign设计的CR3,其ORF具有相对更低的MFE,同时与IRES基序的区域间相互作用更弱。从图1d所示两者的二级结构可以发现,浅灰色代表的IRES基序在两个circRNA中具有不同的折叠,同样在CR-Ther中也观察到次优ORF在一定程度上对IRES正确折叠的影响。图1e显示,CR-Novo比CR3具有更多的区域间碱基配对(红色连接线),CR3中主要表现为区域内的配对折叠(蓝色连接线)


在circRNA环化过程中,更紧凑的ORF折叠(区域内)对活性内含子的干扰相对较小,circDesign生成的序列(CR1-6)比CR-Novo和CR-Ther具有相对更高的环化效率(图2a)图2b所示为室温下进行的非变性琼脂糖凝胶电泳结果,在相同的核苷酸长度下,circRNA的凝胶迁移率与其MFE值密切相关。具有最高MFE的CR-Novo序列在凝胶基质中表现出最慢的迁移率,而CR1-5由于其高度紧凑的折叠结构而具有更快的迁移率,表明优化的circRNA ORF序列在调节其折叠方式上的潜力



图2. circDesign设计的CR1-6及CR-Ther,CR-Novo的表征


优化circRNA的体外稳定性



针对优化后circRNA体外稳定性的检验主要分为热力学折叠(thermodynamic folding)溶液内降解(in-solution degradation)以及细胞内衰变(intracellular decay)三项。


热力学折叠


通过加热溶液中的circRNA逐渐展开其结构,RNA结合的RiboGreen试剂的荧光强度相应减弱,并以此可计算出熔化温度(®Tm)的荧光强度曲线。


从图2C可发现,与CR-Ther和CR-Novo相比,circDesign设计的CR1-6具有更显著的热力学稳定性,且可发现热力学稳定性与MFE值呈正相关,MFE值越低该序列的热力学稳定性越好。


溶液内降解


circRNA与线性mRNA一样,其化学不稳定性主要源于水解反应。本研究中使用了37°C下含有10 mM Mg2+的PBS缓冲液,模拟生理条件并加入circRNA样品孵育60小时。通过在不同时间点评估circRNA完整性,将得到的随时间变化的降解率拟合到单相衰变曲线中,以表现不同的降解动力学速率(图2d)


从图2d中可对比发现CR1-3大大扩展了半衰期(t1/2),将CR-Ther和CR-Novo的9.68小时和9.14小时提升到了15.56到20.62小时,表现出更显著的水解稳定性。


细胞内衰变


为了评估circRNA的细胞内半衰期,研究采用了逆转录定量实时PCR(RT-qPCR)方法,在circRNA转染到人骨骼肌细胞(HSkMC)后的不同时间点(3、12、24、48和72h)定量从细胞中提取并检验circRNA的丰度。


结果如图2e所示,所有测试的circRNA均表现出不同的衰变模式。由此可以发现,circRNA的细胞内降解可以通过调整其二级结构和翻译效率来控制。其中MFE值较低的CR1和CR3显示出更长的细胞内半衰期。综合条件下,CR3序列具有良好的稳定性和高翻译效率,能够抵抗化学降解和生物衰变。


优化后circRNA的蛋白质编码和表达能力



研究团队使用流式细胞术评估了HSkMC中转染circRNA的RABV-G表达水平,并以图2f呈现。由平均荧光强度(MFI)显示,CR1-5的蛋白质表达水平明显高于CR6和CR-Ther,其中CR-Novo显示出同样高于CR6和CR-Ther的蛋白质表达水平。这一结果表明,除CAI外需要考虑多种因素对circRNA整体表达能力的影响。


研究人员进一步采用了核糖体分析(ribosome profiling)多聚体分析法(polysome profiling)对CR3和CR-Novo进行并列比较。


如图3d所示的RNA直接测序计数和核糖体测序计数表明,CR3的circRNA丰度和核糖体足迹丰度(ribosome footprints)更显著,决定其具有更高的翻译效率。通过二级结构成对可视化对比,可以推断circRNA丰度和核糖体足迹丰度的区别主要是由于部分被破坏的IRES基序阻碍了翻译机制的起始招募,导致较低的丰度。


多聚体分析用于比较核糖体负载能力,由图3g显示,CR3中的核糖体载量高于CR-Novo,体现出相对更高的核糖体负载能力。




图3. CR3和CR-Novo的翻译效率比较


优化后circRNA狂犬病疫苗诱导的免疫效力

研究团队通过小鼠模型肌肉注射编码RABV-G的circRNA疫苗评估不同设计方案circRNA的体内免疫原性。


在起始剂量注射后第10天,与所有circRNA组相比,LR-Novo引起的抗体滴度略高,这可能是由于抗原的起效表达相对较快,尽管总体滴度仍然很低(图4b)。假病毒中和抗体滴度(pVNT)数据表明,circDesign优化序列组(CR1-4)可引起缓慢但更强更持久的体液免疫反应(图4d),且circRNA组在28天后均表现出pVNT的持续增加(图4e)



图4. circRNA狂犬病疫苗诱导的体内免疫反应


在此基础上,研究团队一并设计了编码水痘-带状疱疹病毒(VZV)糖蛋白E(gE)作为第二抗原的circRNA疫苗(CV1-5)并进行了与circRNA狂犬病疫苗相对应的表征验证实验。实验中同样发现circDesign优化的序列CV1-5诱导了更强的水痘带状疱疹病毒gE特异性T细胞反应,验证了circDesign针对编码不同抗原circRNA时具有稳健的设计优化有效性。

总结


斯微生物联合中国药科大学设计的名为“circDesign”的新算法工具,通过本研究论文提供支持该算法用于优化序列增强稳定性和翻译效率的证据,有望成为环状RNA治疗产品合理有效的设计优化工具,大大简化环状RNA的设计优化过程。


但本文也强调,目前circDesign算法仅对特定的ORF序列进行了广泛的探索,还未涉及优化circRNA的其他功能区域,如IRES基序。这是由于病毒或细胞衍生的IRES基序通常对序列操作敏感,在结构域折叠良好时才具有募集PIC并完整组装的功能。目前只需要在分子水平上阐明IRES的结构-活性,就可以在circDesign算法中实现IRES序列的自下而上搜索或优化。



参考资料


[1] Improving the Circularization Efficiency, Stability and Translatability of Circular RNA by circDesign | bioRxiv. https://www.biorxiv.org/content/10.1101/2023.07.09.548293v1.full

[2] Zhang H, Zhang L, Lin A, Xu C, Li Z, Liu K, Liu B, Ma X, Zhao F, Jiang H, Chen C, Shen H, Li H, Mathews DH, Zhang Y, Huang L. Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity. Nature. 2023 May 2. doi: 10.1038/s41586-023-06127-z.




法律声明
  • 021 - 51572130