本应用简报介绍碰撞截面预测工具CCSondemand在预测数百种农药化合物CCS值方面的性能。
离子淌度-质谱(IM-MS),是离子淌度分离(IMS)与质谱分析(MS)相融合的一种新型二维检测技术,经过数十年的发展,日臻成熟,正在迅速成为现代分析化学前沿的技术领域之一。碰撞截面(Collision Cross-Section, CCS),作为IM-MS技术区分不同化合物的重要参数,不依赖于仪器设备和一般实验条件的不同而保持恒定,在化合物的定性分析中显示出独特的优势,但是CCS标准参考值的缺乏,已经成为离子淌度-质谱技术得以广泛应用的瓶颈问题。
因此,行业里涌现出基于化合物结构和离子淌度分离原理的多种CCS值预测工具,多以机器学习类工具为主,即以大量的CCS实验值结合相关化合物离子的结构属性和理化性质,训练机器,在化合物结构、理化性质与CCS值之间建立关联,并以此预测给定化合物结构的CCS值。
本文使用沃特世研发的碰撞截面预测工具CCSondemand,针对数百种农药化合物进行了CCS值的预测,通过与多次实验测定的CCS平均值进行对比,对CCSondemand的预测准确性进行了评价;同时,使用一种公共CCS值预测工具,对相同的化合物组进行CCS值的预测,并就两种预测工具获得的CCS预测值的准确性进行了整体的性能考察与比较。结果显示,沃特世碰撞截面预测工具CCSondemand不仅使用上更加灵活方便,且CCS预测的准确性也更高,充分说明,作为IM-MS技术的主要开拓者之一,沃特世以其雄厚、持久、全面的科技创新能力,始终是该前沿分析领域的技术领跑者。
使用20种农药化合物的混标溶液(P/N: 186006348),用50%乙腈稀释到适宜浓度,作为质控样品,用于实际样品数据采集前,监控并微调保留时间;含数百种农药化合物的混合溶液作为实际测试样品,下文称为“大混标样品”。获得的数据使用UNIFI科学信息管理系统的筛查工作流程进行分析。筛查分析方法中,使用自建的高分辨串联质谱数据库,库中包含农药化合物数目,正离子模式500+种,负离子模式100+种。用于定性筛查的化合物属性有:化合物母离子/碎片离子的精确质量数、保留时间、结构式,以及理论碎片离子(UNIFI根据化合物结构自动生成)等。
所有测试皆呈阳性检出的化合物,计算其多次进样获得的CCS值的平均值和相对标准偏差(RSD),并以RSD小于1%的化合物的CCS的平均值,用作评价CCS预测工具预测CCS准确性的参考标准。
|
分离系统: |
ACQUITY UPLC I-Class |
|
色谱柱: |
XSelect HSS T3, 2.5 µm, 2.1 × 100 mm, (P/N: 186006151) CORTECS T3, 2.7 µm, 2.1 × 100 mm, (P/N: 186008484) |
|
温度: |
45 °C |
|
流动相: |
水相(A) 5 mM NH4FA + 0.1% FA的水溶液 有机相(B) 50%甲醇 + 50%乙腈的混合溶液 |
|
质谱系统: |
SYNAPT G2-Si HDMS SYNAPT XS HDMS |
|
系统分辨率: |
灵敏度模式 分辨率模式 |
|
系统校正: |
质量轴校正:甲酸钠溶液 CCS校正:Major Mix (P/N: 186008113) 实时校正(CCSLockmass):亮氨酸脑啡肽(LeuEnk)溶液 |
|
数据采集: |
HDMSE 质量数范围:50–1000 Da HDMSE碎裂能设置:低能off;高能10~40 eV |
许多关注淌度-质谱技术的前沿课题组都在致力于CCS值预测工具的研发,现阶段,不止一种的CCS值预测工具已在网上发布。不同的工具,在进行CCS值预测时,对于待预测化合物信息的输入,有不同的需要,有的工具,针对一个化合物,需要输入多种信息才能进行预测;有的工具对应的网站较难打开,或不对公众开放…。本文找到了一个CCS值的公共预测工具(名称隐去,下文中称作“公共CCS预测工具”)。该预测工具基于大量漂移管和行波离子淌度技术获得的CCS值进行深度机器学习,并结合淌度分离原理研制而成。使用化合物的线性结构SMILE格式,作为单一输入信息,可以给出[M+H]+、[M+Na]+、[M+NH4]+、[M-H]-等多种离子加合形式的CCS预测值。
沃特世公司研发的CCS预测工具CCSondemand,同样采用深度机器学习的原理,基于多台仪器设备(Vion和SYNAPT)获得的大量化合物不同加合离子的CCS值,结合化合物结构的多种基本属性和理化性质,并依据淌度分离原理研发而成。使用时,只需输入单一化合物结构信息,兼容mol、sdf、inchi、SMILE等多种化学结构格式,可以给出[M+H]+、[M+Na]+、[M+K]+、[M-H]-、[M+HCOO]-五种离子加合形式的CCS预测值。因需要的化合物结构信息有多种格式可以选择,容易获得,使用更灵活方便。图1展示了CCSondemand简洁、清楚的应用界面。
针对大混标样品(含数百种小分子农药化合物)进行多次数据采集,进样信息如表1(正离子模式)、表2(负离子模式)所示,可以看出,样品检测的进样次数,虽受实验目的、仪器使用期限、紧急事件插入等因素的影响而有所不同,但实验条件的差异性跨度皆很大。
对于正离子模式,用自建数据库中500+化合物对样品数据进行筛查分析,16次筛查结果皆为阳性检出的化合物有339种;对于负离子模式,库中化合物数目100+,8次进样筛查结果皆为阳性检出的化合物数目为92种。查看原始数据,有31个化合物,某几次进样的数据,由于信号过载,导致淌度峰分叉,使软件认错漂移时间,使测得的CCS值错误。剔除这样的CCS值,剔除数目1-6不等。剔除错误CCS值后,所有化合物CCS测定值的相对标准偏差(RSD)皆小于1%,其修正后的RSD分布图见图2。
图2.大混标样品多次进样CCS测定值的RSD分布图。
(*:正离子模式进样总次数16,剔除错误结果0-6,所以n=10-16;
负离子模式进样总次数8,剔除错误结果0-2,所以n=6-8)
众所周知,标准偏差对组内测量值中的特大或特小误差反映非常敏感,可用于衡量组内测试值的不确定性和离散程度。鉴于实验设计的多样性,如果多次测定的CCS值,其相对标准偏差(RSD)较小(<1%),则多次实验获得的CCS的平均值,应该比较接近真值。基于这个假设,在后续的CCS预测准确性评估分析中,以RSD<1%的所有化合物(正离子模式339种,负离子模式92种)CCS测定值的平均值作为参考标准,下文中称为“CCS的实验基准值”。
针对正离子模式339个化合物,使用沃特世CCS预测工具CCSondemand和公共CCS预测工具,分别预测其[M+H]+离子的CCS值,并将CCS的预测值与实验基准值对比,计算相对偏离度,计算公式:(理论预测值-实验基准值)/ 实验基准值x100。表3列出了两种预测工具预测获得的CCS相对偏离度的标准偏差(SD)和与之相对应的概率水平,其正态分布曲线如图3所示。根据正态分布原理,参与正态分布分析的数值在平均值(mean)±1倍标准偏差(1xSD)以内的概率水平为68%,即数组内,68%的数值在mean±1xSD以内,依此类推,95%的数值在mean±2xSD以内,99.7%的数值在mean±3xSD以内。
结合表3的数据和图3所示的正态分布曲线可知:1)在正离子电离模式下,两种预测工具预测获得的多数CCS值皆具有较高的准确性,可以对化合物的定性分析起到一定的参考与指导作用;2)对于公共CCS预测工具,99.7%的化合物,其预测获得的CCS值相对于实验基准值的相对偏离度在±10%以内,而对于CCSondemand,99.7%的化合物,其相对偏离度在±5%以内,也就是说,沃特世预测工具CCSondemand对CCS的预测与实验值相比误差相对更小,其预测准确度明显优于公共CCS预测工具。图4为相对偏离度的分布图,也可以很直观的看出这一点。
此外,将339个化合物的CCS预测值和实验基准值进行线性回归分析,回归曲线与线性相关系数见图5,纵轴为CCS预测值,横轴为CCS实验基准值。图中数据点的分布和线性回归系数的大小进一步说明,使用CCSondemand预测工具获得的CCS值与实验基准值吻合度更高。
图中标识的两个化合物Chlorsulfuron(绿色圆点)和Hydramethylnon(紫色圆点)在正负电离模式下皆阳性检出,其CCS测定值与部分数据图谱,见下文的“化合物数据分析举例”部分。
同样,针对负离子模式的92个化合物,将CCS预测值和实验基准值及其预测相对偏离度进行了整体分析。图6为负离子电离模式CCS预测值和实验基准值的线性回归曲线。与正离子模式得出的结论一致,CCSondemand给出的CCS预测值与相应的实验基准值吻合度更高。
平行打开同一批次,正、负离子模式下的UNIFI分析结果[以表1中n=16、表2中n=8两次分析为例],分别找到化合物Chlorsulfuron(图5和图6中的绿色圆点),察看可知其定性鉴定因子的匹配状况良好。图中展示数据皆使用XSelect HSS T3色谱柱,在SYNAPT G2-Si上分辨率模式采集获得,采样时间:2020.6.19。图7为化合物Chlorsulfuron在正、负离子模式下的色谱图(左)和到达时间分布(ATD)谱图(右)。由于使用相同的色谱柱和色谱分离方法,其正离子模式、负离子模式下该化合物的色谱行为完全相同,表现为在两种电离模式下,不仅保留时间相等,色谱峰形也相同,进一步证明了该化合物的阳性检出;其淌度行为中漂移时间因不同电离模式下校正文件的不同而不同,由其计算出的CCS值,也会因离子加合形式不同而有所差别。
表4为Chlorsulfuron多次进样测得的CCS值列表,左边为正离子模式,右边为负离子模式。蓝色标注的为多次CCS测定值的平均值,即上文提到的实验基准值。
化合物Hydramethylnon(图5和图6中的紫色圆点)的色谱图、淌度分离谱图和CCS测定值列表分别见图8和表5,数据来源与Chlorsulfuron相同。图8中,正离子模式的ATD谱图呈现双峰,通过进一步查看淌度分离热图,基本可以确定,该双峰由同分异构现象所致。淌度分离中的同分异构现象,多源自离子的异构化,即化合物形成离子时,由于电荷加持的位置不同,或者由于电荷的加持,导致电子云重排、结构共振等原因形成。
另一方面,该化合物正、负电离模式ATD峰宽差别较大,正离子模式下ATD峰明显展宽。通过查看淌度分离热图(数据未显示)可以确定,该展宽主要是由于信号较强,导致的淌度峰的拖尾和展宽,这一点也可以从ATD谱图纵轴的强度值得到旁证。
利用化合物的二维结构(mol文件)和线性结构(SMILE格式),分别使用CCSondemand和公共CCS预测工具进行CCS值的预测,获得该两个化合物M+H、M-H离子的CCS预测值,如表6所示。表格中预测偏离度的计算公式:(CCS预测值-CCS实验基准值)/CCS实验基准值x100。
由表6中数据可以看出:
可见,两种CCS值预测工具,预测获得的多数CCS值具有较高的准确性,对化合物的定性分析能起到一定的参考与指导作用,但是仍然有部分化合物,CCS预测的准确性有待进一步提高,预测工具的整体性能也需要不断的改进与完善。
沃特世公司的淌度-质谱联用技术,始终走在行业的前列,2007年第一代的淌度-质谱联用仪SYNAPT HDMS就已经作为商品在分析行业现身,经过十几年持续不懈的努力,沃特世的淌度-质谱联用技术已经有了三个独立的产品系列,并在CCS值预测工具的研发方面也取得了显著的研究成果。
本文以数百种农药化合物为测试样品,在实验条件差异性很大的情况下,以多次进样分析获得的CCS的平均值作为参考标准,对沃特世公司自主研发的CCS预测工具CCSondemnad预测CCS值的准确性进行了整体评估,并与目前行业里一种公共CCS预测工具的预测结果进行对比。结果显示,CCSondemand的CCS值预测准确性明显优于公共CCS预测工具,其易用性和预测准确性等皆走在该技术领域的前列。
诚然,对化合物CCS值的预测,还有较长的路要走,其预测准确度也有待进一步提高,相信随着科学家们对离子淌度原理认识的不断深入,大数据分析技术的不断创新与改进,数据运算手段的不断更新换代等等,CCS的预测技术会越来越成熟,其预测的准确性和可靠性也会逐步提高,最终成为分析化学工作者得力的定性分析工具。
720007021ZH,2020年11月