花椒(Zanthoxylum bungeanum,PZB))是一种广受欢迎的辛辣调味品,广泛应用于亚洲美食中。它的特点是其独特的刺痛感和麻木感,以及令人印象深刻的香气。随着亚洲美食在世界范围内的流行,对花椒的需求迅速增加,如今花椒已成为全球最大的木本香料作物,在中国的种植面积超过100万公顷。

  有效评估PZB产地和辛辣强度分别对其商业贸易和深加工的成功至关重要。花椒生长区域的差异自然会导致PZB在香气、麻味和外观等品质上存在差异。原产地是判断PZB采购价格的主要依据。然而,在经济竞争的推动下,产地真伪已成为PZB贸易中的问题,涉及普遍的错误标签和掺假。PZB掺假主要包括高质量产地的PZB与类似的低质量产地PZB的混合。然而,即使对专业人士来说,验证PZB的地理真实性也是具有挑战性的,因为这些作物在外观上非常相似。尽管高效液相色谱(HPLC)指纹图谱法和顶空固相微萃取-气相色谱-质谱法(HS-SPME-GC-MS)已被证明能有效准确地确定原产地真伪,这些程序缺乏便携性且涉及的复杂操作使得它们在业务交易期间不方便进行实时检测。

  辛辣强度是PZB加工过程中质量的重要指标,主要归因于特定的烷基酰胺,如山椒素、羟基山椒素、bungeanool和isobungeanool。目前,PZB辛辣度的评估主要依赖于专家的主观判断,但这种方法需要进行感官训练,并且在大规模测试样本中受到味觉疲劳的限制。另一方面,目前用于测定PZB中烷基酰胺物质含量的辛辣强度检测方法,由于其强度不仅取决于烷基酰胺的含量,还取决于其成分,因此不能准确反映人的感官体验。由于其结构差异,烷基酰胺表现出不同的辛辣强度。此外,对麻味的感官知觉会受到食物基质中其他成分的影响,仅通过测量特定烷基酰胺含量难以获得可靠的评价结果。

  从上述分析中可以清楚地看出,需要一种高精度和便携式的方法来解决PZB来源识别以及测量其辛辣强度所带来的挑战。近年来,一种基于电化学仪器的差分脉冲伏安法(DPV)作为一种灵敏、选择性强的食品质量评价工具而出现。在先前的研究中发现,DPV能够产生PZB中多酚和烷基酰胺的伏安信号,从而显示出区分不同PZB质量的潜力。然而,不同成分的信号之间存在明显的干扰,这阻碍了对各种PZB质量特性的定量区分。为了提高电化学传感器的选择性和信号强度,许多研究探索了使用特殊材料进行电极修饰。也有报道称,机器学习和电化学检测的融合可以提供一种替代方法,能够弥补传统电化学方法的局限性,因为它在从复杂信号中提取有意义的见解方面优于传统方法。因此,机器学习方法在食品质量监测中越来越受到重视。

  本研究旨在通过DPV和机器学习算法的结合,开发一种快速准确的PZB地理真实性和辛辣强度检测方法。首先,收集了中国14个产地的210份PZB样品的DP伏安图。然后,对支持向量机(SVM)、KNN、ANN和极限梯度增强(XGB)4种算法进行原产地、地理真实性和辛辣强度预测模型的优化测试。此外,还介绍了所提方法中产地区分和辛辣强度量化的原理。本研究为PZB质量评估仪器的开发提供了一条有前景的途径。

  Graphical abstract

  

图1 PZB样品的外观和产地信息

  图2 数据库建立

  Results and Discussion

  不同来源的PZB提取物溶液的DP伏安图

  如图3a所示,在−0.2~1.4 V范围内呈现3~4个峰值。值得注意的是,不同地区的PZB的DP伏安表现出显著的差异。S1、S2和S3在地理位置相近的地区(甘肃天水市)发育出相似的曲线模式,表明其组成相似。相反,同样来自甘肃的S4在其DP伏安图中显示出一个明显的阳极峰,约为0.6 V,表明与地区同类产品相比,存在不同的氧化还原活性物质。此外,从山西获得的S6和S7在0.2 V到0.7 V的电位范围内表现出明显的伏安差异。山东产S8、S9、河北产S10、四川产S11、S12、S13、S14的DP伏安图基本一致。

  PZB的起源辨析

  为了验证DPV方法在原产地分析中的潜力,应用PCA和LDA对数据进行降维,并对不同类别进行可视化。三维PCA评分图结果如图3b所示,其中前三个主成分的累计解释方差为93.3%。虽然在同一来源样本中存在一定的聚集趋势,但不同来源样本之间存在明显的重叠,因此PCA不能提供PZB来源的明确区分。

  由于PCA的局限性,采用LDA进行进一步的可视化。图3c给出了利用KNN算法从二维LDA空间计算的决策边界,该图清楚地显示了不同来源的PZB样本之间存在明显的分化,同一来源的PZB样本存在明显的聚类。DPV曲线有效地捕捉了各产地的变化和特征,便于综合分析。然而,值得注意的是,样本S4和S9之间存在相当大的重叠,这对使用LDA进行区分构成了挑战。样本S1、S2、S8和S11在边界附近也存在部分重叠,导致误分类。图3c中由LDA得出的散点图直观地说明了各个样本之间的相似性,为进一步分析奠定了基础。LDA的起源区分能力的基本原理在于提取独特的、可区分的特征的能力。LDA通过优化特征的线性组合,使组间方差最大化,组内方差最小化,保证同源样本聚类紧密,同源样本分离清晰。

  为了进一步提高PZB起源识别模型的准确性,评估了四种不同的机器学习技术,KNN、SVM、ANN和XGB。与LDA相比,这四种算法具有更灵活的模型结构和参数设置,更适合问题需求。此外,他们都表现出处理非线性数据和模式的熟练程度,并且通常在处理高维数据集方面表现出增强的有效性。如表1所示,四种模型在训练集上都达到了100%的准确率,但在测试集上的表现存在显著差异。在测试模型中,ANN的识别率最高,达到100%,其次是SVM(92.8%)、KNN(86.5%)和XGB(78.5%)。

  表1 三种模型的性能:用数据集1评估PZB原点分化模型

  由于某些PZB样本的接近,KNN表现不佳,从PCA和LDA分析中可以看出。KNN算法基于距离的特性确实使样本区分具有挑战性。XGB的性能不佳可能归因于基于树的集成模型对特征划分和选择的敏感性。过多的特征会放大过拟合的风险。图3d展示了最优模型在测试集上的性能。人工神经网络在实现最高识别率方面的成功强调了其在捕获数据集中复杂的相互依赖性方面的能力,并展示了区分PZB起源的识别能力。这种改进可能归因于自适应特征表示学习能力,其中可以从原始数据中提取有用的特征,而无需进行特征工程。同样,支持向量机的熟练程度可以归因于它们在处理非线性关系和高维数据集方面的熟练程度。

  与基于质子核磁共振(1H NMR)和近红外(NIR)的起源区分方法的准确率分别为86.8%和87.5%相比,所提出的DPV方法的准确率达到了100%。

  掺假PZB的鉴定

  虽然起源区分模型表现出较好的性能,但不同起源的PZB混合会大大降低PZB的精度。然而,仍然有有限的研究跟踪掺假做法,这是一个普遍发生在PZB业务在PZB交易。为了建立一个可靠的模型来鉴定掺假的PZB,进一步制备了来自不同来源的含有不同量PZB的样品。在评估四种不同机器学习算法的性能时,关注50%的欺诈率和未掺杂的样本,并根据最佳的二值分类性能选择最优模型。如表1所示,KNN、XGB、SVM和ANN模型均取得了优异的效果,其准确率、精密度、召回率和AUC均超过90%。其中,KNN模型的准确率最高,达到97.9%,准确率和召回率接近95%甚至更高,AUC达到0.980。这些令人印象深刻的指标表明,KNN模型是鉴定PZB样品中掺假的最准确和最强大的工具。

  为了研究欺诈模型的识别阈值,随后使用不同掺假率(20%、35%、50%、65%、80%)的样本数据以及未掺假样本的数据构建模型。采用最优XGB模型对这些数据集进行分析。在图3e所示的分析结果中,很明显,当欺诈率降低时,模型的性能并没有明显恶化。KNN模型可以在20%的掺杂水平上有效地区分PZB样品,准确率为87.4%,从而证明了其在这方面的鲁棒性和可靠性。

  图3 (a)不同产地PZB的平均DP伏安图(甘肃S1-S4、山西S5、陕西S6-S7、山东S8-S9、四川S10-S14);(b)所有DP伏安图(210个样品,210×400个变量)的PCA分数图(总方差为93.3%);(c)基于KNN模型计算的PZB原产地鉴别决策边界;(d)最佳PZB原产地分析模型测试集中的混淆矩阵;(e)最佳模型在不同PZB掺假率下的掺假鉴定准确率

  辛辣强度的感官评价

  图4a显示了来自不同地区的PZB样品的感官评价,并显示了基于来源的辛辣强度的变化。PZB样本来自不同起源随后被排名的基础上他们的刺激性强度如下:S1(25.33±3.91)≥S3(24.69±5.68)≥向(23.91±4.68)≥S12(21.64±5.41)≥S2(21.56±3.80)≥S14系列(20.09±4.55)≥S11(15.44±6.25)≥S10(12.31±5.26)≥S4(11.70±2.81)≥S6(11.61±4.20)≥S7(10.47±4.19)≥S9(9.38±4.42)≥S5(8.67±4.59)≥S8(7.30±4.06)。很明显,这些辛辣强度值差异很大,代表了不同的PZB等级。其中,甘肃和四川(S1、S2、S3、S12和S13)的PZB样品普遍表现出较高的刺鼻强度,而河北(S10)、山东(S8和S9)和陕西(S6和S7)的刺鼻强度较弱。此外,S13与S1、S3和S12具有较高的辛辣强度,而S14、S2和S11具有中等的辛辣强度。在先前的研究中,证明了PZB的总烷基酰胺含量与DP伏安图中1.0 V左右的峰值电流强度之间存在很强的相关性。本研究结合图3a所示不同生境PZB的DPV分析,大多数高刺鼻强度的PZB样品在1.0 V左右出现明显的峰值强度。这与先前的发现一致,确定烷基酰胺是PZB的主要刺激性化合物。不过,也有一些例外情况。例如,PZB样品S7的烷基酰胺含量相对较高,但辛辣强度较低,而S12的烷基酰胺含量相对较低,但辛辣强度较高。这些例外表明,除了烷基酰胺外,还有其他成分对PZB的刺激性强度有影响。

  图4 (a)不同产地种植的PZB辛辣强度;(b)PZB辛辣强度的标度和描述语义;(c)最佳PZB辛辣强度预测模型的测量值和预测值的散点图;(d)用于建立PZB辛辣强度预测模型的每个特征的贡献

  PZB的辛辣强度预测

  为了评估PZB的尖锐程度,在训练、验证和测试数据集上使用R2和RMSE评估了四种不同学习算法的性能。表1总结了各模型得到的最优结果,表S7给出了各模型使用的超参数。

  在被测试的四种算法中,KNN算法的训练R2值最高,为1.00,SVM算法的训练R2值最低,为0.952。交叉验证的R2值范围为0.752~0.896,表明不同算法的性能存在差异。值得注意的是,基于训练集和交叉验证集的R2和RMSE之间的差异(分别为ΔR2=0.048和ΔRMSE=0.98),ANN算法在两个集之间表现出最小的性能差异,表明没有明显的过拟合问题。相反,KNN算法的性能下降更为明显,与训练集相比,其他两种算法都表现出较差的性能,显著下降,这表明了明显的过拟合问题。然而,这个问题可以通过扩展数据集得到潜在的缓解。

  在测试数据集上评估预测性能时,所有算法的R2范围为0.743~0.918。ANN算法的R2最高,为0.918,XGB算法的R2最低,为0.743。这些测试数据集结果与交叉验证结果一致。因此,人工神经网络算法是评估PZB辛辣强度最有效的模型。图4c展示了散点图,说明了训练和测试中表现最好的模型的回归结果。x轴表示实际值,y轴表示预测值,与对角线紧密对齐的散点分布表明模型性能较好。当超参数设置为num_layers为4,隐藏大小为128时,获得了最优的ANN模型。这种对人工神经网络模型架构的约束抑制了过度的复杂性和过度拟合的可能性。因此,通过结合dropout和正则化策略,ANN算法有效地防止了网络对训练数据中的噪声过于敏感。

  另一方面,由于感官评价数据波动较大,辛辣强度预测模型的性能受到限制。尽管如此,本研究中提出的DPV-ANN模型明显优于基于近红外结合偏最小二乘的预测模型,并且具有更高的精度,消除了复杂的样品预处理或电极修饰过程。这不仅节省了成本,而且提高了检测效率。不同尖锐度检测方法的性能差异见表S8。

  为了研究各个DP伏安特征对模型输出的影响,分析了最优模型的特征重要性,结果如图4d所示。颜色越亮,对应点对模型的贡献越大。在0.34~0.52 V和1.0~1.2 V处有两个相对明亮的波段,之前有报道称PZB中多酚和烷基酰胺的峰电位都在这个范围内,这表明这两种物质与PZB中的辛辣强度密切相关。为了进一步验证多酚特征对辣味强度评价模型的影响,将这些特征排除在外,并使用最优超参数对模型进行重新训练。特征消融模型在测试集上的表现从R2=0.918下降到R2=0.831,这种下降清楚地说明了多酚成分对PZB刺激性强度的影响。去除这些相关特征降低了模型捕捉多酚和辛辣之间复杂相互作用的能力,导致预测准确性降低。

  DPV法检测刺鼻强度的机理

  为了阐明DP伏安信号快速量化PZB刺鼻强度的机理,分析了主要刺鼻物质羟基-α、β和γ-山椒素(α、β、γ-SOH)的伏安特性与刺鼻强度的关系。如图5a~c所示,三种SOHs的阳极峰电位分别为0.93、0.95和0.92 V。各SOH的峰值强度(Ip)与其浓度梯度呈良好的线性关系。此外,通过线性回归定量分析了不同浓度SOH的峰电位(Ep)、峰面积(Ap)和峰值电位(Ip)与SPU之间的关系。

  拟合方程为:SPU=−630.75Ep+662.60Ip+694.86Ap+737.40,R2=0.952。

  结果表明,SOH的辛辣强度与Ep呈负相关,与Ip呈正相关。已有文献表明,SOH的麻木感主要归因于瞬时受体电位香草素1(TRPV1)和TRP锚蛋白1(TRPA1)的刺激,α-SOH通过与特定半胱氨酸残基的共价或非共价相互作用作用于TRPA1和TRPV1。由于TRPV1和TRPA1都是氧化还原生物传感器,它们的刺激与氧化还原状态密切相关,因此可以推测氧化电位较低(即Ep值较低)的SOH更容易被氧化,从而促进其与TRPV1或TRPA1的相互作用。这就解释了为什么DP伏安图能够区分不同SOH的辛辣强度。

  槲皮素DPV在0.26~0.43 V和0.96~1.2 V处出现了两个阳极峰(图5d),而IPF伏安图在0.3、0.6和1.1 V处出现了三个阳极峰(图5e),表明存在其他多酚。当IPF与α-SOH复合后,0.26~0.43 V和0.42~0.71 V的峰值强度急剧下降。而α-SOH在1.1 V处的峰与α-SOH的特征峰相结合,峰强度显著增加,Ep从α-SOH向外正移。IPF/α-SOH组合的DP伏安图与S14等PZB样品的DP伏安图基本一致(图5f),说明多酚与SOH之间的DPV信号相互作用在辣度预测中得到了很好的体现。此外,有研究表明,一些多酚激活TRPV1或TRPA1产生涩味,这也是一种三叉神经感觉。可见,PZB中多酚与SOHs之间的意义重叠在DPV上得到了充分的反映。

  这些发现表明,DPV结合机器学习算法能够捕获PZB中多酚和SOH的氧化还原特性,并模拟两种成分之间的相互作用,从而实现对辛辣强度的精确测量。

  Conclusion

  开发一种快速可靠的方法来评估PZB的质量对这种受欢迎的香料调味品的经济和声誉完整性至关重要。在本研究中,将电化学分析与机器学习方法相结合,建立了一种快速检测PZB地理真实性和紧急程度的方法,用于商业交易过程中的质量监测和深加工过程中的分级。鉴别PZB来源的准确度为100%,鉴别PZB掺假的准确度为97.9%。此外,KNN机器学习方法成功地区分了纯PZB样品和掺假样品,即使在掺假减少20%的情况下,准确率也达到87.4%。在平行实验中,神经网络对辣味强度的预测效果最好(R2=0.918)。除烷基酰胺外,PZB中的多酚类物质也可能对整体辛辣强度有贡献,这为我们了解影响PZB感官属性的因素提供了一个新的维度。因此,本研究强调了将电化学与机器学习方法相结合的潜力,为PZB的认证和分级提供了一种快速、可靠和创新的方法,其研究结果对食品工业具有有益的意义。


相关文章

利用差分脉冲伏安法和机器学习算法快速测定花椒的地理真实性和辣度

花椒(Zanthoxylumbungeanum,PZB))是一种广受欢迎的辛辣调味品,广泛应用于亚洲美食中。它的特点是其独特的刺痛感和麻木感,以及令人印象深刻的香气。随着亚洲美食在世界范围内的流行,对......

花椒虽美味,小心有窒息危险

尝过花椒的人,都忘不了它酥麻香浓的口感,在火锅里撒上一把,既暖身又开胃。然而,最近有网友说自己在海底捞吃火锅的时候,麻油辣油卡在喉咙难受,差点窒息死亡。花椒,为什么香?我们平时常吃的花椒主要有美洲花椒......

花椒基因组进化和适应性演化研究获进展

中国热带农业科学院香料饮料研究所(以下简称香饮所)热带香辛饮料种质资源研究室在中国花椒基因组进化和适应性演化研究方面取得重要进展。研究团队在实现竹叶花椒和红花椒基因组的高质量拼接和染色体锚定的基础上,......

花椒中麻味素和花椒素的生物合成及无融合生殖的机制

花椒隶属于芸香科(Rutaceae),是一类受亚洲人普遍喜爱的香料植物。花椒在中国的四川省尤其受到欢迎,因此也被称为“SichuanPepper”。早在2000多年前,中国人已经开始种植和食用花椒。如......

关于花椒国家药品标准修订草案的公示

国家药典委员会拟修订花椒国家药品标准,为确保标准的科学性、合理性和适用性,现将拟修订的花椒国家药品标准公示征求社会各界意见(详见附件)。公示期为三个月。请相关单位认真研核,若有异议,请及时来函提交反馈......

日本追加中国产花椒作为命令检查对象

7月17日,日本厚生劳动省发布药生食输发0717第1号通知,追加中国产花椒作为命令检查对象。根据进口监控检查结果,日本政府在中国产花椒中检测出黄曲霉毒素。因此,对于中国产花椒及其加工品中的黄曲霉毒素检......

台湾食药署发布边境查验农残不合格食品——花椒

2019年5月21日,台湾食药署发布边境查验农残不合格食品名单,其中不合格产品为花椒。具体信息如下:序号产品制造厂或出口商不合格原因重量1花椒LONGHAITonGJIFOODSCO.,LTD.检出残......

我国在农林系统抵抗极端降雨影响过程和机理研究获进展

人类活动干扰不断引起气候变化,并挑战生态系统的稳定性。在当前气候变化下,极端降雨的发生频率和强度日益增加,这在我国西南和华东地区尤为明显,对农林业生产造成重大损失。如何通过构建高效的农林复合生态系统来......

极端降雨对花椒农林复合系统中花椒生长的影响机制

人类活动干扰不断引起气候变化,并挑战生态系统的稳定性。在当前气候变化下,极端降雨的发生频率和强度呈现日益增加的趋势,这在我国西南和华东地区尤为明显。如何通过构建高效的农林复合生态系统,来应对极端降雨的......

花椒脱去外衣清水变红水专家称有染色嫌疑

左侧为金先生购买的花椒 水质呈枣红色“染色花椒流入义乌市场了。”4日上午,义乌的金先生向本网报料,他购买的花椒被严重染色。记者经过一番实验对比,发现几分钟的浸泡,问题花椒就脱去了红色外衣,清......