天天看点

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

作者:入梦菲记
土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

文|入梦菲记

编辑|入梦菲记

前言:

近几年来关于土地的问题层出不穷,而其中的土壤腐蚀便引起了广泛关注。因为存在着许多地下基础设施的实例,其中包含核废料的已使用核燃料容器。这些基础设施至关重要,在现代生活中发挥着重要作用。

放射性废物的长期保存仍然是全球面临的主要挑战。如果容器在长时间使用后腐蚀、开裂且无法更换,将会对经济产生重大影响。所以说提前了解金属的腐蚀速率和土壤的性质对工程师来说非常有帮助,以找到适合管道的保护方法。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

但是在复杂环境如土壤中预测腐蚀速率并不容易,毕竟土壤环境有许多影响腐蚀速率的因素,包括土壤水中的化学浓度、土壤湿度和土壤结构。

很多研究人员着力于这方面的研究,那么这一些研究人员有何方法能够解决土壤腐蚀的问题,现在结果是否有了更大的进步呢?

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

机器学习在腐蚀科学中的崭露头角

在现在这个社会当中,只要是所有的手动任务都可以使用机器学习算法进行自动化处理。机器学习具有广泛的潜在工业应用,具备很强的发展空间性。更何况机器学习方法适用于具有多个变量的预测模型。

近段时间许多科学领域都应用了机器学习进行跨学科的预测,其中便包括了腐蚀领域,越来越多的科学家开始应用机器学习来预测大气中的腐蚀速率、腐蚀抑制剂的性能和腐蚀行为。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

虽然说很多研究人员已经开始应用机器,但是关于预测土壤环境中碳钢容器的腐蚀速率的研究并不多。根据以前的研究涉及基于土壤溶液的pH值、氯离子和硫酸盐浓度的影响,使用响应面法和土壤溶液的pH值、氯离子、温度等进行预测,使用了响应面法和人工神经网络。

利用机器多种算法的应用与模型优化

研究人员使用多种机器学习算法,考虑真实土壤条件下的腐蚀,来预测碳钢在土壤环境中的腐蚀速率。碳钢是一种成本效益高的容器材料,广泛用于土壤环境。简单来说就是在最终预测碳钢容器在土壤中的腐蚀,演示如何将机器学习应用于腐蚀科学。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

研究的过程当中,需要采用三种机器学习算法和集成学习方法,以此来预测腐蚀速率,并且还需要重点关注土壤溶液的组成及其温度,最后再去使用IBM SPSS Modeler软件进行模型优化,以找到最佳参数来预测腐蚀速率。

IBM SPSS Modeler是一个强大的支持软件,它能够帮助非数据科学家更容易使用和访问机器学习。研究的过程当中需要选择五个影响腐蚀速率的因素,其中包含着pH值、氯离子、硫代硫酸盐、硫酸盐和温度。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

机器学习:无需编程,准确预测,推动科技进步

机器学习是一种人工智能类型,它使软件应用能够更准确地预测结果,所以机器学习的方法对腐蚀科学的发展至关重要。为了能够确定碳钢容器在土壤中的外部腐蚀速率问题的预测,研究当中需要选择最佳和适合的机器学习算法。

机器学习算法库非常多样,而当下目前流行的机器学习算法有两种类型,包括监督学习和无监督学习。监督学习是一种算法,它基于已知的输入和输出对来预测新数据的输出。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

无监督学习是一组允许机器自行学习并发现未标记数据集中隐藏的某种模式或配置的算法。这意味着它只有输入数据集,不知道结果是什么使用这些方法更多地涉及对数据的表征。

监督算法如果进一步细分,也可以分为两个主要部分:分类和回归。回归和分类算法之间最重要的区别在于,分类算法通常用于预测类别和离散值,而回归算法通常用于预测连续值。在研究人员的研究当中,腐蚀电流密度是一个具体的数量,得知具体的前提之下,所以在使用监督算法的时候需要选择回归方法。

在回归监督学习领域有许多不同的算法,在研究的时候除了会选择的单一算法,还会应用集成学习方法,以提高预测性能。集成学习方法是将多个算法合并在一起,以获得比单一算法更好的预测性能。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

人工神经网络算法的基本结构和类型

人工神经网络是通过生物神经元构建的数学模型,人工神经网络算法由一组工作和人工神经元组成,这些神经元可以通过沿着连接传递信息,然后在节点处计算新值来连接和处理信息。许多人工神经网络算法也是建模非线性统计数据的工具。

人工神经网络算法体系结构主要是分为两个主要类型,前馈网络和反馈网络。在前馈网络中,信息信号仅在神经网络中单向传播,而在反馈网络中,信息可以在网络内部形成循环路径,所以可以实现多次传递。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

前馈网络相对于反馈网络在计算上较为简单,因为信息的流动是直线的,没有循环。再加上由于这种简单性,前馈网络被认为在某些情况下可能精度较低。

但不论如何,传统的前馈网络在某些领域,尤其是土壤领域,仍然被广泛使用。因为它们非常适合用于建模输入数据与一个或多个输出响应之间的关系。这使得前馈网络成为解决特定问题的有效工具。

决策树算法及其关键组成部分

决策树算法是机器学习领域最为经典和重要的算法之一,它基于树状结构,用于预测结果变量的值。在决策树模型的构建过程中,有关分裂、停止和修剪等关键步骤需要深入了解。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

决策树由节点和分支组成,节点又分为三种基本类型,根节点、内部节点和叶节点。而根节点代表初始的数据分割选择,因为可能存在多个选择机会。内部节点则会反映了树结构中的不同选择机会,叶节点表示最终的结果或决策。

决策树分裂的过程当中需要确定最重要的输入变量,然后根据这些变量的状态将节点分成两个或多个类别或桶。这种分割技术会重复进行,直到达到停止条件或均匀性条件。当停止条件通常包括树的深度达到一定值、节点中的数据量不足以进一步分裂。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

决策树算法非常多样性,不同的决策树有不同的算法,而决策树算法的多样性体现在不同的构建策略上。一些常见的决策树算法,可以分为分类回归树、迭代二分器3、C4.5、卡方自动交互检测器(CHAID)这几种算法。

所以根据决策树算法的多样性,可以知道它是机器学习中强大的工具,能够处理各种问题。而了解其基本组成部分和构建过程对于正确应用和解释决策树模型至关重要。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

选择合适的决策树算法取决于问题的性质和数据的特点,其中卡方自动交互检测器算法在某些领域表现出色。卡方自动交互检测器是一种使用卡方统计量来确定最佳分解的算法,生成决策树。

连续预测变量被分成具有近似相等数量观察值的类别,而分类预测变量被分成具有近似相等数量观察值的类别。

对于每个类别预测变量,卡方自动交互检测器执行所有潜在的交叉表格,直到获得最佳结果且无法进一步分割为止。卡方自动交互检测器方法可用于可视化树内分割变量与相关因素之间的关系。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

多种模型比较和选择

研究人员在研究中采用了三种不同的方法,包括使用不同树深度的标准和同质集成学习方法装袋、提升。

针对不同的树深度,预测值在达到5后趋于相同,树深度没有进一步增长的必要。根据三种模型的评估结果,包括最小误差、最大误差、平均误差、平均绝对误差、标准差和线性相关值。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

使用树深度为3的提升方法的模型具有最低的平均绝对误差值,并且在验证数据集中的其他参数也表现最佳。

所以即使在树深度为3的情况下,卡方自动交互检测器决策树模型在某些参数上仍然具有最高的R、R2和R2adjusted值。所以树深度为3的提升集成学习方法被选为CHAID决策树的最佳模型。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

不仅如此,在研究中还应用了线性回归算法,可用于处理多个预测变量对腐蚀电流密度响应变量的影响。多元线性回归是一种用于预测的监督学习方法,适用于研究多个预测变量与一个响应变量之间的关系。

所以根据测试可以得知,在响应面和等高面上显示了土壤温度和氯化物是影响腐蚀速率的两个主要因素。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

结论:

本研究的目标是建立一个有效的模型,可用于估计土壤中碳钢容器的腐蚀速度。研究人员尝试了多个模型,最后确定了一种叫做集成学习叠加方法的模型,它在研究数据上表现最好。

虽然这种模型在某些情况下非常准确,但并不意味着它适用于所有情况。所以我们需要为不同的数据集评估多个模型,以找到最适合的模型。为了使模型更可靠,我们需要更多有关土壤腐蚀的数据,以及更多影响腐蚀的因素,比如湿度和孔隙度。

除了使用机器学习来构建模型,研究人员还通过敏感性分析来确定哪些因素对碳钢腐蚀速度最为敏感。根据结果的显示,温度和氯化物是影响腐蚀速度的两个最重要的因素,这些结果有助于更好地理解碳钢容器腐蚀的机理。

土壤腐蚀得到解决?用机器学习构建模型,确定腐蚀速度最敏感因素

都看到这里了,还请“点赞+关注”,有了您的支持,我才能不断为大家带来更多优质的内容!

继续阅读