随着人工神经网络近半个多世纪的发展,尤其是对学习算法的不断研究,人工神经网络技术在许多领域的应用已发挥了巨大的潜能。由于人工神经具有自组织、自学习和对输入数据或规则的高容错能力,很适合处理趋势分析、预测和函数拟合等复杂问题[1]。人工神经网络已在机械性能预测[2]、铸件缺陷诊断与控制[3,4]、非晶形成能力识别[5]等方面得到应用。但是在这些研究中所取的样本数相当庞杂,并且带有许多随机性。在新材料的开发中,正交实验设计方法得到了广泛的应用。然而,人们通常要做许多正交实验才有可能开发出新的材料,这就给新材料的开发带来了很大的难度。能否结合人工神经网络和正交实验各自的优点为新材料的开发服务,至今尚未见报道。

笔者采用L9(34)正交实验,建立了3个不同的样本集,用BP神经网络对上述问题进行了探讨,结果表明:完备的正交实验样本集可以用做学习训练样本集,并且是学习训练样本集的基本单元,它对与正交实验有相同影响因素和水平的样本的预测精度很高,为科研人员提供了一条新的实验设计思路。

《1 BP人工神经网络模型的建立》

1 BP人工神经网络模型的建立

采用L9(34)型3组不同的正交实验:用湿砂铸型浇注1组白口银铁的正交实验,测出其硬度与冲击韧性作为1个样本集(见表1);在相同制作

《表1》

表1 样本集 1

Table1 Sample collection one

工艺和影响因素的条件下,用两组不同因素水平的关于磷酸盐石墨铸型的正交实验,分别测出其干抗拉强度和干抗压强度作为另2个样本集(见表2和表3)。用四输入、二输出且含有一个10节点隐含层的BP神经网络,输入和输出都为Sigmoid型界数的神经网络进行函数拟合,把各个影响因素作为网络的输入,对应条件下的性能值作为网络的输出,选取学习率为0.5。

《表2》

表2 样本集 2

Table2 Sample collection two

采用下式对样本的输入与输出数值进行归一化:

\(x^{\prime}=\frac{0.6}{x_{\max }-x_{\min }}\left(x-x_{\min }\right)+0.2\)

式中\(x_{\max }\),\(x_{\min }\)是归一化前的输入和输出的最大值和最小值。

《表3》

表3 样本集 3

Table3 Sample collection three

《2 预测结果》

2 预测结果

《2.1 以完备的样本集1为训练学习样本来预测》

2.1 以完备的样本集1为训练学习样本来预测

以完整的样本集1作为训练学习样本集,对与训练学习样本集有相同影响因素和水平的其他6个样本进行预测,期望误差设定为0.0001,总共训练学习了15343次,预测结果与误差见表4中的样本1~6。

《2.2 以不完备的样本集1为训练学习样本来预测》

2.2 以不完备的样本集1为训练学习样本来预测

去掉样本集1中的第9个样本,把剩下的8个样本作为训练学习样本集,对被去掉的第9个样本进行预测,期望误差设定为0.0001,总共训练学习了16650次,预测结果与误差见表4中的样本7。

《表4》

表4 预测结果

Table4 The forecasting results

《2.3 样本集2与样本集3独立互预测》

2.3 样本集2与样本集3独立互预测

样本集2与样本集3作为两个独立的样本集,用相同的初始化公式对样本集分别进行初始化。以样本集2作为训练学习样本集,对样本集3进行预测,期望误差设定为0.0001,总共训练学习了23788次;以样本集3作为训练学习样本集,对样本集2进行预测,期望误差设定为0.0001,总共训练学习了13556次,两者的预测结果与误差见表5。

《表5》

表5 预测结果

Table5 The forecasting results

2.4 样本集2与样本集3作为一个样本集来预测

表7预测结果样本集2与样本集3进行统一初始化,以样本集2作为训练学习样本集,对样本集3进行预测,期望误差设定为0.0001,总共训练学习了22573次,预测结果见表6;样本集2中添加样本集3中第1个样本作为训练学习样本集,对样本集3的其余样本进行预测,期望误差设定为0.0001,总共训练学习了15294次,预测结果见表7;样本集2中添加样本集3中前3个样本作为训练学习样本集,对样本集3的其余样本进行预测,期望误差设定为0.0001,总共训练学习了37488次,预测结果见表8中的样本1~6,误差曲线见图1;样本集2中添加样本集3中前8个样本作为训练学习样本集,对样本集3中剩余的1个样本进行预测,期望误差设定为0.0001,总共训练学习了130428次,预测结果见表8中的样本7,误差曲线见图2。

《表6》

表6 预测结果

Table6 The forecasting results

《表7》

表7 预测结果

Table7 The forecasting results

《表8》

表8 预测结果

Table8 The forecasting results

《3 结果分析》

3 结果分析

有表4可知,以完备样本集训练学习,能够对与训练样本集相同因素和水平的样本进行很好的预测,精度较高,能满足工程需要;但是以不完备样本训练学习,即使只对与其构成完备样本集

《图1》

图1 误差曲线

Fig.1 The error curve

《图2》

图2 误差曲线

Fig.2 The error curve

的其中1个样本进行预测,精度也很差。这与正交实验所得完备样本集空间和信息的高度对称性和代表性有关。

由表5可知,样本集2能对样本集3以极高的精度进行预测,但是样本集3不能对样本集2进行预测。因为,通过方差分析可知,影响铸型干抗拉强度和干抗压强度的因素是磷酸与氧化铜粉用量的比值以及烘干温度与烘干时间的乘积,正交实验所得的样本集信息量的大小即由这两个因素决定。从表3和表2来看,样本集2中的磷酸与氧化铣粉用量的比值以及烘干温度与烘干时间的乘积两个量分别为0.6~1.5和16000~90000;样本集3中的磷酸与氧化铝粉用量的比值以及烘干温度与烘干时间的乘积两个量分别为0.67~1.5和16000~48000.因此,样本集2包含的重要信息量空间大于样本集3所包含的。BP神经网络只能在所包吾的空间中有很强的非线性映射能力,超出映射空间却无能为力,所以,以信息量大的样本集作为训练学习样本集去预测信息量小的样本集,精度很高;反之,则不行。

如果把样本集2与样本集3组合为1个样本集进行初始化,由表6可知,样本集2不能对样本集3进行预测,因为把两个样本集相合为一进行初始化,相当于把完备的正交空间中的信息分割给每个样本集,因而两个样本集中的信息都不完备,所以两者之间是不能进行互预测的。同样地,由表7和表8可知,其预测精度很差是可以理解的;由图1和图2的误差曲线可知,两个独立的正交实验样本集之间是不能进行统一初始化的。

《4 结论》

4 结论

1) BP神经网络有很强的非线性映射能力、能对它所训练过的样本集中的信息进行很好的学习,有很强的预测能力。

2) 由于正交实验所得的样本集在空间的高度代表性和信息全面性,因而用完备的正交实验样本集可以对与其影响因素和水平相同的样本以很高的精度进行预测;用信息量大的样本集能很好地对信息量小的样本集进行预测,精度也很高,而信息量小的样本集不能对信息量大的样本集进行预测。

3) 完备的正交实验样本集是实验设计的基本单元,通过人工神经网络完全可以在计算机上进行实验设计,这给科研人员提供了新的实验设计思路,从而大大节省时间和劳力。