RBF网络在心血管危险分层中的应用
发表时间:2011-07-11 浏览次数:419次
作者:隋美蓉,宁刚民 作者单位:1.徐州医学院医学影像学院,徐州 221002;2.浙江大学生物医学工程与仪器科学学院,杭州 310027
【摘要】 为了提高高血压患者心血管危险分层的正确率,从而进行有效的心血管危险评估。我们将径向基函数(radial basis Function,RBF)神经网络运用于心血管危险分层中,通过和浙江大学校医院联合,对970多例体检者(包括高血压患者)进行问卷调查,并应用超声Doppler心功能检测仪和血压仪进行临床检查,获取高血压患者相关参数数据,从中筛选12个参数作为网络输入,心血管的4个危险层次作为网络输出。结果表明:随机选用400例样本作为网络训练样本,300例样本作为测试样本,参照国际惯用的心血管危险分层标准,网络模型分类正确率达到了95.67%。相比调查中大中城市基层医生28%的心血管危险分层正确率,明显提高了危险分层的准确率,试验结果证明了该方法的可靠性和实用性。
【关键词】 RBF网络,心功能,心血管危险分层,样本训练,网络测试
Abstract:This paper aims to improve the accuracy of stratification for cardiovascular risk.Radial basis function network was applied to stratify the level of cardiovacular risk. Combined with hospital of Zhejiang University, experimental data of 970 peoples were obtained by investigation questionnaires and clinical examinations. Twelve parametres were selected as network input and four cardiovascular stratification levels as output. Results showed that 400 training samples and 300 testing samples were included in the network model. The results of model stratification were consistent with the standard stratification suggested by hypertention guidelines in 95.67% cases.The testing results confirm the accuracy of the method and show its ability in evaluation of cardivascular risk.
Key words:Radial basis function network,Cardiac function,Cardiovascular risk stratification,Sample training,Network testing
1 引 言
心血管疾病是高血压患者最重要的危险因素,医师可以根据心血管危险分层确定高血压患者的治疗方案,量化地估计其预后情况,确定其随诊间隔等[1]。虽然中国高血压防治指南(2005年修订版)中对心血管危险分层的影响因素、等级划分都有详细说明,但由于医师对高血压病的诊治知识和临床经验不同,临床中心血管危险分层的准确率并不高。一些调查结果显示,大中城市基层医生对高血压患者进行心血管危险分层的正确率只有28%[2]。
为了进一步加强心血管病的研究,本研究小组通过和浙江大学校医院联合,对受试者进行问卷调查,详细记录其病史、症状、生活习惯和治疗史等,并应用超声Doppler心功能检测仪(USCOM,澳大利亚USCOM公司),自制设备和血压仪(EW3103,日本Panasonic公司)进行心功能和外周血管检查。主要参数包括:收缩压(SBP)、舒张压(DBP)、心率(HR)、血流速度峰值(Vpk)、平均压力梯度(Pmm)、射血时间比例(ETper)、速度时间积分(Vti)、射血时间(ET)、单个红细胞每分钟流过的距离(MD)、每搏输出量(SV)、心输出量(CO)、心指数(CI)、左室射血分数(LVEF)、硬化指数(SI)、左心工作指数(LCWI)和外周血管阻力指数(SVRI)、脉搏波传导速度(PWV)、HR(ECG+PPG)等。研究小组成员已经开发设计出一套数据库程序对获取数据进行计算机管理。
本次实验在此基础上,对数据库中的大量数据进行分析,运用RBF神经网络建立心血管危险分层方法,以期提高高血压患者心血管危险分层的正确率,进行有效的心血管危险评估。
2 方法
RBF网络是一种非线性的多层前向人工神经网络,是1988年由Head和Lowe最先提出的[3]。网络结构类似于三层BP网络,由输入层、隐含层、输出层组成。输入层由信号源结点组成,只传递输入信号到隐含层;隐含层传递函数是径向基函数,常用高斯函数;输出层节点通常是简单的线性函数。图1给出了一个简单的多输入单输出且具有K个隐含层神经元的RBF网络模型的结构图[4-6]。
RBF网络的基本思想[6]是:利用RBF作为隐含层神经元的“基”,构成隐含层空间,这样就可将输入矢量直接(即不通过权连接)影射到隐含层空间。当RBF的中心确定后,这种映射关系也就确定了。而隐含层空间到输出层空间的映射是线性的,即网络的输出是隐含层神经元的线性加权和,此处的权值为网络可调参数。总体而言,网络由输入到输出的映射是非线性的,而网络对可调参数而言是线性的,这样网络的权值就可由线性方程组解出或用递推最小二乘法计算,从而明显加快学习速度并避免局部极小的问题。
将RBF神经网络运用于分类问题,主要是基于非线性可分的原则[7-8],即通过一个非线性映射将样本点投影到一个特征空间使之线性可分。RBF神经网络和BP(Back Propagation)网络都有很强的非线性逼近能力和分类能力。然而与BP网络相比,RBF不仅网络结构更为简单,而且在非线性逼近能力、网络学习速度等方面均优于BP网络[9-13]。
2.1 网络输入
由于采集参数众多,如果所有参数都作为网络输入,显然太多了,而且有很多信息重复。因此,本研究首先对采集到的数据进行筛选、删除等预处理,然后运用聚类和方差分析等方法,筛选出SBP、DBP、PWV、SVRI、CO、LCWI、Vpk、HR(心功能)、ETper、Age(年龄)、BMI(体重指数)、Smoke(吸烟)等12个参数作为网络输入。
2.2 网络输出
根据改进的欧洲2003标准[14],将试验样本心血管危险分成暂无危险、低危、中危和高危四个危险层次(由于样本数据中,“很高危”患者例数很少,所以将其并在“高危”中处理),分别用0、1、2、3来表示,作为网络输出。
2.3 网络训练
随机选用400例样本作为网络训练样本,300例样本作为测试样本,表1给出了样本的心血管危险层次分布情况。表1 试验样本心血管危险层次分布情况
2.3.1 样本训练 为了提高效率和解题质量,本研究利用Matlab中的神经网络工具箱来设计RBF网络,网络设计之前首先介绍Matlab自带的两个函数:
(1)径向基神经网络设计函数newrb:该函数用于设计一个RBF网络,其格式是net=newrb(P,T,goal,spread),其中P、T分别为输入、目标矢量;goal为设计的均方误差,默认值为0;spread为径向基函数的扩展常数。用径向基函数逼近函数时,newrb可自动增加RBF网络的隐含层神经元,直到均方误差满足为止。
(2)网络仿真函数sim:该函数用于对网络的仿真,运用sim函数来产生相应的网络输出值,其格式为Y=sim(net,X),X、Y分别对应网络net的输入、输出。
经过多次试验(见表2),选取检验误差最小且误差平方和较小时的扩展常数碎片spread=1.25,目标误差goal=0.01,建立RBF网络并进行训练,图2给出了网络训练过程。表2 不同扩展常数下的四分类RBF网络检验误差
2.4 网络仿真及测试
应用上面建立的RBF网络对300例样本进行仿真测试,结果见表3。
从表3看出,网络模型总的分类正确率达到了95.67%,危险层次0、1、2和3的分类正确率分别为97.73%、96.59%、94%和100%。
3 讨论
心血管危险分层对高血压病的诊治有着重要的意义。然而在传统的临床方法中,心血管危险分层的准确率并不高,尤其是基层医生正确分层率只有28%。本研究运用RBF神经网络建立的网络模型分类正确率达到了95.67%,主要取决于模型的客观性和强大的分类能力。表3 仿真测试结果注:“合计”行、列括号内的百分比皆为 相应表格内数值/300。
“分类正确率”一列中黑体部分括号内的百分比分别等于 各类正确预测样本数/相应类别样本总数。
“分类错误率”一列中黑体部分括号内的百分比分别等于 各类错误预测样本数/相应类别样本总数。
首先,试验数据都是通过准确严格的临床检查获得的,医生的知识水平和主观经验影响不大。
其次,RBF神经网络具有很强的分类能力,利用它建立模型,无须明确掌握系统的具体结构。正如RBF网络在心血管危险分层中的运用,并不需要对心血管系统的具体结构完全了解,只需将心血管参数及人体的其它一些信息作为模型输入,心血管危险分层作为输出,经过网络训练,就可建立一个完整的网络模型,应用于心血管危险分层中。
本研究利用RBF神经网络进行心血管危险分层,为临床诊治提供一种新的思路和方法,该模型还在进一步研究中。
【参考文献】
[1]《中国高血压防治指南》修订委员会. 中国高血压防治指南(2005年修订版)[M]. 北京:人民卫生出版社,2006.
[2]王文化、赵冬.754名基层医生高血压病临床知识和实际诊断处理能力的研究[J].中华流行病学杂志,2003,24(12):1086-1089.
[3]张立明.人工神经网络的模型及其应用[M].上海,复旦大学出版社,1993:15-75.
[4]Xueqiang Liu,Xiaoguang Chen,Wenfu Wu,et al.A neural network for predicting moisture content of grain drying processs using genetic algorithm[J]. Food Control,2007,18:928-933.
[5]徐强恩,罗四维.径向基函数神经网络的一种在线学习算法[J].北方交通大学学报,2003,27:90-92.
[6] Antonino Staiano, Roberto Tagliaferri, Pedrycz W. Improving RBF networks performance in regression tasks by means of a supervised fuzzy clustering [J]. Neurocomputing, 2006,69: 1570-1581.
[7]阎平凡,张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社,2000:40,6-7.
[8]周志明,王以治,黄文芝,等.基于小波和支持向量机的人脸识别技术[J].计算机工程与应用,2004,12:52-54.
[9]张嵩,汪元美.基于广义径向基函数神经网络的非线性时间序列预测器[J].电子科学学刊,2000,22 (6):965-1202.
[10]Park J,Sandberg IW.Approximation and radial-basis-function networks[J].Neural Computation, 1993,5(2):305-316.
[11]马玉梅.径向基神经网络的逼近问题[J].大连民族学院学报,2006,5:65-69.
[12]Langoni D, Weatherspoon H M. A speed and accuracy test of back-propagation and RBF neural networks for small-signal models of active devices[J]. Engineering Applications of Artifical Intelligence,2006,19:883-890.
[13]刘柏森,刘美佳,秦进平.RBF网络在逼近能力方面的探讨[J].科技与经济,2006,1(33):81-82.
[14]Mancia G, Rosei EA, Cifkova R,et al. 2003 European Society of Hypertension-European Society of Cardiology guidelines for the management of arterial hypertension[J]. J Hypertens,2003,21:1011-1053.