当前位置: 手机论文网>医药学类>中医学>

基于LVQ神经网络的微钙化分类方法

阅读技巧m.Lw54.com 手机论文网

论文导读::数字化的乳腺X光片仍然是乳腺癌检测的可靠工具,X光片中出现的微钙化点是癌症的主要标志。本文提出了一个基于自适应的学习矢量量化神经网路(LVQ)的乳腺癌良恶性分类方法,该方法在提取特征向量的基础上对CC和MLO两种视图的良性和恶性数字化乳腺X光片图像进行训练和测试,分类结果使用最佳分类率和平均分类率来说明。实验结果表明本文方法对CC视图的图象的平均测试分类率为92.6%,而对MLO视图是93.18%。在微钙化分类系统中采用逻辑或的方式用于合并两种不同的视图下的网络,合并后的网络可以获得的最佳分类性能是94.8%。
论文关键词:微钙化点良恶性分类,肿瘤模式识别,学习矢量量化神经网络,敏感度,特异度

  1 引言
  随着早期检测的重视,近年来乳腺癌的死亡率有降低的趋势,但仅是在欧美国家,比如美国癌症协会ACS建议40-50岁之间的妇女每隔一年就做一次X光片的早期检查,而对50岁以上的则要求一年一次[1]。在过去的十年里中国的乳腺癌诊断病例以每年3%的比例在增长,这个比例已高于西方国家[2],并且呈年轻化的趋势,这可能归结于环境的变化、饮食结构等改变。
  本文的主要工作是提出将微钙化簇分类为良性或恶性的分类算法。分类算法包括4个步骤:(1)从DDSM数据库中获取研究对象,并修改图像格式和尺寸;(2)从数据库相关说明文件中提取病灶区域;(3)提取有效的特征向量;(4)对CC和MLO两种视图的图像使用LVQ神经网络分别训练和测试获得最佳的分类率;(5)使用逻辑或操作计算最后的分类结果,即如果认为任何一个视图下的图像是恶性的,那该病人的病灶性质就是恶性的。
  2 图像预处理及特征提取
  2.1 图像数据库和预处理
  本文采用的试验数据库是南佛罗里达州立大学提供的乳腺癌诊断图DDSM数据库,该数据库可以在该大学的网站上免费下载[3],该数据库中每个病人有四张图像,分别是cc和mlo视图下的左右乳腺组织图像,所有的图像都是使用LJPEG格式进行压缩,这样保证了不丢失任何图像细节敏感度,但因此图像尺寸也非常大,而CAD系统要能快速检测并具备高准确度,对一个模式识别系统来说,低分辨率图像是高效和可行的[4]。所以,要对图像的尺寸进行修改,同时尽可能地保留图像的细节。下面是图像预处理的步骤:(1)先将LJPEG格式图像进行解压缩,将DDSM中的LJPEG格式的图像转换成12位的TIFF格式的图像,使得其可以在MATLAB中进行后续处理[5];(2)将它转换成8位格式图像;(3)人工去除黑色背景,提取乳腺区域;(4)选择在使用双线性插值算法进行图像映射,修改图像尺寸为300*200像素,这样在减小图像的尺寸的同时避免图像失真。
  

  如果,则
  (2)
  否则,当,有
  (3)
  对于其他神经元,保持权值不变论文开题报告范例。
  第六步:调整学习速率,LVQ 算法中学习速率是个很重要的参数,它影响算法的稳定性和权值收敛的速度,是LVQ 神经网络训练过程中需要重点考虑的参数。在定义学习速率的时候要贯彻快速稳定的原则,这里我们采用自适应学习速率定义方法:一般来说,学习速率的选择需要考虑的是,在迭代的初始时刻选择较大的值,然后,随着迭代的进行,线性或非线性地降到0。
  在初始阶段,通常取较大的值,表示算法迅速修正较大的误分类权值,随着时间的进行,越来越小,表明使用较小的学习系数(缓慢的自适应)来修正较小的误分类权值,以至在学习完成后,误分类的样本数得到最少。使用自适应学习速率,神经网络的权值在刚开始快些收敛,结束时保证权值相对稳定,因此它比定学习速率有较快的收敛速率和更高的稳定性。
  第七步:判断迭代次数是否超过T,如果就转到第三步,否则就结束迭代过程。
  对40张cc和mlo视图上的图像(其中CC和MLO视图上的图像各20张敏感度,包括10张恶性,10张良性,并且左右视图各对半即5张)进行训练,获得了最佳的学习模式。对另外200个案例(良恶性各100张),对不同两种视图分开来进行良恶性组织的分类的测试。为了降低漏掉真阳性案例的可能性,对两种视图下的神经网络分类效果使用逻辑或的方式进行处理,就是如果任何一种视图(cc或mlo)网络分类器将图像病灶分类成是恶性的,那么就认为该病例是恶性的,否则,就认为是正常或良性的图像。
  4 实验结果
  使用MATLAB进行仿真计算,实验结果表明完成的测试集在cc和mlo视图上各自平均分类性能是92.6%和93.18%。整合的系统的平均分类性能略微的降低到91.84%(如表1),而最佳分类性能是94.8%。
  表1 240个DDSM案例的神经网络训练和测试结果
  

使用双线性插值算法,修改图像尺寸为300*200像素大小

转载请注明来源。原文地址:http://m.lw54.com/html/Medicine/zhongyi/20181219/8034442.html   


CC视图

MLO视图

整合两个视图的网络

训练图像数=20

训练图像数=100

训练图像数=20

训练图像数=100

训练图像数=40

训练图像数=100

测试图像数=100

测试图像数=20

测试图像数=100

测试图像数=20

测试图像数=200

测试图像数=20

训练集的分类率

最佳分类率

100

100

100

100



平均分类率

97.13

98.63

95.8

96.68



标准偏差

1.93

1.36

3.42

2.60



测试集的分类率

最佳分类率

93

100

94

100

94.8

100

平均分类率

92.6

92.38

93.18

94.75

91.84

93.75

标准偏差

0.46

2.16

0.447

1.82

1.3865

2.1826