首页 理论教育 特征选择算法结果及讨论介绍

特征选择算法结果及讨论介绍

时间:2023-06-21 理论教育 版权反馈
【摘要】:图2-10 传统GA和改进GA中,迭代次数与评价函数值对应关系a)改进GA b)传统GA2.检测效果及讨论对图2-5a的肺内高亮区域做圆点滤波器操作后,产生了太多的候选点,为下一步的去假阳操作增加了负担,也使得去假阳算法的速度慢。基于表2-4中的实验结果,可以进行如下讨论:1)由于该算法是用来辅助医生检测肺结节的,医生还要对于算法检测出来的每个结节做出最后的结论。

特征选择算法结果及讨论介绍

1.特征选择算法结果及讨论

表2-3为传统GA、改进GA、SS性能比较。图2-9是传统GA和改进GA中,特征集个数与评估函数对应关系曲线图。图2-10是传统GA和改进GA中,迭代次数与评价函数对应关系曲线图。

2-3 传统GA、改进GA、SS性能比较

978-7-111-59701-8-Chapter02-13.jpg

从表2-3中可以看出,改进GA比传统的GA虽然搜索解的时间更长,但搜索的解更优(特异性更好)。SS算法比改进GA搜索解的时间短,同时搜索的解更优(特异性更好)。说明改进GA和SS算法起到了作用,也验证了当特征不独立时,类别可分离判据不具有可加性。同时,最优解中包含用于区分血管端点和孤立型结节的新提出的计算VOI中待判断物体在XYYZXZ方向上各层像素个数的方差,取其三者最小值的特征;还包括用于区分血管交叉点和粘连血管型结节的新提出的计算内切球像素个数/待判断物体总像素个数的特征,表明这两种新提出的特征的必要性和有效性。虽然训练分类器的时间较长,但是因是在离线状态下进行的,故测试时间仍在医生可以忍受的范围内。

978-7-111-59701-8-Chapter02-14.jpg

图2-9 传统GA和改进GA中,特征集个数与评估函数值对应关系

a)改进GA b)传统GA

从图2-9中可以看出,改进GA在用较小特征个数就能得到比传统GA还要好的效果。进一步验证了,如果特征集合中的各个特征都相互独立,特征集合的个数越多,识别效果越好;如果特征集合中的各个特征不相互独立,或者相关性强,特征集合的个数就不一定越多越好。从图2-10中可以看出,改进GA经过更少的迭代次数就能搜索到最优解。

978-7-111-59701-8-Chapter02-15.jpg

图2-10 传统GA和改进GA中,迭代次数与评价函数值对应关系

a)改进GA b)传统GA

2.检测效果及讨论

对图2-5a的肺内高亮区域做圆点滤波器操作后,产生了太多的候选点,为下一步的去假阳操作增加了负担,也使得去假阳算法的速度慢。因此,需要利用阈值筛掉部分“候选点”。设肺内高亮区域做圆点滤波器操作后像素最大的灰度值为maxValue,则阈值为τ=maxValue·k,其中k∈[0,1]。图2-11a、b和c分别为当k=0.1、k=0.15和k=0.2时肺内高亮区域进行圆点滤波器操作后的“候选点”。可以看出,对于同一个提取“候选点”算法,k值越大,候选点就越少,也就易造成漏检;但假阳性率也少了,提取“候选点”算法的时间会变短。相反,如果k值越小,候选点就越多,这样就不容易造成漏检,但假阳性率又高了,提取“候选点”算法的时间则会变长。

978-7-111-59701-8-Chapter02-16.jpg

图2-11 k取不同值时获得的“候选点”

a)k=0.1 b)k=0.15 c)k=0.2

因为检测算法只包括两部分:提取结节“候选点”算法和去假阳算法,所以漏检一定是由这两部分原因造成的。而提取“候选点”导致漏检率和去假阳导致漏检率之和为1。

“候选点”提取导致的漏检率=“候选点”提取导致漏检结节个数/总的漏检结节个数。

去假阳导致漏检率=去假阳导致漏检结节个数/总的漏检结节个数。

忽略“候选点”因素敏感性=(算法检出结节个数+提取“候选点”导致漏检结节个数×去假阳导致漏检率)/总结节个数。该属性是为了衡量检测算法去假阳部分的效果是否和提取结节“候选点”算法有关。(www.xing528.com)

基于表2-4中的实验结果,可以进行如下讨论:

1)由于该算法是用来辅助医生检测肺结节的,医生还要对于算法检测出来的每个结节做出最后的结论。所以,医生更倾向于漏检率低的算法,即k=0.15的效果(比k=0.2的效果)更是医生需要的。

2)通过分别分析k=0.15和k=0.2的敏感性、假阳个数(套)和运行时间,得知k值越小,“候选点”的个数就越多,敏感性就越好,漏检率越低,假阳个数(套)也就越多,运行时间也越长;反之亦然。所以,检测算法需要取得敏感性和假阳个数(套)的平衡点。当然,如果k值太小,假阳过多,也会给医生带来负担。

3)从k=0.15和k=0.2的忽略“候选点”因素敏感性这一属性值基本相同可以看出,该检测算法的去假阳部分算法的效果与提取结节“候选点”数量这个参数无关。也就是说,该检测算法的去假阳部分算法的效果与提取结节“候选点”算法无关。从k=0.15和k=0.2的提取“候选点”导致漏检率和去假阳导致漏检率的属性值,说明要想同时提高敏感性和特异性,需要从更好的提取结节“候选点”算法和去假阳算法出发,而不是单纯的调节“候选点”数目这一参数。

2-4 取不同k值时评价指标值

978-7-111-59701-8-Chapter02-17.jpg

对于每个漏检的结节,分析其中的原因如下:①结节体积小并且结节上的像素CT值暗(在-500Hu以下),造成圆点滤波器没有滤出该结节,8个漏检结节属于这一种原因;②扁平椭圆状的结节,跨度仅两层且各层像素个数的方差小,不满足第20种特征,这种原因造成8个结节漏检;③如果粘连血管型结节上的像素CT值暗(在-500Hu以下),造成粘连血管型结节初始候选区域小,就会使得VOI过大,第21种特征取值过小,从而和血管交叉点相混淆,10个漏检结节属于这种原因。

从表2-5可以看出,飞利浦产品的敏感性虽然高达100%,但是特异性过低,造成假阳个数太多。GE产品的优点是不但能检测出实心结节而且还能检测出GGO结节。通过比较,综合考虑测试数据量、敏感性和假阳个数(套),本章算法都达到了最好的状态。

2-5 本章检测算法与各产品比较

978-7-111-59701-8-Chapter02-18.jpg

978-7-111-59701-8-Chapter02-19.jpg

图2-12 体积较大结节的检测结果

该算法不但可以检测出体积较大的结节(如直径在1~3cm之间),对于体积较小的结节(如直径在1cm之下)也是敏感的。该算法不但能检测孤立型结节还能检测粘连血管型结节(图2-12~图2-15)。图2-12中的结节为体积较大的粘连血管型结节,图2-13中的是粘连血管型结节,图2-14中为孤立型结节,图2-15中为粘连血管型小结节。图2-12~图2-15中各个图的左上、左下和右上分别为冠状面、横断面和矢状面视图,圈标示为结节。右下为三维可视化视图结果,枝状代表血管,团状代表结节。

978-7-111-59701-8-Chapter02-20.jpg

图2-13 粘连血管型结节检测结果

978-7-111-59701-8-Chapter02-21.jpg

图2-14 孤立型结节检测结果

978-7-111-59701-8-Chapter02-22.jpg

图2-15 小体积结节检测结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈