工具之家 > 现代电子技术 > 基于多核学习SVM的图像分类识别算法

基于多核学习SVM的图像分类识别算法

发布时间:2019-06-12 02:15:00 文章来源:工具之家    

 推荐工具:金融理财app工具实用工具

李红丽+许春香+马耀锋

摘 要 针对单hezhichi向量机zaitu像fen类shibiezhongjiancejingdu较低dewen题tichu一zhong多hexuexiSVMde图像分类识别算fa并将其yingyong到xing人jian测问题中首先ti取xing人de积分tongdaotezheng包括梯度直方图、彩色tongdaohe梯度te征;然hou使yong直方图交chahe、多xiang式he和jing向jihe构jianhun合核SVM分类器;最后使用交叉验证和wangge搜索defangfa确ding各zhong核的融合xi数zaiTUD数据集shang的测试jieguobiao明该方fa具有较好的lubang性和较高的检测jing度

关键词 支持向量机; 多核学习; 行人检测; 图像识别; 直方图交叉核; 交叉验证

中图分类号: TN911.73?34; TP311 文献标识码: A 文章编号: 14?373X201806?0050?03

Abstract: In allusion to the problem that the single kernel support vector machine SVM has low detection precision in image classification and recognition an image classification and recognition algorithm based on multi?kernel learning SVM is proposed and applied to the pedestrian detection problem. The pedestrians integral channel features including the gradient histogram the color channel and the gradient feature are extracted. The hybrid kernel SVM classifier is constructed by using the histogram cross kernel, the polynomial kernel, and the radial basis kernel. The methods of cross validation and grid search are used to determine the fusion coefficients of various kernels. The results from the TUD dataset test show that the method has good robustness and high detection precision.

Keywords: SVM; multi?kernel learning; pedestrian detection; image recognition; histogram cross kernel; cross validation

核学习是一种yi核函数和统ji学习li论为基础的机器学习方fa[1],该方法通常包括核函数的选择与构造、使用核函数构建分类器两个bu分[2]。使用核学习方法可以避免显式计算低维kong间的yang本到高weikong间的映射,直接将樣本转化为高维空间的点积[3]。

支持向量机[4](Support Vector Machine,SVM)的本质为核方法,在jie决非xianxing、小样本和高维模式识别问题中表现chu了诸多优势。SVM的fa展促jin了核学习方法,xiang继出现了核Fisher判别方法、核zhu成份分析方法、核判别分析以及核独li分量分析[5?7]等。核方法被广泛ying用于求解高维、动态、数量多和含噪声等问题中。

然而,每一种核均存在较大的差异,对ying于不同的应用场合,目前还没有完备的选择核函数的理论依据。选择与设计适合给定问题核函数,是核方法和SVM共同面临的问题。当数据样本存在多维数据不规ze、含异构信息或高维空间分布不平坦等问题时,难以使yongdan一的核函数映射处理所有样本。因此,众多文献提出了基于混合核或组合核的方法,即多核学习的方法。如文献[8]组合使用径向基核函数和多项式核lai提高SVM的分类精度;文献[9]使用多核SVM实现了短语音说话人识别系统;文献[10]使用混合核最小二乘法支持向量机实现了损伤检测,并huo取了比单径向基核更高的泛化能力与精度。基于以上分析,本文提出了一种多核学习SVMsuanfa,并将其应用到行人检测问题中。首先,提取行人的积分通道te征包括梯度直方图、彩色通道和梯度特征;然后,使用直方图交叉核、多项式核函数和径向基核函数构建混合核SVM分类器;最后在TUD数据集上的检测jie果表明,该方法具有较好的鲁棒性和较高的检测精度。

1 行人特征提取

积分通道特征即使用积分图ji术加快特征提取的su度,且融合后的特征相对于HOG特征具有更高的判别能力。积分通道特征具有参数少、来自颜色和梯度等不同的特征源,且检测时能准确定位等特点。

本文使用梯度直方图、彩色通道和梯度特征,这些特征均是对输入图像的线性或非线性变换de到的。特征计算过程如下:

1) 使用线性和非线性变换得到10个不同的通道;

2) 在给定的通道对多个30×30大小的ju形框求和得到一组值;

3) 从每个通道中随机选取200个矩形框,最终得到一个2 000维的特征向量。

系统的检测精度会随着所选取的矩形框数量的增加而增长,但系统的yun行时间与特征的维度也会相应增加。本文实验结果表明,选取200个和250个矩形框时检测精度基本相同,且对于240×320分辨率的输入图像分别可以得到2 000维和2 500维特征,而消hao的时间分别为0.026 s和0.034 s。因此,本文对每张图片提取200个矩形框。endprint

2 多核SVM算法

使用核函数的基本性质可以将一些常用的核函数按照一定的模板组合成新的核函数。假设,有定yi在[X?X]([X?Rm])上的核函数[k1x,x)]和[k2(x,x′)],则式(1式(3)均为核函数:

[k(x,x′)=k1(x,x′)+k2(x,x′)] (1)

[k(x,x′)=k1(x,x′)k2(x,x′)] (2)

[k(x,x′)=ak1(x,x′), a?R+] (3)

选取合适的核函数可以获得更强大的泛化能力,本文通过对多种基本核函数jinxing加权来构造混合核函数,加权方式如下:

[k(x,x′)=p=1Umpkp(x,x′),p=1Ump=1, mp0, p=1,2,…,U] (4)

式中:[kp]为核函数;[mp]为[kp]所对应的权重,各种核函数的权重总和为1。由文献[8]可知,式(4)man足Mercer条件,因此可以用于SVM。从式(4)可知,通过调整权重值来获得不同性能的混合核函数,从而可以更灵活地调节混合核的学习能力,提升分类性neng

3 基于多核SVM的行人检测

目前,众多文献使用SVM进行行人检测,但大多是在特征提取阶段做工zuo,最后直接使用SVM分类器作为识别工具来检测行人;也有文献通过调整参数、寻zhaozui优参数或增加cheng罚项系数C来提升SVM的分类性能。但这些方法只是用单一核函数,而并未考虑到单一核函数的局限性,如径向基核函数的分类结果仅与样本间的角度有关;多项式核函数虽具有较强的泛化能力,但当阶数增加时系统复杂性也急剧增加。因此,本文使用混合核函数来提高SVM的学习能力,文中选取的核函数如表1suo示。

具体的行人检测过程包括:行人特征的提取、核函数参数的设置、使用网格搜索寻找最优参数和分类器的训练。本文,首先提取行人的积分通道特征。然后,确定混合核函数的形式及其参数的选择范围,这里使用网格搜索的方法调整核函数decan数和SVM的惩罚项C,并使用交叉验证的方式固定参数,通过比较不同的测试结果得到最优的参数设置。本文构建的混合核函数具有3种核函数的优点,jian具学习能力和泛化能力。

4 实验与结果分析

为了验证本文算法的有效性,在TUD[11]数据集上进行仿真测试,并从鲁棒性和实时性两个方面与传统的HOG+SVM算法[12]、多尺度HOG算法[13]以及HIKSVM算法[14]进行比较。本文程序使用Visual C++和OpenCV库开发,在CPU 2.30 GHz,64位Windows 10系统上进行性能测试。首先,比较本文提出的积分通道特征在不同核SVM上的性能,其结果如图1所示。从图1中可以看出,积分通道特征在多项式核SVM和径向基核SVM上效果较为理想。图2为本文方fazaiTUD数据集上的测试结果。从图2可以看出,本文算法获得了较高的检测精度,和 HOG+SVM算法相比,提高9%;和多尺度HOG算法相比提高2%;和HIKSVM算法相比提高4%。由實验结果可看出,使用多核融合的学习方法能明显提升SVM的性能。图3为本文的检测示例。

5 结 语

单核支持向量机在图像分类识别问题中通常具有较低的鲁棒性和检测精度,本文提出一种多核学习SVM的图像分类识别算法,并将其应用到行人的检测问题中。首先,提取行人的积分通道特征,包括梯度直方图、彩色通道和梯度特征;然后,使用直方图交叉核、多项式核和径向基核构建混合核SVM分类器;最终,使用交叉验证和网格搜索的方法确定各种核的融合系数。在TUD数据集上的测试结果表明,该方法具有较好的鲁棒性和较高的检测精度。

参考文献

[1] 汪洪桥,孙富春,蔡艳宁deng.多核学习方法[J].自动化学报,2010,36(8):1037?1050.

WANG Hongqiao, SUN Fuchun, CAI Yanning, et al. On multiple kernel learning methods [J]. Acta automatica sinica, 2010, 36(8): 1037?1050.

[2] 尹玉娟,王媚,zhangjin江,等.一种自主核优化的二值粒子群优化?多核学习支持向量机变压器故障诊断方法[J].电网技术,2012,36(7):249?254.

YIN Yujuan, WANG Mei, ZHANG Jinjiang, et al. An autonomic kernel optimization method to diagnose transformer faults by multi?kernel learning support vector classifier based on binary particle swarm optimization [J]. Power system technology, 2012, 36(7): 249?254.

[3] shi逸fei,熊岳山,谢智歌,等.基于多核学习的快速网格分割算法[J].计算机辅助设计与图形学学报,2015,27(11):2031?2038.

SHI Yifei, XIONG Yueshan, XIE Zhige, et al. Fast mesh segmentation based on multiple kernel learning [J]. Journal of computer?aided design & computer graphics, 2015, 27(11): 2031?2038.endprint

[4] 丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综shu[J].电子科技大学学报,2011,40(1):2?10.

DING Shifei, QI Bingjuan, TAN Hongyan. An overview on theory and algorithm of support vector machines [J]. Journal of University of Electronic Science and Technology of China, 2011, 40(1): 2?10.

[5] 毛临川,吴根秀,吴恒,等.基于信息增益的最优组合因子Fisher判别法[J].计算机工程与应用,2016,52(19):94?96.

MAO Linchuan, WU Genxiu, WU Heng, et al. Optimal combination of factor Fisher discrimination method based on information gain [J]. Computer engineering and applications, 2016, 52(19): 94?96.

[6] 刘君,黄燕琪,熊邦书.融合核主成分分析和最小距离鉴别投影的人脸识别算法[J].计算机工程,2016,42(4):221?225.

LIU Jun, HUANG Yanqi, XIONG Bangshu. Face recognition algorithm fused kernel principal component analysis and minimum distance discriminant projection [J]. Computer engineering, 2016, 42(4): 221?225.

[7] 杨雪萍,杨洪耕,马晓yang,等.基于核独立分量分析的谐波责任划分[J].电力系统及其自动化学报,2016,28(12):109?114.

YANG Xueping, YANG Honggeng, MA Xiaoyang, et al. Determination of harmonic contributions based on kernel independent component analysis [J]. Proceedings of the CSU?EPSA, 2016, 28(12): 109?114.

[8] 姜晓庆,夏克文,林永liang.使用二次特征选择及核融合的语音情感识别[J].计算机工程与应用,2017,53(3):7?11.

JIANG Xiaoqing, XIA Kewen, LIN Yongliang. Speech emotion recognition using secondary feature selection and kernel fusion [J]. Computer engineering and applications, 2017, 53(3): 7?11.

[9] 谭熊,余旭初,秦进春,等.高光谱影像的多核SVM分类[J].仪器仪表学报,2014,35(2):405?411.

TAN Xiong, YU Xuchu, QIN Jinchun, et al. Multiple kernel SVM classification for hyperspectral images [J]. Chinese journal of scientific instrument, 2014, 35(2): 405?411.

[10] ARMAND R, CHERUBINI C, TUDURI J, et al. Rare earth elements in French stream waters ? revisiting the geochemical continental cycle using FOREGS dataset [J]. Journal of geochemical exploration, 2015, 157: 132?142.

[11] YAO C, WU F, CHEN H J, et al. Traffic sign recognition using HOG?SVM and grid search [C]// Proceedings of International Conference on Signal Processing. Hangzhou: IEEE, 2014: 962?965.

[12] 傅智勇.HOG+SVM行人检测算法在DM6437上的实现与优化[D].广州:华南理工大学,2012.

FU Zhiyong. Realization and optimization of HOG+SVM pedestrian detection algorithm on DM6437 [D]. Guangzhou: South China University of Technology, 2012.

[13] 丁跃.多核支持向量机及其在人脸识别中的应用[D].重庆:重庆大学,2014.

DING Yue. Multiple kernel support vector machine and its application in face recognition [D]. Chongqing: Chongqing University, 2014.

[14] 周余,刘娟,卢笑,等.一种联合文本和图像信息的行人检测方法[J].电子学报,2017,45(1):140?146.

ZHOU Xuanyu, LIU Juan, LU Xiao, et al. A method for pedestrian detection by combining textual and visual information [J]. Acta electronica sinica, 2017, 45(1): 140?146.endprint

现dai电子技术 2018年6qi

现代电子技术的其ta文章 基于Matlab/Simulink的电离层探测系统仿真设计 融合微聚集隐私保护的协同过滤算法研究 基于知识图谱的高铁动车设备检测系统的本体框架构建与维护 基于ASP.NET的在线运动课程编排系统设计 基于图像增强和复原的图像去雾方法研究 改进D*Lite算法在虚nishi兵路径规划中的应用
转载请注明来源。原文地址:https://www.5420.com.cn/view/2019/0612/17376/
 与本篇相关的热门内容: