基于ARMA模型的ECG分类和压缩
心电信号(ECG)是医生进行诊断的重要依据,关于ECG的分类已有许多现有技术,但现存许多ECG分类技术存在实现困难、处理时间长和只能对2~3类ECG进行分类的不足,如相关波形法(CWA)[1]、直接ECG特征检测法[2]、傅立叶变换法[3]、功率谱分析法[4]、复杂度测量法[5]、TLS(TotalLeast Squares)Prony建模法[6]、自适应卡尔曼滤波器法[7]、使用LPC系数和模糊ARTMAP神经网络分类法等[8]。
本文介绍了基于ARMA模型的ECG分类方法,ARMA系数被作为特征来进行ECG的分类,在分类时,采用了二次判别函数分类法[9]。ARMA建模技术有着容易实现、处理快速和同时能对多类ECG进行分类的优点。本文利用ARMA建模技术对MIT-BIH标准数据库中的以下几类ECG进行了分类测试:正常窦性心律(NSR)、心房早期收缩(APC)、心室早期收缩(PVC)、室上性心动过速(SVT)、心室性心动过速(VT)和心室纤维性颤动(VF)。结果表明,该方法可获得94.28%~99.28%的分类精度。
ECG的压缩方法对计算机辅助远程自动诊断的快速性有着直接的影响。ECG的压缩方法可分为三类[10]:①直接方法,该方法计算简单而且效率很高,但计算机辅助远程自动诊断必须在信号重建、特征提取以后才能进行,这便造成诊断工作的延误;②变换方法,该方法计算复杂,特别是在单导联情况下压缩率很低;③参数方法,该方法用信号特征进行ECG数据压缩,信号的特征可同时被用来信号重建和分类。因此,基于参数方法的信号分类和重建是个并行的过程,可以极大地提前ECG诊断的时间。基于ARMA建模技术的ECG压缩是属于参数压缩的方法,该方法可获得7.8倍的压缩率。可见,ARMA模型非常适于远程心电诊断中的ECG压缩和分类。
1 方 法
1.1 ECG信号的滤波和分割
本文中所使用的ECG信号取自MIT-BIH数据库:NSR信号、APC信号和PVC信号取自“MIT-BIH arrhythmia database”,其采样频率是360 Hz;VT信号和VF信号取自“MIT-BIH Ventricular Arrhythmiadatabase”,其采样频率是250 Hz;SVT信号取自“MIT-BIH superventricular arrhythmia database”,其采样频率是128 Hz。在建模时,所有ECG信号的频率都转化为250 Hz。在建模以前,先对ECG信号进行滤波以消除由电源、呼吸等原因引起的噪音。为了满足医生和护士监视的需要,ECG信号的带宽应保持在1 Hz到50 Hz之间[11]。用一个带通滤波器(BPF)对ECG信号进行滤波[11],其上下边带截止频率是1 Hz和50 Hz。这能有效地消除电源引起的噪音(60 Hz)、呼吸引起的噪音(0.2 Hz左右)、电极移动引起的低频噪音以及肌肉收缩引起的高频噪音。
不同种类的ECG有着不同的心跳率和RR间期。本文使用通常情况下的NSR信号,其心跳率是60~100次/min。APC的RR间期比NSR的RR间期短,而且紧跟其后的RR间期不会比NSR的RR间期长,VT和VF的RR间期比NSR的RR间期更要短得多。可见,300个采样点的数据窗口能足以包含一个周期的ECG信息。因此,本文采用300个采样点的数据窗口对ECG进行分割,其中,100个采样点在ECG峰值R以前,200个采样点在ECG峰值R以后。
1.2 ARMA模型的建立
ARMA模型是一个线性输出模型,其方程式是[11]:

其中,HR(k)为ECG信号的时间序列;ai和bj分别为AR系数和MA系数;P和Q分别为AR阶次和MA阶次;R[k]为AR误差的序列;n(k)为ARMA预测误差,即ARMA建模误差。本文利用Burg算法分别对ARMA模型的AR过程和MA过程进行参数估计。在建模中,阶次P和Q的选择至关重要。这里引用MDL(Minimizes the Description Length)准则来确定模型阶次。
![]()
式中,为建模误差的方差,N为数据窗口的宽度,Np为模型的阶次,在这里Np=P(AR过程)或Np=Q(MA过程)。

其中,ΔMDL是MDL的变化量,
反映了模型阶次NP对MDL的影响。
1.3 ECG特征的提取和压缩
由于采用ARMA系数作为ECG的特征,所以本文利用了特征向量 ![]()
作为ECG信号的特征。关于ECG的压缩,笔者参考了Ruttimann和Pipberger的改进霍夫曼编码法对ECG进行压缩的结果[13],其编码对象是AR系数和建模误差,得到的压缩率为7.8倍。尽管建模误差和原始ECG信号有着相同的采样点数,但是建模误差动态范围比原始ECG动态范围更小,所以表示建模误差所需的位数(Bit)比表示原始ECG所需的位数更少,从而可获得较高的压缩率。压缩率的计算公式为:
![]()
1.4 基于非线性二次判别函数的分类算法及性能评测
根据特征向量x,利用树状决策过程并基于二次判别函数对ECG信号进行分类。二次判别函数的方程[9]:
![]()
其矩阵形式为: ![]()

将各类ECG的目标值yi分别定义为某一整数,如1、-1等,假设所有ECG样本数为D,则可得到如下的方程: ![]()

在分类过程中,其分类算法如表1所示。首先,对各类ECG进行分组,依据各类ECG特征值之间的中心距进行分组,中心距小的被分为同一组;其次,在每一步中,分别定义各组的成员关系,即各组y对应于1,-1等。笔者在各类ECG样本集中随机选取一定数量的样本作为学习数据,把其余的作为测试数据。在分类算法的每一步中,利用学习数据按式(10)计算出W,并利用式(11)计算出试验数据判别函数值yi,并依据此值进行分类。假设第一步的
分类;第二步的
,依此类推。

为进一步评价文中算法,本文利用了敏感性和特异性来衡量分类结果的性能。其计算公式分别为:

其中,TE为各类ECG样本总数;FN为各类ECG假阴性总数;FP为各类ECG假阳性总数。
2 结 果
6类不同ECG经过滤波处理后分别用于ARMA建模,利用AR系数和MA系数对各类ECG进行分类。在分类时,进行了基于树状决策过程和二次判别函数的分类。
2.1 AR建模和压缩的结果
如上所述,利用MDL和MDL敏感性函数作为选择ARMA模型阶次的准则。在图1中给出了在AR过程中MDL与模型阶次P的关系。由此可见,MDL在开始时随着模型阶数的增加而减少,但是当P≥4时,MDL基本保持不变。在图2中给出了在AR过程中敏感性函数SMDLP与模型阶次P的关系。从中可见,当P≥4时,P对MDL的影响很小。因而选择AR模型阶次P=4,这一结果与其他的研究结果是一致的。有关研究认为,当P≥3时,AR误差不会随P的增加而减少[14,15]。类似地,图3给出了MA过程中MDL与模 型阶次Q的关系(P=4)。据此,选择MA模型阶次Q=2。各特征值的平均值如表2所示。




直接参考Ruttimann和Pipberger对ECG进行压缩的结果,可得到压缩率为7.8倍[11]。AR模型和AR-MA模型建模误差方差如表3所示。可见,AR模型和ARMA模型建模误差方差几乎是相等的,所以基于ARMA模型的ECG压宿率和AR模型的ECG压宿率可认为是一样的。

2.2 ECG分类的结果
在分类时,利用树状决策过程和二次判别函数对各类ECG进行分类。分类过程中的数据分组、成员关系和决策规则如分类算法表1所示。表4是各类ECG特征值之间的欧几里得中心距。由表4可知,VT/VF、NSR/APC/PVC和SVT分别聚集在一起,而VT/VF、NSR/APC/PVC和SVT互相离得较远。因此,按如下步骤进行分类:第一步,把SVT单独分为一组,把NSR/APC/PVC和VT/VF各分为一组,并分别定义其成员关系为“2”、“1”和“-1”,且依据y1的值进行分类,SVT首先被分离出来。第二步,把APC和PVC各分为一组,并分别定义其成员关系为“1”和“-1”,且依据y2的值进行分类;把VT和VF各分为一组,并分别定义其成员关系为“1”和“-1”,且依据y3的值进行分类,VT和VF即被分离出来。同理在第三步中,APC、PVC和NSR分别被分离出来。

在学习和测试过程中,各类ECG学习样本和测试样本分别都是60个和140个。在分类的每一步中,利用学习数据按式(10)计算出W,并利用式(11)计算出试验数据判别函数值yi,并依据此值进行分类,测验分类结果如表5所示,敏感性和特异性的平均值如表6所示。


3 讨 论
由上可知P=4,Q=2是合适的选择。如果P、Q太高,不仅会大大地增加运算量,而且ARMA预测精度得不到显著地提高。
基于ARMA模型的ECG特征生成有着计算简单和容易实现的优点。此外,在计算ARMA系数时所需的数据窗口是300个采样点,即1.2 s,而基于复杂度测量法所需的数据窗口是3~7 s[7],TLSProny建模技术所需的数据窗口是5~9 s[8]。
利用ARMA技术对6类不同ECG进行分类,获得了94.28%~99.28%的分类精度。因此,ARMA技术克服了许多方法只能对2至3类ECG进行分类的缺点。比如:模糊ARTMAP分类法对NSR和PVC进行分类[8];傅立叶变换神经网络法对SVT和PVC/VT进行分类[3];复杂度测量技术适用于VT、VF和NSR分类[5];以QRS为特征,采用神经网络来分类的方法,虽然可对APC和PVC等ECG进行分类,但却不能同时对VT和VF进行分类[16];Prony建模技术可对SVT、VT和VF进行分类,但不能同时包括对NSR、APC和PVC的分类[6]。由此可见,利用ARMA技术进行分类诊断是非常高效的。
把ARMA建模技术分类结果与最近发表的关于ECG分类结果进行了如下比较:用LPC系数和QRS波的MSV(Mean Square Value)作为特征值,采用模糊ARTMAP分类法对NSR和PVC进行分类,获得敏感性为97%、特异性为99%[8];利用改进顺序概率比测试(SPRT)算法对VT和VF进行分类,分别获得的分类精度是93%和96%[17];利用人工智能神经网络(ANN)对威胁性ECG进行分类,可获得93%~99%的分类精度[16],但ANN在学习过程中需要结构非常特殊的数据,在学习数据中,NSR和VC的样本数量特别大,而且APC的分类精度也不高;利用TLSProny建模法,SVT、VF和VT可分别获得95%、96%和97%的分类精度[6]。根据笔者的研究,基于ARMA模型的分类可取得比基于AR模型的分类较好的结果,这是由于ARMA模型融合了建模误差信息的原因。
另外,采用ARMA技术对ECG数据进行压缩可得很高的压缩率,ARMA模型特别适用于远程心电诊断。在远程心电诊断中,计算机辅助ECG诊断通常是在接收到ECG信号、进而解压重建后进行的,这样便造成诊断工作的延误。基于ARMA模型的ECG直接分类的方法,它无需等ECG解压重建后再行诊断,从而极大地提高诊断的快速性。
本文使用了固定长度的数据窗口,如果使用变化的数据窗口也许可以得到更好的分类效果(随RR间期而变)。ARMA模型是线性模型,ECG信号严格地讲也不是平稳随机过程,因此利用非线性参数模型也许更适合ECG信号,如双线性BL模型(Bilinear Model)等。有关研究表明,ECG信号和血液动力学信号、呼吸信号等有很强的相关性,可考虑混合这些信号来进行进一步研究[18]。笔者正在进行把非平稳ECG经过处理后得到一个平稳时序的研究,以及通过多导联ECG提取特征的研究。
4 结 论
基于ARMA模型和二次判别函数分类法应用于危急病人ECG分类诊断是有效的。ARMA模型特别适合于远程心电诊断中的ECG压缩和分类,并极具实时应用意义。
参考文献
[1] CaswellSA,Kluge K S,Chiang CM J.Pattern recognition ofcardiacarrhythmias using two intracardiacchannels[R].Proc Comp Cardiol,1993.181-184.
[2] Zhou SH,Rautaharju PM,Calhoun H P.Selection ofa reduced setofparameters for classification ofventricular con-duction defects by cluster analysis[R].Proc Comp Cardiol,1993.879-882.
[3] MinamiK C,Nakajima H,Toyoshima T.Real-time discrimination ofventricular tachyarrythmia with fourier-transform neuralnetwork[J].IEEETrans Biomed Eng,1999,46:179-185.
[4] Afonoso V X,Tompkins W J.Detecting ventricular fibrillation:Selecting the appropriate time-frequency analysis toolfor the application[J].IEEE Eng Med BiolMag,1995,14:152-159.
[5] Zhang X S,Zhu Y S,Thakor N V,etal.Detecting ventricular tachycardia and fibrillation by complexity measure[J].IEEE Trans Biomed Eng,1999,46:548-555.
[6] Chen SW.Two-stage discrimination ofcardiac arrhythmias using a totalleastsquares-based prony modeling algorithm[J].IEEE Trans Biomed Eng,2000,47:1317-1326.
[7] Arnold M,Miltner W H R,Witte H.Adaptive ARmodeling ofnonstationary time series by means of Kalman filtering[J].IEEE Trans Biomed Eng,1998,45:553-562.
[8] Ham FM,Han S.Classification of cardiac arrhythmias using fuzzy ARTMAP[J].IEEE Trans Biomed Eng,1996,43:425-430.
[9] Duda R O,Hart PE.Pattern Classification[M].New York:Wiley-Interscience Publication,2001.
[10] Jalaleddine SM S,Hutchens CG,Strattan RD,etal.ECG data compression techniques-a unified approach[J].IEEE Trans on BME,1990,37:329-343.
[11] Proakis JG,Manolakis DG V.DigitalSignalProcessing[M].Prentice-Hall,United States ofAmerica,1996.
[12]Giraldo B F,Bolea Y,Caminal P.Comparision of diffetent models to analyze the number of patients in waiting-list[R].Proceeding ofthe Second Joint EMBS/MBESConference.Houston USA,2002,23-26.
[13] Tompkins W.BiomedicalDigitalSignalProcessing[M].New Jersey:Prentice-Hall,Englewood Cliffs,1993.[14]Lin K P,Chang WH.QRSfeature extraction using linear prediction[J].IEEETrans Biomed Eng,1989,36:1050-1055.
[15] Ge D F,Srinivasan N,Krishnan SM.Cardiac arrhythmia classification using autoregressive modeling[J].Biomedical Engineering Online,2002,(1):5.
[16]Melo S L,Caloba L P,Nadal J.Arrhythmia analysis using artificial neural network and decimated electrocar-diographic data[J].Comp Cardiol,2000,27:73-76.
[17] Chen SW,Clarkson PM,Fan Q.A robust sequentialdetection algorithm for cardiac arrhythmia classification[J].IEEE Trans Biomed Eng,1996,43:1120-1121.
[18] Korhonen I.Multivariate closed-model for analysis of cardiovascular dynamics[J].Methods of Information inMedicine,1997,36:264-267.
本文来源:浙江科技学院学报 作者:葛丁飞
关于 ARMA模型 的相关解决方案
- 2007-01-25基于ARMA模型的ECG分类和压缩
ARMA模型 相关产品动态
ARMA模型 相关方案厂商
快乐大本营
嵌入式系统无疑已成为当前业界看好的巨大“蛋糕”。 今日头条推荐“发展嵌入式软件企业要练好‘内功’”。
想了解嵌入式开发工具的市场情况吗?先来体验下我们的在线调查吧!填写调查问卷。

