基于MATLAB的合肥市空气质量影响因子分析
摘要 本文基于MATLAB工具对合肥市新的空气质量评价标准的监测数据进行分析,初步确定对合肥市空气污染影响程度较高的污染物;对参与评价空气质量的污染物的数据进行聚类分析,实验表明聚类结果与各项污染物的监测值综合评价关系较为密切,能够综合反映合肥市的空气质量状况。实验也说明新的空气质量评价标准增加了一些污染物监测项目更为客观。
关键词 统计分析;聚类;MATLAB;空气质量
近年来,中国很多城市经常出现雾霾天气,“PM2.5”也成为人们的热议话题,空气质量问题日益受到人们的关注。空气的污染严重危害人们的身心健康,为降低和减少污染,需要对影响空气污染的因素进行监测和统计分析,从中找到导致空气污染的主要污染物项目,以便于有针对性的找到污染根源,从而更好地治理空气污染问题。
1 空气质量指数计算方法
2012年国家发布新的环境空气质量标准[3],同时,国家环境保护部发布了《环境空气质量指数(AQI)技术规定(试行)》[4],空气质量指数(AQI)分级计算参与评价的污染物在过去参与评价的污染物仅为二氧化硫(SO2)、二氧化氮(NO2)和粒径小于等于10?m可吸入颗粒物(PM10)等三项的标准上,增加了粒径小于等于2.5?m的颗粒物(PM2.5)、一氧化碳(CO)和臭氧(O3)等项目。
根据过去24小时一个城市所有监测站点的各项污染物浓度算术平均值计算该城市的日AQI,反映这个城市过去一天的空气质量状况。
AQI范围为0~500,导致AQI>50的污染物为首要污染物,首要污染物可以为多项;导致AQI>100的污染物为超标污染物。AQI值越大,说明空气受污染的程度越高,对人体的健康危害也就越大。
2 合肥市空气质量数据分析
分析合肥市空气质量及影响因子,是对合肥市的AQI指数和参与评价空气质量的污染物的监测数据进行分析,数据来源http://www.tianqihoubao.com/,其中包含日AQI和各项污染物的日平均实测浓度值。实验使用MATLAB工具进行,实验数据选取的时间段从2013年11月1日至2014年4月30日共181天,数据项为日AQI和6个污染物日平均浓度值,共181组,表示为:DATA=(aqi,attr)181×7,其中第一列aqi为每天的日AQI值,attr为181×6的矩阵,各列依次为6个污染物PM2.5、PM10、CO、NO2、SO2、O3的181天日平均浓度值。
2.1 数据的数字特征
为了观察数据的大致情形,用函数boxplot(X)作箱形图,如图1所示。由图1箱形图可知,合肥市AQI值的1/4分位数接近100,说明空气污染程度较高,同时观察PM2.5和PM10中位数都在100附近,说明这两个指标对空气污染较重。
2.2 聚类分析
人们在认识事物时首先要区分不同的事物,然后分析事物内部和事物之间的差异。针对事物对象的重要指标或综合特征,聚类分析是根据对象间的相似程度或相异程度将一组数据进行分组,分到同一组的对象具有相似的性质,不同类的对象性质差别很大,然后对这些组数据进行研究。下面对参与评价空气质量的污染物的数据进行聚类分析。
从图1中可以看出,由于数据的计量单位不同,且各列数据的变化很大,为减少不同的指标的标量对实验结果的影响程度太大,使用函数Z=zscore(D)将数据进行标准化,该函数返回D中各列数据与均值间的偏差,并用其标准差标准化。对于列向量V,标准化后的数据Z=(V-mean(V))./std(V)。
使用MATLAB工具箱中的函数对数据聚类分析。
聚类的算法如下:
function ATTR-Cluster(attr)
attrScaled=zscore(attr);%数据标准化
dis=pdist(attrScaled,’Euclid’);%欧式距离
tree=linkage(dis,’method’);%method分别取single/complete/average
TreeCluster=(tree,6);%构造最多6类的构造类
使用函数c=cophenet(tree,dis)计算不同的聚类方法的相干系数,该函数用来度量聚类结果的有效性,对于要求很高的解,c应接近1。计算最短距离法、最长距离法和平均距离法的相干系数分别为0.6746,0.7831和0.7463,在这3种实验方法中,最长距离法是效果最好的一种方法。
3 结论
本文依据AQI技术规定,使用MATLAB工具对合肥市空气质量数据进行了分析,认为合肥市近半年空气污染程度较高,污染物PM2.5、PM10和CO对合肥市空气污染影响程度较高;对参与评价空气质量的污染物的监测数据进行聚类分析,实验结果说明聚类结果与各项污染物的监测值综合评价关系较为密切,能
够综合反映合肥市的空气质量状况。数据分析也进一步证明了新的空气质量评价标准增加了3个污染物项目,对于评价空气质量更为科学。
空气质量数据进行分析,可以帮助找到影响空气质量的影响因子,确定导致空气污染的主要污染物项目,但是,环境空气质量除了受这些污染物项目的影响,还受到当地的气候环境变化的影响,这需要更进一步的研究才能有助于解决空气污染治理问题。
参考文献
[1]范金城,梅长林.数据分析[M].北京:科学出版社,2002.
[2]周品,赵新芬.MATLAB数理统计分析[M].北京:国防工业出版社,2009.
[3]环境保护部,国家质量监督检验检疫局.GB3095-2012,环境空气质量标准[S].北京:中国环境科学出版社,2012.
[4]环境保护部.HJ633-2012,环境空气质量指数(AQI)技术规定(试行)[S].北京:中国环境科学出版社,2012.
因篇幅问题不能全部显示,请点此查看更多更全内容