聚类和异常值分析

聚类和异常值分析可识别具有拥挤显著性的热点、冷点、空间异常值,使用 Anselin Local Moran‘s I(局部莫兰指数) 统计量,对加权要素进行分析。

散点图是数据分析中用来表示二个变量之间相关关系的一种常见的方法。表示一个变量的空间自相关关系,可以采用 Moran 散点图。

Moran 散点图

Moran 散点图可以用来探索空间关联的全局模式、识别空间异常和局部不平稳性等。将变量在每个位置上的观测值表示在横轴上,其空间滞后(标准化的局部空间自相关指标Moran’s I)表示在纵轴上,则二者之间的相关关系就可以用坐标系中的散点形象地表现出来。

Moran散点图分为四个象限,分别对应四种不同类型的局部空间关联模式:

不同象限所表示的空间关系含义:

当在Moran 散点地图中仅显示那些显著高或显著低的观测值时,得到 Moran 显著性地图。如果显著观测值属于散点图中的第一象限或第三象限,则认为存在显著空间聚集;如果属于第二或第四象限,则认为存在显著的空间差异。

应用案例

功能入口

主要参数

结果输出

聚类和异常值分析的结果数据集中,将会包含四个属性字段:局部莫兰指数、z 得分和 p 值、聚类和异常值类型,分别为ALMI_MoranI 、 ALMI_Zscore、ALMI_Pvalue 、ALMI_Type 四个字段。 字段含义解释如下:

由于聚类和异常值是基于置信度95%做的运算,因此只有P值小于0.05时,ALMI_Type字段中才具有值。如果应用错误发现率 (FDR) 校正,统计显著性将会以校正的置信度(将p 值阈值从 0.05 降低到某个新值)为基础, 以兼顾多重测试和空间依赖性。

P值(ALMI_Pvalue) 莫兰指数(ALMI_MoranI) 代表的含义 聚类和异常值类型(AIMI_TYPE)
P<0.05 M>0 表示为高值或者低值聚类 HH(高值聚类)或LL(低值聚类)
P<0.05 M<0 表示为异常值 HL(低值围绕高值)或LH(高值围绕低值)

P值(ALMI_Pvalue) Z得分(ALMI_Zscore) 代表的含义 聚类和异常值类型(AIMI_TYPE)
P<0.05 Z>0 表示周围的要素拥有相似值(高值或低值)。 HH(高值聚类)或LL(低值聚类)
P<0.05 Z<0 表示有一个具有统计显著性的空间数据异常值。 HL(低值围绕高值)或LH(高值围绕低值)

实例:对病毒性肝炎县区数据的2013年发病数进行聚类和异常值析分析,设置评估字段为2013年发病数,概念化模式为反距离模型,距离计算方法为欧式距离,对空间权重矩阵进行标准化,选择进行FDR校正,其它默认。得到结果数据集属性表如下所示:

在随机分布的假设下,结果表明:

所以,该地区大部分区域的Moran’s I不显著,显著部分呈现高值聚类。

相关主题

热点分析

分析模式