Study on The Population Model in China’s cosplaytal Zone based on GIS
LI Chun’e ZHANG Li-jun
(Xinjiang Information Engineering School 〈Xinjiang Meteorology Training Centre〉,Urumqi Xinjiang 830013)
Accorpng to the national region economy pvision standard, pvipng the China’s coastal zone into the north coastal synthesizes economic zone, the eastern coastal synthesizes economic zone and the south coastal synthesizes economic zone. In various regions, analysing the ration relations of the population spatial pstribution characteristic and correlation factors through theory, method and technique, putting forward the key index which have close correlation with population spatial, establishing the population mathematical model, finally verifying the precision in various regions population model, and analysing the population pstribution characteristic and the factors which affect various regions population pstribution. The verification method includes independent-samples T-test and the correlation analysis of model-population and census population. The conclusion is below:1.The north coastal synthesizes economic zone, Key factors: GDP, rail, river and area of plain, Population model:(x1 is GDP, x2 is rail, x3 is river,x4 is area of plain) The result of T-test: the value of sig is 0.334 which is bigger than 0.05, the value of F is 0.949, and the value of R2 is 0.6679;The characteristic of population pstribution: the pstribution of population is denseness in the inland-plain and coastland where the hypsography is evenness, the traffic is convenient and economic is develop, and sparseness in the in the hill and inland-mountain.2.The eastern coastal synthesizes economic zone.Key factors: GDP, area of plantation, and area of residential;Population model:(x1 is GDP, x2 is area of plantation,x3 is area of residential)The result of T- test: the value of sig is 0.290 which is bigger than 0.05, the value of F is 1.147, and the value of R2 is 0.6668;The characteristic of population pstribution: the whole pstribution of population is denseness, especially more denseness in the zone where the traffic is convenient and economic is develop.3.The south coastal synthesizes economic zone, Key factors: GDP, area of water and area of residential; Population model:(x1 is GDP,x2 is area of water,x3 is area of residential)The result of T-test: the value of sig is 0.281 which is bigger than 0.05, the value of F is 1.181, and the value of R2 is 0.6915;The characteristic of population pstribution: the pstribution of population is denseness in the zone where the pstribution of inland-river is denseness and the accumulative temperature is lower, and sparseness in the hill and lowland where the accumulative temperature is higher. GIS; cosplaytal; Population model
1 研究理论基础
人口分布指人口在某一特定时间、空间的集散状况、。它是人口地理学研究的核心问题,同生产分布及经济社会进步息息有关。人口分布不单指人口数目的分布,还包含别的人口现象在地理空间的聚集与扩散状况,如人口水平、人口结构、人口自然增长与机械变动、人口居住地种类等空间的组合特点和空间联系[1]。
人口密度是指特地定范围内单位土地面积上的常住人口数,它是表现人口分布的主要形式和衡量人口分布区域差异的主要指标。通过人口密度指标便于比较地区间的人口分布的稠密状况,显示地区间人口分布的差异性[1]。
人口区划是在一个国家或较大的地区范围内,依据人口分布的基本特征及其影响原因的区内类似性与区间差异性而划分的人口地区。区划的具体指标包含自然地理特点指标(比如地形、气候、水文、土地资源和矿产资源特点等)和社会经济条件指标(比如生产力水平、产业结构、文化特征等)[2-4]。
基于遥感和GIS技术研究人口的文献[5-17],主如果通过自然(遥感影像信息、地形、海拔、坡度、坡向、水文、气候、土壤、交通、居民点、土地借助种类等)、经济(GDP、1、2、三产业产值等)等因子与人口数据进行有关性剖析,得出与人口分布较为密切的重点因子,并打造人口模型和生成人口密度空间分布图,使用的办法主要有格点生成法、复合面积内插法、分区建模法和多因子加权建模法等。
2 研究地区概况
依据国务院进步研究中心的报告指出,中国的东、中、西地区划分办法已经不合时宜,为此,报告提出“十一五”期间中国划分为东部、中部、西部、东北四大板块,再将四个板块划分为八大综合经济区的具体构想[11-20]。本文的研究范围是在报告提出的八大综合经济区所包含的北部沿海综合经济区(包含北京、天津两市、河北、山东两省)、东部沿海综合经济区(包含上海、江苏、浙江两省)和南部沿海经济区(包含福建、广东、海南三省),因数据获得等问题,暂时不考虑国内的港澳台区域。
该地区从北往南属暖温带湿润半湿润区域、亚热带湿润区域和热带湿润区域,年降水量均在400mm以上,北部和东部沿海地区一年四季分明,南部沿海地区长夏无冬。水量丰富,汛期长,地貌以平原和丘陵为主,交通互联网稠密,水陆运输条件好,农业进步基础好,工业情况北部偏重工业,东部和南部偏轻工业。经济基础较国内中西部有明显的优势[21]。
3 研究材料
3.1 自然数据
3.1.1 沿海地区省级、县级行政地区数据
来自中国2003年行政地区图,数据格式为Coverage,比率尺为1:100万。
3.1.2 沿海地区河流水系数据
来自国家测绘科学数据共享网的1:400万三级以上河流、1:400万四级河流和1:400万五级河流,时间为1997年,数据格式为EOO。
3.1.3 沿海地区DEM数据和土地借助种类数据
来自中国科学院地理科学研究所,时间为2000年,数据格式分别为GRID和Coverage格式。
3.1.4 沿海地区气候数据
来自中国气象科学数据共享服务网,时间范围为1951-2005年,数据格式为Shape格式。
3.1.5 沿海地区地形地貌数据
对李炳元先生主编的1:100万形态地貌图进行数字化形成1:400万地貌图,时间为1996,数据格式为Coverage格式。
3.2 经济数据
3.2.1 沿海地区第五次人口普查数据
来自中国科学院资源环境科学数据中心,时间为2000年,数据格式为EXCEL。
3.2.2 沿海地区2000年GDP数据
来自中国科学院资源环境科学数据中心和国家统计局综合司编制的《中国地区经济统计年鉴2001》,时间为2000年,数据格式为EXCEL。
3.2.3 沿海地区2000年非农业户口人口比重数据和1、2、三产业人口占行业人口比重数据
来自中国科学院资源环境科学数据中心,时间为2000年,数据格式为EXCEL。
3.2.4 沿海地区公路数据和铁路数据
来自国家测绘科学数据共享网的1:400万基础地理信息数据,时间为1997年,数据格式为EOO格式。
4 研究办法
4.1 基础数据处置
4.1.1 河流数据
在Arc info软件中,通过“import”命令把E00格式转换为coverage格式;通过“Project”功能设置投影参数(同行政地区数据),通过“Merge”合并三级、四级和五级河流数据;通过“Intersect”叠加合并后的河流和县级行政地区数据,通过“Length”计算各县的河流长度。
4.1.2 DEM数据
在Arc GIS软件中,通过“Mosaic to new raster”功能把DEM数据转换成分辨率为250米的GRID数据,通过“Zonal statistics as table”计算出各县的DEM平均值。
4.1.3 土地借助种类数据
在Arc GIS软件中,通过Feature to raster”转换成分辨率为250米的GRID数据;通过“Tabulate area”功能,计算出各县级的各土地借助种类的面积,并根据人口分布的影响原因和土地借助种类分类的规范,将有关的种类合并计算[比如非适合区包含水域(代码为41-46)和未借助种类(代码为61-67),适合区包含居住区(代码为51-53)和非居住区,非居住区包含耕地(代码为11-12)、林地(代码为21-24)和草地(代码为31-33)]。 4.1.4 气候数据
在Arc GIS软件中,使用克里金法(Kriging)插值办法对气象站点数据的插值,形成分辨率为250m的GRID数据;通过“Zonal statistics as table”功能,计算各县的气候数据均值。
4.1.5 地形地貌数据
在Arc GIS软件中,通过“import cover”命令把EOO格式的数据转换成coverage格式;通过“Dissolve”功能,根据地貌种类的代码融合地貌种类数据的属性表;通过“Feature to raster”功能转换成分辨率为250米的GRID数据,通过“Tabulate area”功能,计算出各县的各地貌种类的面积,并依据平原、丘陵和山地三大地貌种类标准重新合并计算面积(平原种类[合并代码:2-21,23,26-34,36-40,43-44,67-85,88,90-96,98-107,109],山地种类[合并代码:24,25,35,41,45,46,51-53,86,89,97,110],丘陵种类[合并代码:22,42,55,87,108],其他[合并代码:其余代码])。
4.1.6 公路和铁路数据
在Arc info软件下,通过“import”命令把E00格式的数据转换为Coverage格式;通过“Intersect”叠加公路数据(和铁路数据)和县级行政地区数据,通过“length”计算属性表中各县的公路和铁路长度。
4.1.7 经济数据
校正第五次人口普查数据、GDP、非农业户口人口比重数据和1、2、三产业人口占行业人口比重数据的统计口径,以保证经济数据的统计范围和县级行政数据中的空间范围维持一致。
4.2 后期处置剖析
随机选取85%的县级地区数据做剖析,剩余的15%的数据作为最后的模型验证数据。
第一,在SPSS软件中得出三个地区内各数据的散点矩阵图,重点剖析人口普查数据和其他数据间的散点图趋势。然后,剔除与人口普查数据有关性较差或无关的数据,把与人口普查数据有关性较好的数据重新打造散点矩阵图和有关性矩阵,选取与人口普查人口数据有关性大于等于0.6,且没有明显自有关性的指标作为重点指标[22-33]。
最后,打造人口指标与各重点指标间的模型,再对各模型进行网站权重相加[34],得出最后的人口模型,网站权重系数由各重点指标与人口普查数据的绝对系数R2确定,用剩余的15%的数据检验各地区模型的精准度并剖析其缘由。
5 研究结果
5.1 各地区指标间的散点图矩阵
5.1.1 北部沿海综合经济区(如图1(a-e))
(a) (b)
(c) (d)
(e)
图1 (a-e) 北部沿海综合经济区原始数据散点矩阵图
Fig1 (a-e) Initial data dot matrix in the north coast synthetical economic zone
存在线性或非线性关系的指标: GDP、road(公路)、rail(铁路)、river(河流)、耕地面积、居民区面积和平原面积。
没有关系的指标:1、2、三产业人口比重、非农业人口比重、DEM、水域面积、aat(每年平均温)、jw(大于0℃年积温)、aap(年降水)、aah(相对湿度)、aas(日照时数)、林地面积、草地面积、未借助面积、非适合区面积、适合区面积、丘陵面积和山地面积。
5.1.2 东部沿海综合经济区(如图2[a-e]q)
存在线性或非线性关系的指标: GDP、耕地面积、居民区面积和平原面积。
没有关系的指标:1、2、三产业人口比重、非农业人口比重、road(公路)、rail(铁路)、river(河流)、DEM、水域面积、aat(每年平均温)、jw(大于0℃年积温)、aap(年降水)、aah(相对湿度)、aas(日照时数)、林地面积、草地面积、未借助面积、非适合区面积、适合区面积、丘陵面积和山地面积。
(a) (b)
(c) (d)
(e)
图2 (a-e)东部沿海综合经济区原始数据散点矩阵图
Fig2 (a-e) Initial data dot matrix in the eastern coast synthetical economic zone
5.1.3 南部沿海综合经济区(如图3[a-e])
存在线性或非线性关系的指标:GDP、第一产业人口比重、DEM、水域面积、耕地面积、居民区面积和平原面积。
没有关系的指标:2、三产业人口比重、非农业人口比重、road(公路)、rail(铁路)、river(河流)、aat(每年平均温)、jw(大于0℃年积温)、aap(年降水)、aah(相对湿度)、aas(日照时数)、林地面积、草地面积、未借助面积、非适合区面积、适合区面积、丘陵面积和山地面积。
5.2 提取各地区内重点性指标,并打造人口模型
5.2.1 北部沿海综合经济区
选定本地区R2大于0.36的GDP、rail、river和平原面积四个指标,并做散点矩阵图和有关性矩阵剖析,查询指标间的自有关性,可以确定三个指标间无明显的自有关性。散点矩阵图如图4所示。
人口指标与GDP间的模型:
人口指标与rail间的模型:
人口指标与river间的模型:
人口指标与平原面积间的模型:
依据三个指标与人口普查数据间的R2值确定三指标的网站权重系数分别是:GDP为0.36,rail为0.24,river为0.15,平原面积为0.25。 北部沿海综合经济区人口模型:
(x1为GDP,x2为rail,x3为river,x4为平原面积)
(a) (b)
(c) (d)
(e)
图3 (a-e)南部沿海综合经济区原始数据散点矩阵图
Fig3 (a-e) Initial data dot matrix in the south coast synthetical economic zone
5.2.2 东部沿海综合经济区
选定本地区R2大于0.36的GDP、耕地面积、居民区面积和平原面积四个指标,并做散点矩阵图和有关性矩阵剖析,查询指标间的自有关性,可以发现平原面积和耕地面积间的R值为0.961,剔除平原面积指标。散点矩阵图如图5所示。
人口指标与GDP间的模型:
人口指标与耕地面积间的模型:
人口指标与居民区面积间的模型:
依据三个指标与人口普查数据间的R2值确定三指标的网站权重系数分别是:GDP为0.34,耕地面积为0.30,居民区面积为0.36。
东部沿海综合经济区人口模型:
(x1为GDP,x2为耕地面积,x3为居民区面积)
5.2.3 南部沿海综合经济区
选定本地区R2大于0.36的GDP、水域面积和居民区面积三个指标,并做散点矩阵图和有关性矩阵剖析,查询指标间的自有关性,三个指标间无明显的自有关性。散点矩阵图如图6所示。
人口指标与GDP间的模型:
人口指标与水域面积间的模型:
人口指标与居民区面积间的模型:
依据三个指标与人口普查数据间的R2值确定三指标的网站权重系数分别是:GDP为0.41,水域面积为0.20,居民区面积为0.39。
南部沿海综合经济区人口模型:
(x1为GDP,x2为水域面积,x3为居民区面积)
图4 北部沿海综合经济区散点矩阵图
Fig4 Dot matrix in the north coast synthetical economic zone
图5 东部沿海综合经济区散点矩阵图
Fig5 Dot matrix in the eastern coast synthetical economic zone
图6 南部沿海综合经济区散点矩阵图
Fig6 Dot matrix in the south coast synthetical economic zone
6 结果及存在的不足
6.1 结果讨论
6.1.1 北部沿海综合经济区
T检验结果:sig值为0.334>0.05,F值为0.949。说明此地区模型人口数据的均值与人口普查数据的均值差异不显著。模型人口数据与人口普查数据作有关性剖析(图7所示)可以看出,R2值为0.6679。
北部沿海综合经济区人口模型有四个重点指标:GDP,rail(铁路长度),river(河流长度)和平原面积,并且GDP的线性有关性R 高达0.9358,第二为平原面积、rail和river长度。该区整体气候适合,地势较为平坦,最适合人类居住,经济进步水平整体较高,交通便利,河流较多,人口分布整体上较为稠密,尤其是沿海城市人口分布较为密集。
6.1.2 东部沿海综合经济区
T检验结果:sig值为0.290>0.05, F值为1.147。说明此地区模型人口数据的均值与人口普查数据的均值差异不显著。模型人口数据与人口普查数据作有关性剖析(图8所示),可以看出,R2值为0.6668。
东部沿海综合经济区人口模型有三个重点指标:GDP,耕地面积和居民区面积,并且居民区面积指标的影响程度最高,第二分别为GDP和耕地面积。该区域为国内经济发达区域,整体生产力进步水平较高,交通十分便利,区内经济进步差异相对较小,地势较为平坦,上海、南京、杭州和宁波等大型城市的人口分布十分密集,居民区面积和耕地面积的大小非常大程度上决定着该区域人口的容纳程度。
6.1.3 南部沿海综合经济区
T检验结果:sig值为0.281>0.05, F值为1.181。说明此地区模型人口数据的均值与人口普查数据的均值差异不显著。模型人口数据与人口普查数据作有关性剖析(图9所示)可以看出,R2值为0.6915。
南部沿海综合经济区人口模型有三个重点指标:GDP,水域面积和居住区面积,并且GDP和居住区面积对人口分布的影响程度较高,水域面积的影响较低。该区域气候整体较为湿热,交通便利,广东、福建区域的经济发达,内陆河流水系分布较为密集,是人口高密集区域,海南区域经济进步较落后,气候炎热,人口分布相对稀有。
图7 北部沿海综合经济区有关性
Fig7 Correlation in the south coast synthetical economic zone
图8 东部沿海综合经济区有关性
Fig8 Correlation in the eastern coast synthetical economic zone
图9 南部沿海综合经济区有关性
Fig9 Correlation in the south coast synthetical economic zone
6.2 存在的不足
6.2.1 数据方面的问题
影响人口分布的原因包含自然、社会经济、历史、文化背景等方面。本文因为部分数据不容易定量、获得难等问题没考虑。 空间数据的处置算法不可防止的存在不同程度的误差,这类误差同样会干扰研究结果。
6.2.2 区划标准的精准性
社会经济数据一般是以行政地区为统计单元,而其他自然数据在行政地区边界是自然连续过度,要把两种不同口径下统计的数据统一到行政地区单元内,必然会干扰行政地区边界区域数据过渡的不连续,从而影响到以后人口分布在行政边界上过渡的连续性。
6.2.3 人口模型指标网站权重的确定