第六章GIS的数据获取与处理-亚洲ca88官方网站发布时间:2022-06-30 10:58:22 来源:亚洲ca88官方网站1、数据源。是指树立 GIS 的地舆数据库所需的各种数据的来历,首要 包括地图、遥感图画、文本材料、核算材料、实测数据、多媒体数据、 已有体系的数据等。可归纳为原始搜集数据、再生数据和交流数据三 种来历。 含有实体的类别和特色,并且含有实体间的空间联络。地图数据首要 经过对地图的盯梢数字化和扫描数字化获取。地图数据不只能够作宏 观的剖析(用小份额尺地图数据),并且能够作微观的剖析(用大份额尺 地图数据)。在运用地图数据时,应考虑到地图投影所引起的变形,在 需求时进行投影改换,或转化成地舆坐标。 (2)、遥感数据(镜像数据) 遥感数据是 GIS 的重要数据源。遥感数据含有丰厚的资源与环境 信息,在 GIS 支撑下,能够与地质、地球物理、地球化学、地球生物、 军事运用等方面的信息进行信息复合和归纳剖析。遥感数据是一种大 面积的 、动态的、近实时的数据源,遥感技能是 GIS 数据更新的重要 手法。 建造、兵要地志等)的许多核算材料,这些都是 GIS 的数据源,尤其是 GIS 特色数据的重要来历。 理数据库,以便于进行实时的剖析和进一步的运用。GPS(全球定位系 统)所获取的数据也是 GIS 的重要数据源。 据。因为标准化、标准化的推行,不同体系间的数据同享和可交流性 越来越强。这样就拓宽了数据的可用性,添加了数据的潜在价值。 2、数据集。一个结构化的相关数据的调集体,包括数据自身和数据间 的联络。数据集独立于运用程序而存在,是数据库的中心和办理方针。 GIS 的首要数据集。数字线划数据(DLG)、数字扫描数据(DRG)、 印象数据(DOM)、数字高程数据(DEM)和特色数据(包括社会经 济数据)、专业数据。 空间数据搜集的使命是将现有的地图、外业观测效果、航空像片、 遥感图画、文本材料等转化成 GIS 能够处理与接纳的数字办法,一般 要经过验证、修正、修正等处理。 不同数据输入需求用到不同的设备。例如,关于文本数据一般用 交互的办法经过键盘录入,也可用扫描仪扫描后用字符辨认软件主动 录入;关于矢量地图数据,可用平板数字化仪,选用手扶盯梢的办法 输入,也可用扫描仪扫描成图画后,用栅格数据矢量化的办法主动追 踪输入;等等。 GIS 软件的这一部分还应具有数据转化装载的功用,即能把其它 GIS 或专题数据库中的数据经过转化装载到当时的 GIS 体系中。 数据的修正、图幅的拼接、拓扑联络的生成等,即完结 GIS 的空间数 据在装入 GIS 的地舆数据库前的各种作业。 在 GIS 的几许数据收会集,假如几许数据已存在于其它的 GIS 或 专题数据库中,那么只需经过转化装载即可;关于由丈量仪器获取的 几许数据,只需把丈量仪器的数据传输进入数据库即可,丈量仪器如 何获取数据的办法和进程一般是与 GIS 无关的。 关于栅格数据的获取,GIS 首要触及运用扫描仪等设备对图件的扫 描数字化,这部分的功用 也较简略。因为经过扫描获取的数据是标准 格局的图画文件,大多可直接进入 GIS 的地舆数据库。 从遥感印象上直接提取专题信息,需求运用几许纠正、光谱纠正、 印象增强、图画改换、结构信息提取、印象分类等技能,首要归于遥 感图画处理的内容。 因此,以下首要介绍 GIS 中矢量数据的搜集。GIS 中矢量数据的 搜集首要包括地图盯梢数字化与地图扫描数字化。 录数字化板上点的平面坐标来获取矢量数据的。其根本进程是:将需 数字化的图件(地图、航片等)固定在数字化板上,然后设定数字化规模、 输入有关参数、设置特征码清单、挑选数字化办法(点办法和流办法等), 就能够按地图要素的类别别离施行图形数字化了。 数字化软件往往能够与整个 GIS 体系脱脱离,因此可独自运用。 地图盯梢数字化时数据的可靠性首要取决于操作员的技能娴熟程 度,操作员的心情会严峻影响数据的质量。操作员的经历和技能首要 表现在能挑选最佳点位来数字化地图上的点、线、面要素,判别十字 丝与方针重合的程度等才干。为了坚持一同的精度,每天的数字化工 作时刻最好不要超越 6 小时。 GIS 中的地图盯梢数字化软件为了获取矢量数据应具有下列根本 功用: 1°、图幅信息录入和办理功用 即对所需数字化的地图的份额尺、图幅号、成图时刻、坐标体系、 投影等信息进行录入和办理。这是所搜集的矢量数据的数据质量的基 本根据。 2°、特征码清单设置 特征码清单是指安放在数字化仪台面或屏幕上的由图例符号构成的 格网状清单,每品种型的符号占居清单中的一格。在数字化时只需点 中特征码清单区的符号地点的网格,就可知道所数字化要素的编码, 以便利特色码的输入。地图盯梢数字化软件应能运用户便利地按自己 的志愿设置和界说特征码清单。 3°、数字化键值设置 首要是指体系应能选定不同类型的数字化仪,并确认数字化仪与主 机的通讯接口。 5°、数字化办法的挑选 方向,但要完结彻底主动化还要做许多艰巨的尽力,现在所能供给的 扫描数字化软件是半主动化的,还需做适当的人机交互作业。地图扫 描数字化的根本思想是:首要经过扫描将地图转化为栅格数据,然后 选用栅格数据矢量化的技能追寻出线和面,选用办法辨认技能辨认出 点和注记,并根据地图内容和地图符号的联络,主动给矢量数据赋属 性值。 根据现在的技能水平,首要要对所扫描的五颜六色地图进行分版处理, 一般分为黑版要素、水系版要素、植被要素和地貌要素,也能够直接 对分地图进行扫描,然后由软件进行二值化,去噪音等处理,常常需 要进行一些修正,以确保主动盯梢和辨认的进行;在软件主动进行跟 踪和辨认时,仍需求进行部分的人机交互,如处理断线、确认特色值 等,有时乃至要人工在屏幕进步行数字化。 与地图盯梢数字化比较,地图扫描数字化具有速度快、精度高、自 动化程度高级长处,正在成为 GIS 中最首要的地图数字化办法。 地图扫描数字化的主动化程度高,但有必要具有一些对扫描后的地图 数据的预处理才干,一同,因为其终究效果同地图盯梢数字化的效果 是相同的,因此还有必要具有地图盯梢数字化所具有的一些功用。因此, 其根本功用可描绘为: 1°、地图扫描输入功用 能够将所扫描的五颜六色地图图画分红不同要素版的图画数据,以便于 盯梢和辨认。 4°、线状要素的矢量化功用 能够对线状要素进行细化、断线修正、盯梢,也即具有主动提取线 状要素中心线的功用。因为现在的主动化程度还不够高,常常需求进 行人机交互,比方在多条线的穿插点找到粘连及断开处,原实体接连 担图形中止处(桥下河,桥中路……),需人机交互指明持续追寻的方 向。 5°、点状符号和注记的主动辨认功用 应该能对点状符号和注记字进行主动辨认,但彻底主动化现在仍有 困难,因此,有时需求人工在屏幕进步行数字化。 6°、特色编码的主动赋值 应能对已数字化的要素主动根据其符号特征赋以相应的编码(包括等高 线的高程)。这方面现在还需求较多的人机交互。 7°、图幅信息录入与办理功用 同地图盯梢数字化相同,地图扫描数字化也需求录入图幅信息,以便 于办理和质量操控。 8°、要素编码设置功用 为了能进行特色编码的主动赋值,以及人机交互地进行特色编码赋值, 都有必要针对不同的要求进行地图要素的编码设置。 字化为一组接连的象素或矢量表明的线实体,并可用必定的颜色、符 号把 GIS 的空间数据表明出来,这样,路途的类型就可用相应的符号 来表明。而路途的特色数据则是指用户还期望知道的路途宽度、外表 类型、修建办法、修建日期、进口掩盖、水管、电线、特别交通规矩、 每小时的车流量等。这些数据都与路途这一空间实体相关。这些特色 数据能够经过给予一个公共标识符与空间实体联络起来。 当特色数据的数据量较小时,能够在输入几许数据的一同,用键盘 输入;但当数据量较大时,一般与几许数据别离输入,并查看无误后 转入到数据库中。 为了把空间实体的几许数据与特色数据联络起来,有必要在几许数据 与特色数据之间有一公共标识符,标识符能够在输入几许数据或特色 数据时手艺输入,也能够由体系主动生成(如用次序号代表标识符)。只 有当几许数据与特色数据有一一同的数据项时,才干将几许数据与属 性数据主动地衔接起来;当几许数据或特色数据没有公共标识码时, 只需经过人机交互的办法,如选取一个空间实体,再指定其对应的属 性数据表来确认两者之间的联络,一同主动生成公共标识码。 当空间实体的几许数据与特色数据衔接起来之后,就可进行各种 GIS 的操作与运算了。当然,不论是在几许数据与特色数据衔接之前 的不同,GIS 数据库中的数据格局之间存在不兼容的问题。即不同的 GIS 软件所支撑的数据存储格局不能直接彼此运用。需经过格局转化 才干彼此被对方运用。 (1) 数据格局转化的内容 数据格局转化的内容包括三个方面的内容: ➢ 空间定位信息,即几许信息,首要是实体的坐标。 ➢ 空间联络信息,几许实体之间的拓扑或几许联络数据。 ➢ 特色信息,几许实体的特色阐明数据。 (2) 数据格局转化的办法 A、经过外部数据交流文件进行。大部分 GIS 东西软件都界说了 外部交流文件格局,如: (1)几许核算(间隔、周长、面积、重心)。 (2)线方针根本操作算法 A、直线求交算法 B、曲线润滑处理算法(张力样条、多项式拟合等) C、曲线简化(与 B 相反的操作)。 D、平行线处理 E、直角化处理 例:p123~134 (自学)。 图形修正的要害是点、线、面的捕捉,即怎么根据光标的方位找 到需求修正的要素,以及图形修正的数据安排。下面别离作扼要介绍。 图形修正是在核算机屏幕进步行的,因此首要应把图幅的坐标转 换为当时屏幕状况的坐标系和份额尺。设光标点为 S(x,y),图幅上某一 点状要素的坐标为 A(X,Y),则可设一捕捉半径 D(一般为 3~5 个象 素,这首要由屏幕的分辩率和屏幕的标准决议)。若 S 和 A 的间隔 d 小 于 D 则以为捕捉成功,即以为找到的点是 A,不然失利,持续查找其 它点。d 可由下式核算: 可是因为在核算 d 时需进行乘方运算,所以影响了查找的速度,因 此,把间隔 d 的核算改为: 即把捕捉规模由圆改为矩形,这可大大加速查找速度. (2) 线的捕捉算法 设光标点坐标为 S(x,y),D 为捕捉半径,线),… (xn,yn)。经过核算 S 到该线的每个直线段的间隔 di(如图 4—11 所示), 若 min(d1,d2,…dn-1)<D,则以为光标 S 捕捉到了该条线,不然为未捕 捉到。在实践的捕捉中,可每核算一个间隔 di 就进行一次比较,若 di <D,则捕捉成功,不需再进行下面直线段到点 S 的间隔核算了。 算法去除。如图,对一条线可求出其最大最小坐标值 Xmin,Ymin, Xmax,Ymax,对由此构成的矩形再向外扩 D 的间隔,若光标点 S 落 在该矩形内,才或许捕捉到该条线,因此经过简略的比较运算就可去 除许多的不或许捕捉到的状况。 关于线段与光标点也应该选用类似的办法处理。即在对一个线段进 行捕捉时,应先查看光标点是否或许捕捉到该线段。即对由线段两头 点组成的矩形再往外扩 D 的间隔,构成新的矩形,若 S 落在该矩形内, 才核算点到该直线段的间隔,不然应抛弃该直线段,而取下一向线段 持续查找。 能够看出核算量较大,速度较慢,因此可按如下办法核算。即从 S(x,y) 向线)作水平缓笔直方向的射线,取 dx,dy 的最小值作为 S 点到该线段的近似间隔。由此可大大减小运算量,进步查找速度。计 算办法为: 面的捕捉实践上就是判别光标点 S(x,y)是否在多边形内,若在多 边形内则阐明捕捉到。判别点是否在多边形内的算法首要有垂线法或 转角法,这儿介绍垂线法。 垂线法的根本思想是从光标点引垂线(实践上能够是恣意方向的 射线),核算与多边形的交点个数。若交点个数为奇数则阐明该点在多 为了加速查找速度,可先找出该多边形的外接矩形,即由该多边 形的最大最小坐标值构成的矩形,如图 4—15。若光标点落在该矩形中, 才有或许捕捉到该面,不然抛弃对该多边形的进一步核算和判别,即 不需进行作垂线并求交点个数的杂乱运算。经过这一进程,可去除大 量不或许捕捉的状况,大大削减了运算量,进步了体系的响应速度。 在核算垂线与多边形的交点个数时,并不需求每次都对每一线段 进行交点坐标的详细核算。对不或许有交点的线段应经过简略的坐标 比较敏捷去除。对图 4—16 所示的状况,多边形的边别离为 1~8,而 其间只需第 3、7 条边或许与 S 所引的笔直方向的射线相交。即若直线≤x≤x1 时才有或许与垂线相 交,这样就可不对 1,2,4,5,6,8 边进行持续的交点判别了。 关于 3、7 边的状况,若 y>y1 且 y>y2 时,必定与 S 点所作的垂线 时,必定不与 S 点所作的垂线相交。 这样就可不用进行交点坐标的核算就能判别出是否有交点了。 关于 y1≤y≤y2 或 y2≤y≤y1,且 x1≤x≤x2 或 x2≤x≤x1 时,如 图 4—17。这时可求出铅垂线与直线段的交点(x,y′),若 y′<y 则是 交点;若 y′>y,则不是交点;若 y′=y 则交点在线上,即光标在多 边形的边上。 失或重复,多边形中心点的遗失,数据断线、多边形不关闭等。 ➢ 空间数据方位不精确,点位不精确,线段过长或过短, 结点不重合.。 ➢ 份额尺不精确。 ➢ 数据变形。 ➢ 特色与空间数据衔接过错。 ➢ 特色不完整。 无论是地图盯梢数字化仍是地图扫描数字化,都不或许彻底正确, 因此,有必要进行空间数据的查看。常用的空间数据查看办法为: 4°、对等高线,经过确认最低和最高级高线的高程及等高距,编 制软件来查看高程的赋值是否正确; 5°、关于面状要素,可在树立拓扑联络时,根据多边形是否闭合 来查看,或根据多边形与多边形内点的匹配来查看等; 1°、符号规划与符号库树立功用。为了能以不同符号表明不同类 型的矢量数据,有必要具有符号规划与符号库树立功用。如新符号的创 建、旧符号的修正等等。 2°、符号设置功用。即为每一类空间数据指定选用的符号,包括符号 的形状、颜色、标准、图画等。 3°、注记装备功用。注记是地图上不行短少的重要信息,也是数据检 查的重要内容和参照信息。注记应确认其字体、巨细、间隔、颜色、 摆放、旋转等,最重要的确认其定位点。 4°、图形显现功用。应能将所搜集的矢量数据,以符号化的办法显现 在屏幕上,并能进行扩大、缩小、周游、分层显现等操作。 5°、查询功用。经过查询来发现问题,能够由几许数据查询其特色信 息,也可由特色信息查询其空间数据。 6°、绘图输出功用。即经过绘图机把所数字化的地图再以符号化的形 式输出,这是数据查看的根本办法。 图形修正的内容: ➢ 结点契合 ➢ 结点与线的契合 ➢ 清楚假结点 ➢ 删去与添加角点 ➢ 移动角点 ➢ 删去与添加弧段 ➢ 数据整理 ➢ 更新数据 1°、几许改换处理。 包括几许纠正处理和坐标改换处理。为了纠正由纸张变形所引起 的数字化数据的差错,几许纠正要以操控点的理论坐标和数字化坐标 为根据来进行。坐标改换的意图是将不同坐标系的数据一同到一个共 同坐标系的处理。 2°、投影改换处理。为了 GIS 地舆数据库中空间数据的一同性, 须将原图投影下的矢量数据转化为地舆坐标或指定投影下的数据。 3°、图形接边和拼接处理。在相邻地图的接合处或许会发生裂隙。 包括几许裂隙和特色裂隙。在主动接边无法处理时,需求人机交互进 行。接边处理完结后,还需求进行图幅的兼并处理,以得到无缝图层。 4°、图形图象的紧缩处理。 5°、数据格局的转化处理。矢量数据格局和栅格数据格局的转化。 在图形修正中,只能消除数字化发生的显着差错,而图纸变形发生 的差错难以改正,因此要进行几许纠正。几许纠正常用的有高次改换、 二次改换和仿射改换。 (1)、高次改换 为二次改换。二次改换适用于原图有非线性变形的状况,至少需求 5 对操控点的坐标及其理论值,才干求出待定系数。 仿射改换是运用最多的一种几许纠正办法,只考虑到 x 和 y 方向 上的变形,仿射改换的特性是: ·直线改换后仍为直线; ·平行线改换后仍为平行线; ·不同方向上的长度比发生改变。 关于仿射改换,只需知道不在同一向线上的三对操控点的坐标及其 理论值,就可求得待定系数。但在实践运用时,往往运用 4 个以上的 点进行纠正,运用最小二乘法处理,以进步改换的精度。 当体系所运用的数据是来自不同地图投影的图幅时,需求将一种投 影的几许数据转化成所需投影的几许数据,这就需求进行地图投影变 换。 地图投影改换的本质是树立两平面场之间点的一一对应联络。假定 原图点的坐标为 x , y (称为旧坐标),新图点的坐标为 X,Y(称为新坐 标),则由旧坐标改换为新坐标的根本方程式为: 完结由一种地图投影点的坐标改换为另一种地图投影点的坐标就是 要找出上述联络式,其办法一般分为三类: 的核算办法不同又可分为反解改换法和正解改换法。 反解改换法(又称直接改换法)。这是一种中心过渡的办法,即先 解出原地图投影点的地舆λ,关于 x,y 的解析联络式,将其代入新图 的投影公式中求得其坐标。即: 正解改换法(又称直接改换法)。这种办法不需求反解出原地图投影 点的地舆坐标的解析公式,而是直接求出两种投影点的直角坐标联络 式。即: 直接联络,能够选用多项式迫临的办法,即用数值改换法来树立两投 影间的改换联络式。例如,可选用二元三次多项式进行改换。二元三 次多项式为: 其间:n 为点数,Xi,Yi 为新投影的实践改换值,Xi′,Yi′为新投 影的理论值。根据求极值原理,可得到两组线性方程,即可求得各系 数的值。 有必要明晰,实践中所碰到的改换,决议于区域巨细,已知点密度, 数据精度,所需改换精度及投影间的差异巨细,理论和时刻上决不是 二元三次多项式所能归纳的。 C、数值解析改换法 当已知新投影的公式,但不知原投影的公式时,可先经过数值改换 求出原投影点的地舆坐标φ,λ,然后代入新投影公式中,求出新投 影点的坐标。即: 矢量数据紧缩的意图是删去冗余数据,削减数据的存贮量,节约存 贮空间,加速后继处理的速度。下面介绍几种常用的矢量数据的紧缩 算法,以及它们之间的异同点。 A、道格拉斯——普克法(Douglas—Peucker) 根本思路是(上图):对每一条曲线的首末点虚连一条直线,求一切 点与直线的间隔,并找出最大间隔值 dmax,用 dmax 与限差 D 比较: 若 dmax<D,这条曲线上的中心点悉数舍去; 若 dmax≥D,保存 dmax 对应的坐标点,并以该点为界,把曲线分 间点与其它两点连线的垂线间隔 d,并与限差 D 比较。若 d<D,则中 间点去掉;若 d≥D,则中心点保存。然后次序取下三个点持续处理, 直到这条线) 确认保存仍是舍去。设曲线上的点列为{pi},i=1,2,…,n,光栏 口经为 d,可根据紧缩量的巨细自己界说,则光栏法的施行进程可描绘 为: 1°、衔接 p1 和 p2 点,过 p2 点作一条笔直于 p1p2 的直线,此刻 a1 和 a2 为“光栏”鸿沟 点,p1 与 a1、p1 与 a2 的连线 为极点的扇形的两条边,这就界说 了一个扇形(这个扇形的口朝向曲线的前进方向,边长是恣意的)。经过 p1 并在扇形内的一切直线都具有这种性质,即 p1p2 上各点到这些直线 的垂距都不大于 d/2。 2°、若 p3 点在扇形内,则舍去 p2 点。然后衔接 p1 和 p3,过 p3 作 p1p1 的垂线,该垂线与前面界说的扇形边交于 c1 和 c2。在垂线 点((图 3—37 中为 b2 点) 落在原扇形外面,则用 c1 或 c2 代替(图 3—37 中由 c2 代替 b2)。此刻用 p1b1 和 p1c2 界说一个新的扇形,这当然是口径(b1c2)缩小了的“光栏”。 3°、查看下一节点,若该点在新扇形内,则重复第(2)步;直到发现 有一个节点在最新界说的扇形外停止。 4°、当发现在扇形外的节点,如图 3—37 中的 p4,此刻保存 p3 点, 以 p3 作为新起点,重复 1°~3°。如此持续下去,直到整个点列检测 完停止。一切被保存的节点(含首、末点),次序地构成了简化后的新点 列。 地筛选不用要的点,那就是一种好的算法。详细能够根据简化后曲线 的总长度、总面积、坐标均匀值等与原始曲线的相应数据的比照来判 较好,但有必要在对整条曲线数字化完结后才干进行,且核算量较大; 光栏法的紧缩算法也很好,并且可在数字化时实时处理,每次判别下 一个数字化的点,且核算量较小;垂距法算法简略,速度快,但有时 会将曲线的曲折极值点 p 值去掉而失线) 栅格数据的紧缩 都从左到右记载,也能够奇数行从左到右,偶数行从右到左。如图的 栅格数据可存储记载为:AAAAABBBAABBAABB。 AAAA AB B B AABB AABB 这种记载栅格数据的文件常称为栅格文件,且常在文件头中存有 该栅格数据的长和宽,即行数和列数和两方向的密度。这样,详细的 象元值就可接连存储了。其特色是处理便利,但没有紧缩。 并记载代码的重复个数。 关于上图,其编码为 A4 A1 B3 A2 B2 A2 B2。若内行与行之间不间 断地接连编码,则为 A5 B3 A2 B2 A2 B2。 关于游程长度编码,区域越大,数据的相关性越强,则紧缩越大。 四叉树编码是最有用的栅格数据紧缩编码办法之一,在 GIS 中有广 泛的运用。其根本思路为:将 2n×2n 象元组成的图画(缺少的用布景补 上)所构成的二维平面按四个象限进行递归切割,直到子象限的数值单 调停止,终究得到一颗四分叉的倒向树,该树最高为 n 级。关于上图 所构成的图画,可用四叉树编码法得到如下图所示的四叉树。 惯例四叉树除了要记载叶结点外,还要记载中心结点,结点之间 的联络靠指针。因此,为了记载惯例四叉树,一般每个结点需求 6 个 变量,即父结点指针、四个子结点的指针和本结点的特色值。 结点所代表的图画块的巨细可由结点地点的层次决议,层次数由 从父结点移到根结点的次数来确认。结点所的代表的图画块的方位需 要从根节点开端逐步核算下来。因此惯例四叉树是比较杂乱的。为了 处理四叉树的核算问题,提出了一些不同的编码。下面介绍最常用的 记载叶结点,并用地址码表明叶结点的方位。 线性四叉树有四进制和十进制两种,下面介绍的是一般运用的十进 制四叉树编码。十进制四叉树的地址码又称 Morton 码。 为了得到线性四叉树的地址码,首要将二维栅格数据的队伍号转化 为二进制数,然后穿插放入 Morton 码中,即为线性四叉树的地址码。 例如,关于第 5 行、第 7 列的 Moton 码为: 这样就可将用队伍表明的二维图画,用 Morton 码写成一维数据, 经过 Morton 码就可知道象元的方位。 把一幅 2 n×2 n 的图画紧缩成线°、按 Morton 码把图象读入一维数组。 2°、相邻的四个象元比较,一同的兼并,只记载第一个象元的 Morton 码。 3°、比较所构成的大块,相同的再兼并,直到不能兼并停止。 对用上述线性四叉树的编码办法所构成的数据还可进一步用游程 长度编码紧缩。紧缩时只记载第一个象元的 Morton 码。 关于上图所示图画的 Morton 为: 解码时,根据 Morton 码就可知道象元在图画中的方位(左上角), 本 Morton 码和下一个 Morton 码之差即为象元个数。知道了象元的个 数和象元的方位就可恢复出图画了。 线性四叉树编码的长处是:紧缩效率高,紧缩宽和紧缩比较便利, 阵列各部分的分辩率可不同,既可精确地表明图形结构,又可削减存 贮量,易于进行大部分图形操作和运算。缺陷是:不利于形状剖析和 办法辨认,即具有图形编码的不定性,好像一形状和巨细的多边形可 得出彻底不同的四叉树结构。 因为矢量数据的点到栅格数据的点仅仅简略的坐标改换,所以,这 里首要介绍线和面(多边形)的矢量数据向栅格数据的转化。 设直线段的两头点坐标转化到栅格数据的坐标系后为 (xA,yA),(xB,yB)。则栅格化的两种常用办法为 DDA 法(数字微分剖析法) 和 Bresenham 法。 对其取整就是该点的栅格数据了。 该办法的根本根据是直线的微分方程,即 dy∕dx=常数。其本质是 用数值办法解微分方程,经过一同对 x 和 y 各添加一个小增量来核算 下一步的 x,y 值,即这是一种增量算法。 2°、Bresenham 算法 该算法原来是为绘图机规划的,但相同合适于栅格化。该算法构思 奇妙,只需根据由直线斜率构成的差错项的符号,就可确认下一列坐 标的递增值。 根据直线 个卦限(如下图)。下面举斜率在第 一卦限的状况为例,其他卦限的状况类似。 该算法的根本思路可描绘为:如图 4—26,若直线≤△y∕△x<1∕2,则下一 点取(1,0)点。 点后,令 e=e+△y∕△x[SX)],若 e≥0 时,e=e-1。这样只需根据 e 的符号就可确认下一点的增量,即: 若 e≥0,取(1,1)点 若 e<0,取(1,0)点 为防止浮点运算,可令初值 e’=e×2×△x=2×△y-△x(当△x≥0 时,与 e 同号)。 当 e’0 时,y 方向获增量 1,即令 e’=e’-2×△x; 一般状况下 e’=e’+2△y 例如,一向线(如下图)。 起始点:e=-1∕2, 即 e’=-3, 取点① 第 2 点:e=-1∕2 1∕3=-1∕6,e’=-3+2△y=-1 取点② 第 3 点:e=-1∕6 1∕3 = 1∕6,即 e’=-1+2=1, 取点③且 e=-5/6,e’=-3; 第 4 点:e=1∕6 1∕3 = 1∕2 >0,即 e’=-5+2=-3, 取点 ④ 因 e≥1∕2,所以,e=1∕2-1=-1∕2。 顺次进行,直到抵达直线的另一端点。 这种算法不只速度快、效果好,并且能够理论上证明它是现在同类 各种算法中最优的。 B、面(多边形)的栅格化办法(介绍三种算法) 1°、内部点分散法 由一个内部的种子点,向其 4 个方向的邻点分散。判别新参加的点 是否在多边形鸿沟上,假如是,不作为种子点,不然当作新的种子点, 直到区域填满,无种子点停止。 该算法比较杂乱,并且或许构成堵塞而构成分散不能完结(如下图), 此外若多边形不彻底闭合时,会分散出去。 2°、扫描法 如下图,按扫描线的次序,核算多边形与扫描线的相交区间,再用 相应的特色值填充这些区间,即完结了多边形的栅格化。 该扫描线上交点右方的一切象素取原特色值之补。对多边形的每条边 作此处理,多边形的方向恣意。下图是一个简略的比方。 本算法的长处是算法简略,缺陷是关于杂乱图形,每一象素或许被 拜访屡次,添加了运算量。为了削减边填充算法拜访象素的次数,可 引进栅门。 所谓栅门指的是一条与扫描线笔直的直线,栅门方位一般取多边 形的极点,且把多边形分为左右两半。栅门填充算法的根本思路是: 关于每个扫描线与多边形的交点,将交点与栅门之间的象素用多边形 的特色值取补。若交点坐落栅门左面,则将交点右边,栅门左面的所 有象素取补;若交点坐落栅门的右边,则将栅门右边,交点左面的象 素取补。下图是该算法的示意图。 设 M 为灰度级数,Pk 为第 k 级的灰度的概率,nk 为某一灰度级 的呈现次数,n 为象元总数,则有: 关于地图,一般在灰度级直方图上呈现两个峰值(见上图),这时, 取波谷处的灰度级为阈值,二值化的效果较好。 白、污点、线划边际凹凸不平等。除了依托图画修正功用进行人机交 互处理外,还能够经过一些算法来进行处理。 给定其最小标准,缺少的消除;关于断线,采纳先加粗后减细的办法 进行断线相连;用低通型滤波进行破碎地物的兼并,用高通滤波提取 区域规模等等。 C、细化 所谓细化就是将二值图画象元阵列逐步剥除归纳边际的点,使之成 为线划宽度只需一个象元的骨架图形。细化后的图形骨架既保存了原 图形的绝大部分特征,又便于下一步的盯梢处理。 细化的根本进程是:(1)确认需细化的象元调集;(2)移去不是骨架的 象元;(3)重复,直到仅剩骨架象元。 细化的算法许多,各有优缺陷。经典的细化算法是经过 3×3 的象元 组来确认怎么细化的。其根本原理是,在 3×3 的象元组中,但凡去掉 后不会影响原栅格印象拓扑连通性的像元都应该去掉,反之,则应保 留。3×3 的象元共有 2 8 即 256 种状况,但经过旋转,去除相同状况, 共有 51 种状况,其间只需一部分是能够将中心点剥去的,如下图(1)、 (2)是可剥去的,而(3)、(4)的中心点是不行剥去的。经过对每个象元点 经过如此重复处理,终究可得到应保存的骨架象元。 假如是对扫描后的地图图画进行细化处理,应契合下列根本要求: 1°、坚持原线°、线°、细划后的骨架应是原线°、坚持图形的原有特征。 D、追寻 的坐标序列。其根本进程为: 1°、从左向右,从上向下查找线划起始点,并记下坐标。 2°、朝该点的 8 个方向追寻点,若没有,则本条线)进行下条线的追寻;不然记下坐标。 3°、把查找点移到新取的点上,转 2°。 留意的是,已追寻点应作符号,防止重复追寻。 E、拓扑化 为了进行拓扑化,需找出线的端点和结点,以及孤立点。 1°、孤立点:8 邻城中没有为 1 的象元。如图(1)。 2°、端点:8 邻城中只需一个为 1 的象元。如图(2)。 3°、结点:8 邻城中有三个或三个以上为 1 的象元。如图(3)。 GIS 的数据质量是指 GIS 中空间数据(几许数据和特色数据)在表 达空间方位、特色和时刻特征时所能到达的精确性、一同性、完整性 以及三者一同性的程度。 GIS 数据质量研讨的意图是树立一套空间数据的剖析和处理的体 系,包括差错源的确认、差错的辨别和衡量办法、差错传达的模型、 操控和削弱差错的办法等,使未来的 GIS 在供给产品的一同,顺便提 供产品的质量目标,即树立 GIS 产品的合格证准则。 从运用的视点,可把 GIS 数据质量的研讨分为两大问题。当 GIS 录 入数据的差错和各种操作中引进的差错已知时,核算 GIS 终究生成产 品的差错巨细的进程称为正演问题。而根据用户对 GIS 产品所提出的 差错限值要求,确认 GIS 录入数据的质量称为反演问题。显着,差错 传达机制是处理正反演问题的要害。 研讨 GIS 数据质量关于鉴定 GIS 的算法、削减 GIS 规划与开发 的盲目性都具有重要意义。假如不考虑 GIS 的数据质量,那么当用户 发现 GIS 的定论与实践的地舆状况相差较大时,GIS 会失掉诺言。 2°、特色精度:如要素分类的正确性、特色编码的正确性、注记 的正确性等,用以反映特色数据的质量。 2°、丈量数据:人差(对中差错、读数差错等)、仪差(仪器不完善、 缺少校验、未作改正等)、环境(气候、信号搅扰等)。 5°、地图:操控点精度,编绘、清绘、制图归纳等的精度。 6°、地图数字化精度:纸张变形、数字化仪精度、操作员的技能 等。 B 处理差错 处理差错是指 GIS 对空间数据进行处理时发生的差错,例如在下列处 理中发生的差错就是处理差错。 1°、几许纠正; 2°、坐标改换; 3°、几许数据的修正; 4°、特色数据的修正; 5°、空间剖析(如多边形叠置等); 6°、图形化简(如数据紧缩); 7°、数据格局转化; 8°、核算机截断差错; 9°、空间内插; 差错。差错传达在 GIS 中可归结为三种办法。 1°、代数联络下的差错传达:这是指对有差错的数据进行代数运 并等运算所引起的差错传达,如叠置剖析时的差错传达。 3°、推理联络下的差错传达:这是指不精确推理所构成的差错。 差错:数据与真值的差异,衡量数据精确性的目标。 精确度:数据与真值的挨近程度的目标 精度:数据的精细程度 不确认性:空间进程和特征不能被精确确认的程度。内容上是一个以 真值为中心的规模,规模越大,数据的不确认性越大。 数据项的百分率或均匀质量等级也可由核算机软件算出。例如,能够 检测文件格局是否契合标准、编码是否正确、数据是否超出规模等。 2°随机抽样检测 的质量的办法。用于推理的外部常识或信息如用处、数据历史记载、 数据源的质量、数据出产的办法、差错传递模型等。 了解输出效果怎么随输入数据的改变而改变,能够经过人为地在输入 数据中加上扰动值来查验输出效果对这些扰动值的灵敏程度。然后根 据合适度剖析,由相信域来衡量由输入数据的差错所引起的输出数据 的改变。 为了确认相信域,需求进行地舆灵敏度测验,以便发现由输入数据 的改变引起输出数据改变的程度,即灵敏度。这种研讨办法得到的并 不是输出效果的实在差错,而是输出效果的改变规模。关于某些难以 确认实践差错的状况,这种办法是行之有用的。 在 GIS 中,灵敏度查验一般有以下几种:地舆灵敏度、特色灵敏度、 面积灵敏度、多边形灵敏度、增删图层灵敏度等。灵敏度剖析法是一 种直接测定 GIS 产品可靠性的办法。 变空间剖析,包括份额不变和平移不变。标准不变是数理核算中常用 的一个准则,一方面在能确保用不同的办法能得到一同的效果,另一 方面又可在同一标准下合理地衡量估值的精度。 也就是说,标准不变空间剖析法使 GIS 的空间剖析效果与空间方位 的参阅系无关,以防止由基准问题而引起剖析效果的改变。 C、Monte Carlo 实验仿真 因为 GIS 的数据来历繁复,品种杂乱,既有描绘空间拓扑联络的几 何数据,又有描绘空间物体内在的特色数据。关于特色数据的精度往 往只能用打分或不确认度来表明。关于不同的用户,因为专业范畴的 约束和需求,数据可靠性的点评标准并不相同。因此,想用一个简略 的、固定不变的核算模型来描绘 GIS 的差错规矩似乎是不或许的。在 对所研讨问题的布景不十分了解的状况下,Monte Carlo 实验仿真是一 种有用的办法。 Monte Carlo 实验仿真首要根据经历对数据差错的品种和散布办法进 行假定,然后运用核算机进行模仿实验,将所得效果与实践效果进行 比较,找出与实践效果最挨近的模型。关于某些无法用数学公式描绘 的进程,用这种办法能够得到有用公式,也可查验理论研讨的正确性。 可选用离散办法搜集。这些数据搜集的进程能够看成是随机采样,其 中包括倾向性部分和随机性部分。前者代表所搜集物体的实践信息, 而后者是由观测噪声引起的。 空间滤波可分为高通滤波和低通滤波。高通滤波是从含有噪声的数 据中别离出噪声信息;低通滤波是从含有噪声的数据中提取信号。例 如经高通滤波后可得到一随机噪声场,然后用随机进程理论等办法求 得数据的差错。 对 GIS 数据质量的研讨,传统的概率论和数理核算是其最根本的理 论根底,一同还需求信息论、含糊逻辑、人工智能、数学规划、随机 进程、分形几许等理论与办法的支撑。 GIS 中数据搜集的办法一般可分为直接办法和直接办法两种。直 接办法是指直接从户外搜集,以获取观测数据、图画等,直接办法是 指从已有的图件进步行搜集。 直接办法获 取的数据受人差、仪差、环境等的影响,但已有传统的 办法能够处理。直接办法获取的数据中,除了含有直接办法中的差错 外,还有展绘操控点的差错、编绘的差错、制图归纳的差错,数字化 的差错等。 地图数字化是获取矢量数据的首要办法之一,也是 GIS 中的重要误 差源,是 GIS 数据质量研讨的要点之一。在地图数字化中,原图固有 差错和数字化进程中引进的差错是两个首要的差错源。下面对地图数 1)、地图固有差错的来历和类型 在地图的固有差错中,除了含有操控点和碎部点引进的差错外,至少 存在下列差错: (1)操控点展绘差错 展绘操控点是成图的第一步。当对地图的精度要求不高时,该项差错 可不考虑。 (2)编绘差错 一般点状特征的编绘精度优于线状特征的编绘精度,即便都是线状特 征,假如分辨率或宽度不同,编绘精度也不同。 (3)绘图差错 绘图差错是在绘图进程中发生的,其差错规模为 0.06—0.18mm.。 (4)归纳差错 归纳差错的巨细取决于特征的类型和杂乱程度,又取决于选用的制图 归纳办法,如取舍、移位、夸张等,因此,归纳差错极难量化。 (5)地图仿制差错和分版套合差错 这些都是地图印刷中发生的差错,如地图仿制差错的均方差为 0.1— 0.2mm。 (6)绘图材料的变形差错 地图一般印在纸上,跟着温度和湿度的改变,纸张的标准也会改变。 因为纸张在印刷时温度升高,纸张长度会伸长 1.5%,宽度会伸长 2.5%; 而当纸张枯燥和冷却后,其长度和宽度又别离缩短 0.5%和 0.75%。因 此,在地图印刷完结后,图纸在长、宽方向上的净伸长别离为 0.99% 和 1.73%。 (7)特征的界说 自然界中的许多特征并无明晰的鸿沟。例如,海岸线的方位、森林的 鸿沟等,但在地图上却有明晰的方位。 2)、数字化的差错 现在的地图数字化办法首要有盯梢数字化和扫描数字化两种。数字化 的精度首要受数字化仪的精度、数字化办法、操作员的水平、数字化 软件的算法等的影响,常选用下列办法进行点评。 1°、主动回归法 在对线划进行盯梢数字化的进程中,每隔必定时刻和间隔就记载一次 坐标值,因此能够以为这些数据是序列相关的。即某一点差错的巨细, 除受该点自身的影响外,还受前一点差错的影响。 因为盯梢数字化不只仅一个随机序列,并且是一个时刻序列,因此可 用数理核算中的时刻序列剖析法来确认数字化的差错。 2°、ε-Band 法 ε-Band 法又称差错带办法,即在一条数字化线的两边,各界说宽为 ε的规模,作为该数字化线的差错带,也就是用ε的值来阐明差错的 规模,以及处理多边形叠置等的差错。该办法适用于任何类型的 GIS 数据,要害是怎么给出合理的ε值。 3°、比照法 把数字化后的数据,用绘图机绘出,与原图叠合,挑选显着地物点进 行量测,以确认差错。除了几许精度外,特色精度、完整性、逻辑一 致性等也可用比照法进行对照查看。 在 GIS 的数据处理中,几许纠正、坐标改换、格局转化等的核算, 除了核算机字长的影响外,在理论上能够以为是无差错的,因此,数 据处理进程中的首要差错会集在与运用直接相关的处理中,下面举几 个比方阐明。 (1)、数字高程模型(DEM)的精度 数字高程模型(DEM)的数据来历是多种多样的,树立 DEM 的技 术也不相同。常用的办法是运用解析立体测图仪从立体航空像对上测 得高程,或者是运用数字化的地图等高线进行内插取得。此外,地上 丈量、声纳丈量、雷达丈量等数据也可作为 DEM 的数据源。 DEM 的精度首要受原始材料的精度(采样密度、丈量差错、地势 类别、操控点等)和内插的精度(内插办法、地势类型、原始数据的密度 等)的影响。在研讨 DEM 的精度时,一般都假定已排除了粗差的影响, 因为 DEM 的粗差难以勘探。 对 DEM 内插精度的预算办法有多种,但定论是相同的,即 DEM 的 内插精度首要受原始采样点的采样密度的影响,与不同的插值办法的 联络不很大。但在 DEM 精度鉴定的标准方面、地貌逼真度方面、DEM 的粗差勘探等方面仍没有得到满意的处理。 (2)、矢量数据栅格化的差错 矢量数据栅格化的差错可分为特色差错和几许差错两种。 在矢量数据转化为栅格数据后,栅格数据中的每个象元只含有一个 特色数据值,它是象元内多种特色的一种归纳。例如,在陆地卫星图 像上,每个象元对应的地上面积为 80m×80m,象元的特色值是象元 内各地物发射量的均匀值。假如象元内有一部分物体的反射率很高, 即便占象元的面积份额很小,方针元特色值的影响也很大,然后导致 分类过错,且丢掉一些其它有用信息。因此,象元越大,特色差错越 大。 几许差错是指在矢量数据转化成栅格数据后所引起的方位的差错, 以及由方位差错引起的长度、面积、拓扑匹配等的差错。几许差错的 巨细与象元的巨细成正比。其间矢量数据表明的多边形网用象元迫临 时会发生较严峻的拓扑匹配问题。 关于拓扑匹配差错问题,Frolov 和 Maling(1969)提出的最早的预算 办法是考虑一个象元被一条实践鸿沟线二等分时引起的差错问题。尔 后,Goodchild(1980)重新研讨了这个问题。 假如假定鸿沟线为一条随机穿过象元的直线,则对每个由鸿沟线切割 的象元 i,把其切除部分的均匀面积界说为差错方差,其预算公式为: 其间,S 是正方形象元的边长,a 为常数。Frolov 和 Maling 核算的 a 为 0.0452,后来 Goodchild 主张改为 0.0619。 多边形面积差错的预算是按悉数多边形鸿沟象元的差错和来核算的。 假如一个多边形的鸿沟象元有 m 个,则其差错方差为: Switzer(1975)提出了估量矢量数据栅格化的精度的另一种办法。其 剖析的条件是:假定差错仅仅是由栅格化引起的,不考虑观测差错。 该办法的根本思想是,假定存在一幅抱负的矢量地图,图上不同特色 的制图单元由很细的线分隔;对抱负地图进行观测采样得到一幅具有 规矩格网的栅格地图,把这两幅图进行叠置比较。虽然抱负地图是根 本不存在的,但在这一假定下,能够供给一种仅运用栅格地图自身来 预算矢量数据栅格化的精度的办法。该办法的详细核算进程从略。 多边形叠置差错核算的思路是,先核算单幅图或单层图的差错,再 核算叠置图的差错。因此,下面仅扼要评论单数据层的叠置问题。 多边形叠置往往是不同类型的地图、不同的图层,乃至是不同份额 尺的地图进行叠置,因此,同一条鸿沟线往往是不同的数据,这样在 叠置时必定会呈现一系列无意义的多边形。所叠置的多边形的鸿沟越 精确,越简略发生无意义的多边形。这就是拓扑匹配差错。 多边形叠置所构成的多边形的数量与原多边形鸿沟的杂乱程度有 关。将两个别离含有 V1 和 V2 个极点的多边形叠置后将发生至少 3 个, 至多 V1V21 个多边形。假如多边形之间具有核算独立性时,发生中 等数量的多边形;假如是高度相关的,则发生许多无意义的多边形。 多层叠置发生的无意义多边形实践上适当于矢量多边形栅格化引起 的面积匹配差错。面积匹配差错因数字化精度的进步而削减,虽然无 意义多边形的个数增多。 不管是用人机交互的办法把无意义的多边形兼并到大多边形中,还 是根据无意义多边形的临界值,主动兼并到大多边形中,以及用拟合 后的新鸿沟进行叠置,都会发生几许差错,既新鸿沟或许会违背已制 图的鸿沟方位(或实在方位)。为了确保人们习惯上以为重要的鸿沟线 的精度,如境地、河流、首要路途等,处理时应对这些鸿沟上的点加 权使他们能尽或许地不被移动。 除了几许差错,实践上每个进行叠置的多边形自身的特色就是有误 差的,因为特色值是分类的效果(如把植被分为不同的类别),而分类就 会发生差错。多幅图的叠置会使差错急剧添加,以致使叠置出的效果 不行信。 从技能的视点看,空间数据标准是指空间数据的称号、代码、分类 编码、数据类型、精度、单位、格局等的标准办法。每个地舆信息系 统都有必要具有相应的空间数据标准。空间数据标准触及到杂乱的科学 理论和技能办法问题。假如只针对某一地舆信息体系规划空间数据标 准,并不困难;假如所树立的空间数据标准能为咱们所供认,为大多 数体系所承受和运用,就比较杂乱和困难。空间数据标准的拟定关于 地舆信息体系的开展具有重要意义,但现在空间数据标准的研讨依然 落后于地舆信息体系的开展。 现在我国已有一些与 GIS 有关的国家标准,内容触及数据编码、数据 格局、地舆格网、数据搜集技能标准、数据记载格局等。 在地舆信息体系中,空间数据有必要按一同的标准进行分类。一般应 遵从以下准则: (1)遵从已有的国家标准,以利于全国规模内的数据同享。 (2)遵从国务院有关部委以及戎行正在运用的数据标准。 (3)遵从各范畴中遍及运用和认同的数据标准。 (4)当各种数据标准彼此对立时,应遵从由上而下的准则进行处理。 (5)拟定新的数据标准时,应尽或许参阅同类标准。 现在我国已有的与 GIS 有关的关于空间数据分类的国家标准如: GB2260-95 《中华人民共和国行政区划代码》 GB13923-92 《疆土根底信息数据分类与代码》 GB11708-89 《公路桥梁命名和编码规矩》 GB14804-93 《1:500、1:1000、1:2000 地势要素分类与代码》 等等。 空间数据的分类体系是规划数据标准的条件,而分类体系应考虑专业 范畴专家的定见,并根据地舆信息体系的要求来拟定,尽或许反映分 类的合理性。 跟着地舆信息体系的开展,数据同享已越来越重要。因为空间数据 模型的不同,空间数据的界说、表达和存储办法也不同,因此数据交 换就不那么简略。空间数据交流的首要办法有: (1) 外部数据交流标准。 这类标准一般是 ASCII 码文件,用户能够经过阅览阐明书来直接读写 这种外部数据格局。GIS 的外部数据交流格局一般包括矢量数据交流 格局、栅格数据交流格局和数字高程模型交流格局。 (2) 空间数据互操作协议。 拟定一套各方都能承受的标准空间数据操作函数,经过调用这些函数 以彼此操作对方的数据。 (3) 空间数据同享渠道。 选用客户机/服务器体系结构,各种 GIS 经过一个公共的渠道在服务器 存取一切数据,以防止数据的不一同性。 (4) 一同数据库接口。 在对空间数据模型有一同了解的根底上,各体系开发专门的双向转化 程序,将本体系的内部数据结构转化成一同数据库的接口。 跟着软硬件的开展,人们逐步感触到了外部数据交流格局的缺少,如 主动化程度不高,速度较慢等,但它究竟处理了不同 GIS 之间的数据 转化问题。 虽然空间数据互操作协议比外部数据交流标准便利,但因为各种软件 存储和处理空间数据的办法不同,空间数据的互操作函数又不或许很 巨大,因此往往不能处理一切问题。 空间数据同享渠道虽然是一个较好的思路,但现有的 GIS 软件各有自 己的底层,因此现在难以完结。 一同数据库接口,首要要求对实践国际进行一同的面向方针的数据理 解,这也是不易完结的。 空间数据同享存在着多种办法,欧美等发达国家致力于拟定空间数据 交流格局,前几年起到了较好效果。为促进地舆信息产业开展,结合 我国实践,应赶快完善我国空间数据交流(标准)格局。为此有必要参 照成功的先行经历和经验,科学简明可持续开展地拟定这一标准是特 别重要的。附录 1 给出了一征求定见稿以供参阅。 跟着地舆信息体系在社会各方面的开展,越来越多的地舆学科和信息技 术学科之外的个人、安排和安排也涉入到这一范畴,开端出产、处理和修正 数字地舆信息。可是这些安排从各自的视点出发来开展空间数据,使得人们 不知道存在什么样的数据、已有数据的质量怎么、以及怎样拜访和运用这些 数据效果。因此,火急需求采纳必定的办法来防止数据的重复性建造,一同 和谐不同数据部分之间的资源同享,这样跟着地舆空间数据集的数量、杂乱 性和多样性的添加,一个习惯数据集同享的标准化标准——空间元数据,也 就应运而生。 对空间元数据标准内容的研讨,国际上首要有美国联邦数据委员会 (FGDC)、国际标准化安排地舆信息/地球信息技能委员会(ISO/TC211)和 敞开的 GIS 联盟(OGC)进行,它们从不同旁边面对地舆空间元数据进行了描 述。国内近几年来现已提出了几个元数据标准,如《我国可持续开展信息共 享 Metadate 标准》、《我国生态体系研讨网络元数据标准》和《科学数据库元 元数据(Metadate):数据的数据,是关于数据和信息资源的描绘性信 息。图书馆的图书卡片就是关于一切书本的简略的元数据,它记载了每本书 的编号、标题、作者、要害字和出版日期等特色。 空间元数据(Geospatial Metadata):地舆的数据和信息资源的描绘性 信息。它经过对地舆空间数据的内容、质量、条件和其他特征进行描绘与说 明,以便人们有用地定位、点评、比较、获取和运用与地舆相关的数据。空 间元数据是一个由若干杂乱或简略的元数据项组成的调集。假如说地舆空间 数据是对地舆空间实体的一个笼统映射,那么能够以为,空间元数据是对地 理空间数据的一个笼统映射。空间元数据和地舆空间数据是对地舆空间实体 不同层次的描绘,是对地舆信息的不同深度的表达。 (1)用来安排和办理空间信息,并发掘空间信息资源,这正是数字地 球的特色和长处地点。经过它能够在 Intranet 或 Internet 上精确地辨认、定 位和拜访空间信息。 (2)协助数据运用者查询所需空间信息。比方,它能够依照不同的地 理区间、指定的言语以及详细的时刻段来查找空间信息资源。 (3)安排和保护一个安排对数据的出资。经过空间元数据内容,能够 充沛描绘数据集的详细状况,便于数据运用者得到数据的可靠性确保。一同, 当运用数据引起对立时,数据供给单位也能够运用空间元数据保护其利益。 (4)用来树立空间信息的数据目录和数据交流中心。一般由一个安排 发生的数据或许对其他安排也有用,而经过数据目录、数据署理机、数据交 (5)供给数据转化方面的信息。经过空间元数据,人们便能够承受并 了解数据集,并能够与自己的空间信息集成在一同,进行不同方面的剖析决 策,使地舆空间信息完结真实意义上的同享,发挥其最大的潜力。 2.空间元数据的分类 空间元数据能够依照所描绘的方针分为三层:高层元数据对应数据库, 中层元数据对应表,底层元数据对应数据项。各种元数据与描绘地舆实体的 (1)高层元数据(数据集系列 Metadata)。高层元数据是指一系列具有 一同主题、日期、分辨率以及办法等特征的空间数据系列或调集,它是用户 用于归纳性查询数据集的首要内容。在软件完结上,假如具有数据集系列 Metadata 模块,则既能够使数据集出产者便利地描绘微观数据集,并且也可 以运用户很简略地查询到数据集的相关内容,完结空间信息资源的同享。当 然,要获取数据集的详细信息,还需求经过中层元数据来完结。 Metadata 标准软件的中心,它既能够作为数据集系列 Metadata 的组成部分, 也能够作为后边数据集特色以及要素等内容的父 Metadata 数据集系列。在 Metadata 软件标准规划的初级阶段,经过该模块便能够全面反映数据集的内 容。可是跟着数据集的改变,为了防止重复记载元数据内容以及坚持元数据 的实时性,需求经过承继联络更新改变了的信息,这时元数据的层次性便显 得反常重要。 (3)底层元数据(要素、特色的类型和实例 Metadata)。要素类型是指 由一系列几许方针组成的具有类似特征的调集,比方数据会集的路途层、植 被层等就是详细的要素类型;要素实例是详细的要素实体,它用于描绘数据 会集的典型要素。特色类型是用于描绘空间要素某一类似特征的参数,如桥 梁的跨度是一个特色类型;特色实例则是要素实例的特色,如某一桥梁穿越 某一路途的跨度。该 Metadata 模块是元数据体系中详细描绘实践国际的重要 部分,也是未来数字地球中走向多级分辨率查询的根据。因此,咱们经过数 据集系列、数据集、要素类型等层次进程,便能够逐级对地舆国际进行描绘, 用户也能够依照这一进程,能够沿网络获取详细的数据集内容信息。 在详细完结时,能够用面向方针的技能完结以地舆单元为主线的层次结 构元数据办理树,树的叶结点衔接空间数据物理存储的“层”,面向地舆单元 的空间操作经过元数据办理树效果于图层。 为了便于不同体系之间的空间数据和空间元数据彼此交流,许多安排和 安排对空间元数据所要描绘的一般内容进行层次化和范式化,指定出可供参 考与遵从的空间元数据标准的内容结构。 空间元数据标准由两层组成,其间第一层是目录层,它所供给的信息主 要用于对数据集信息进行微观描绘,合适在数字地球的国家级空间信息交流 中心或区域以及全球规模内办理和查询空间信息时运用。第二层是空间元数 据标准的主体,它由八个根本内容部分和四个引证部分组成,其间根本内容 部分包括标识信息、数据质量信息、数据集承继信息、空间数据表明信息、 空间参阅系信息、实体和特色信息、发行信息、以及空间元数据参阅信息等 八个方面的内容,别的四个引证部分包括引证信息、时刻规模信息、联络信 息以及地址信息。它们之间的联络如图 (1)标识信息。是关于地舆空间数据集的根本信息。经过标识信息, 数据出产者能够对有关数据集的根本信息进行详细的描绘,比方数据集的名 称、作者信息、所选用的言语、数据集环境、专题分类、拜访约束等,一同 用户也能够根据这些内容对数据集有一个整体了解。 (2)数据质量信息。是对空间数据集质量进行整体点评的信息。经过 这部分内容用户能够取得有关数据集的几许精度和特色精度等方面的信息, 也能够知道数据集在逻辑上是否一同以及它的齐备性,这是用户对数据集进 行判别以及决议数据集是否满意需求的首要判别根据。数据出产者也能够通 过这部分内容对数据集质量点评的办法和进程进行详细的描绘。 (3)数据集承继信息。是树立该数据集时所触及的有关事情、参数、 数据源等的信息,以及担任这些数据集的安排安排信息。经过这部分信息便 能够对树立数据集的中心进程有一个详细的描绘,比方当一幅数字专题地图 的树立经过了航片判读、清绘、扫描、数字地图修正以及检验等进程时,应 对每一进程有一个扼要描绘,运用户对数据集的树立进程比较明晰,也使数 据集每一进程的职责比较清楚。 (4)空间数据表明信息。是数据会集用来表明空间信息的办法的描绘, 如空间数据类型、空间数据结构、矢量方针描绘、栅格方针描绘等内容,它 是决议数据转化以及数据能否在用户核算机渠道上运转的有必要信息。运用空 间数据表明信息,用户便能够在获取该数据集后对它进行各种处理或剖析了。 (5)空间参阅系信息。是关于空间数据集地舆参阅体系与编码规矩的 描绘,它是反映实践国际与地舆数字国际之间联络的通道,比方地舆标识码 参照体系、水平坐标体系、笔直坐标体系以及大地模型等。经过空间参阅系 中的各元素,能够知道地舆实体转化成数字方针的进程以及各相关的核算参 数,使数字信息成为能够衡量和决议计划的根据。 (6)实体和特色信息。是关于数据集信息内容的信息,包括实体类型 及其特色、特色值、域值等方面的信息。经过该部分内容,数据集出产者可 以详细地描绘数据会集各实体的称号、标识码以及意义等内容,也能够运用 户知道各地舆要素特色码的称号、意义等。 (7)发行信息。是关于数据集发行及其获取办法的信息,包括发行部 门、数据资源描绘、发行部分职责、订货程序、用户订货进程以及运用数据 集的技能要求等内容。经过发行信息,用户能够了解到数据集在何处,怎样 获取、获取介质以及获取费用等信息。 (8)空间元数据参阅信息。是关于空间元数据的标准、版别、现时性 与安全性等方面的信息,它是当时数据集进行空间元数据描绘的根据。经过 该空间元数据描绘,用户便能够了解到所运用的描绘办法的实时性等信息, 加深了对数据集内容的了解。 (9)引证信息。是引证或参阅该数据集时所需的扼要信息,它自己不 独自运用,而是被根本内容部分的有关元素引证。它首要由标题、作者信息、 参阅时刻、版别等信息组成。 (10)时刻规模信息。是关于有关事情的日期和时刻的信息,该部分是 根本内容部分的有关元素引证时要用到的信息,它自己不独自运用。 (11)联络信息。是同与数据集有关的个人和安排联络时所需的信息, 包括联络人的名字、性别、所属单位等信息。该部分是根本内容部分的有关 元素引证时要用到的信息,它自己不独自运用。 (12)地址信息。是同安排或个人通讯的地址信息,包括邮政地址、电 子邮件地址、电话等信息。该部分是描绘有关 上一篇:gis数据处理 下一篇:箩筐共享|GIS在各个领域的运用 |