寻求实现通过苹果序列号定位查询产品相关信息提取网址并定位到查询结果所在行。

国土资源部信息化工作办公室关于《国土资源信息专用标准规则》等4项标准试用的通知
  根据数据访问频率、时间、容量、性能要求等因素,制定数据生命周期存储策略,实现数据分级存储,以提高数据存储管理效率。
  1)数据中心应按统一要求建立数据资源目录;
  2)应根据数据组织框架组织数据,实现数据的统一管理和存储,减少不必要的重复投资,专题数据库可采用最小图层单元存储,其语义尽量统一,保证国土资源数据库逻辑一致性;
  3)选用稳定性好的关系型数据库和中间件,实现空间数据和属性数据的一体化管理,并尽量保持不同应用系统中间件版本一致性;
  4)根据在线、近线、离线数据量需求,确定一级磁盘阵列、二级存储设备和磁带库存储设备容量比例,建立与业务应用要求相匹配的分级存储策略,并能够实现数据在不同存储介质的有效迁移。
7 数据运行与维护管理
  建立主机和数据运行与维护各项管理制度,规范运行与维护业务流程,有效开展运行监控与维护、故障诊断排除、数据备份与恢复、归档与检索,以保障国土资源数据库正常运转,使系统、数据库在灾难发生时快速进行原系统恢复,以保证数据的安全性。
  数据运行与维护管理应包括以下主要过程:
  7.2.1 制定数据运行与维护方案
  制定科学合理的数据运行与维护方案。具体内容包括:
  1)根据应用需求、破坏程度、经济损失、社会影响的程度,划分应急处理等级和响应时间,并制定数据运行与维护计划;
  2)明确相应的组织体系,确定职责任务,落实防范重点和关键环节;
  3)制定工作程序,建立保障系统。
  7.2.2 数据备份与恢复管理
  根据数据备份制度和备份策略,按照操作规程进行系统和数据日常备份,在系统出现异常时根据采用的备份策略进行恢复操作。
  1)制定数据备份策略,确定各类数据需备份的内容、时间及方式;
  2)尽量实现数据的全自动备份和跨平台集中管理;
  3)定期开展数据备份,以防止由于系统意外故障造成数据信息丢失;
  4)制定数据恢复预案,做好详细的灾难恢复计划,防备数据丢失;
  5)对介质的进行有效管理,对历史数据进行定期归档;
  6)根据灾难恢复计划,应定期进行灾难演练,以防备系统崩溃和数据丢失。
  7.2.3 日常管理监控
  按照维护计划定期进行数据资源目录、数据库系统维护,确保数据库得到经常性的监控、维护和优化。主要内容包括:
  1)数据库一致性检查;
  2)数据目录和索引更新与重建;
  3)系统数据库备份以及用户数据库备份;
  4)文件大小检查;
  5)系统冲突性检查;
  6)监测批处理、数据查询作业是否正确执行;
  7)查看日志的错误;
  8)复制日志代理的运行情况;
  9)复制分发清除作业是否正确执行;
  10)整理数据库碎片,监测数据库大小、增长情况;
  11)监测磁盘自由空间、释放磁盘空闲空间;
  12)监控用户操作和使用数据情况。
  7.2.4 数据归档与检索
  根据数据使用的频率、数据量和磁盘容量进行数据离线归档,在需要情况下,可实现归档数据检索在线处理。
  7.2.5 监督和评价
  1)聘请或委托专门机构,定期检查评估数据运行与维护管理情况,按月通报检查结果,并提出改进意见;
  2)聘请有关专家、用户担任监督员,对数据运行与维护管理进行监督,并定期报告监督情况;
  3)由第三方监控数据管理系统安全运行状态,形成定期监控报表;
  4)月度检查情况、监督员监督报告和监控报表将与目标考核挂钩,并作为数据中心运行评优的重要依据;
  5)定期对数据中心的运行状况进行审核和评价,察看系统是否仍处于有效适用状态,为数据中心数据管理与维护工作的改进和扩展提供依据。
  1)数据文件的管理尽量采用元数据管理方式,并定期对元数据库进行管理和维护;
  2)可采用数据安全综合监控管理平台、数据访问行为控制、数据安全综合审计等进行数据运行与维护综合管理;
  3)数据运行维护过程应采用实时监控、定期维护与应急故障处理相结合的机制,实时监控能实现动态监测系统软硬件运行状态,并实现对用户访问、查询、下载进行监控和记录;
  4)按照特定周期,对各系统进行定期维护和性能调优;
  5)制定全备份、增量备份、累积备份等备份策略,并能使数据备份工作以自动方式进行,采用多层体系结构的备份软件,实现数据备份的统一管理,保证数据一致性,根据应急处理等级和响应时间要求,及时处理系统故障,保障数据库正常运行;
  6)系统崩溃后,应能够在较短时间内完成数据库的还原与恢复,恢复方式可采用全盘恢复、个别文件恢复和重定向恢复等方式,采用灾难恢复技术,应支持对整个系统的恢复;
  7)备份与恢复系统应考虑网络带宽对备份性能的影响、备份服务器的平台选择及安全性、备份系统容量的适度冗余、备份系统良好的扩展性等因素。
8 数据更新管理
  根据国土资源数据中心有关规定和各类专题数据库运行管理职能,建立可持续的数据更新机制,由数据库更新职能部门对通过生产、汇交或交换获得现势数据完成本级中心数据库的版本升级,实现数据库更新的安全性、有效性和现势性,并确保数据更新能够满足有关数据管理和应用要求。
  国土资源数据中心各类专题数据库更新由具有数据库更新职能部门具体负责。数据库更新管理应包括以下主要过程:
  8.2.1 制定数据库更新策略
  建立有效的数据库更新方式,实现数据的定期、有效更新。按照事件数据的发生周期进行数据库的定期更新。数据更新可采用多种方式,在对数据进行远程更新时,设定相应的更新频率(按年、按月、按季度、实时)、更新范围(整体、部分)、传输方式(网络、物理介质)、更新方式(脱机检查、联机更新)和历史数据保存方法等。
  8.2.2 更新申请与审批
  根据国土资源数据中心数据管理现状,专题数据库更新一般由业务部门提出申请,经主管领导审批同意后,数据中心执行更新;日常业务数据更新根据系统权限管理功能自动实现更新;基础地理数据库一般由数据中心负责更新。
  8.2.3 更新执行
  采用既定策略进行数据更新操作。主要包括更新实施前的数据备份、更新数据与元数据一致性处理、原版本数据归档和新版本数据生成等。
  8.2.4 更新确认
  数据中心或负责更新的业务部门应对更新的数据进行检查,并更新相关系统元数据记录。在数据更新结束后,系统将对数据更新的过程记录日志,以备审计和回溯。
  1)数据更新应按照相应的权限管理、审批程序和操作规范执行;
  2)专题数据库设计应做到最小冗余,避免内容重复,权威机构确定并更新权威数据,不允许跨部门直接对其他专题数据库进行更新;
  3)各数据库之间应建立数据关联,数据更新时从已建数据库中自动提取相关信息,并进行逻辑检查,保证数据更新的一致性;
  4)采用远程数据更新需要使用符合国家保密要求的网络;
  5)系统应对数据更新的过程记录日志,以备审计和回溯;
  6)数据和数据库更新时,需要根据数据管理系统功能设计同时更新数据中心相应元数据和数据资源目录。
9 数据共享与交换管理
  按照统一的数据服务模式,建立基于网络的国土资源数据共享与交换系统,为用户提供多种方式的共享服务,并实现各级数据中心之间的数据安全、可靠的交换。
  9.2.1 数据分级分类管理
  基于国土资源数据的公益性、保密性等要求以及用户群等因素,对国土资源数据进行分类分级管理,主要包括数据共享等级划分、用户分级分类、数据共享方式和数据共享措施等。
  9.2.2 建立数据共享交换服务机制
  建立规范化的数据共享与交换管理机制,保证共享与交换系统的稳定持续运行。
  1)参照国家、行业标准,制定数据中心数据共享与交换相关技术标准;
  2)根据数据性质不同,采用用户分级制度,按照用户的权限提供数据共享服务;
  3)涉密数据和非公开数据的认定参照国家或部门有关规定,申请单位应具备相应资格。
  9.2.3 建立数据共享与交换系统
  数据共享与交换系统建设主要包括基础平台、共享与交换服务体系、信息发布与用户管理体系三个部分。
  1)基础平台主要指通信网络平台和数据库平台;
  2)共享与交换服务体系由目录服务、数据服务和功能服务等组成;
  3)信息发布与用户管理体系包括信息发布方式和用户服务管理等。
  9.2.4 数据共享与交换审核
  依据数据服务流程,由相关人员对共享与交换数据进行审核,确保运行过程数据安全和数据质量。
  1)共享和交换数据应符合国家信息安全和保密相关规定,内容包括元数据、数据实体、以及其它相关信息;
  2)非涉密数据交换可采用网络远程方式进行,数据内容应以电子报盘数据内容及电子报盘压缩数据包格式进行;对于数据量小、非涉密数据可通过Internet等提供在线方式进行;
  3)共享与交换数据库采用单独的服务器,并与内部网络系统实现物理隔离,共享系统应具有用户统计管理功能,针对不同共享用户和不同服务内容应规定响应时限;
  4)利用中间件技术,或其他相关的传输服务程序,保证当在传输过程中发生的各种异常情况时,将数据安全、可靠、完整地传送到目的地,数据交换系统需提供日志、审计、查询、监控等辅助功能,以增加数据交换过程的透明度,提高数据交换过程可管理性。
10 数据安全管理
  以数据安全为重点,统一规划,建立信息安全认证体系、运行环境的安全保障系统和功能完备的容灾备份系统,确保数据中心的物理安全、网络安全、系统安全和数据安全。
  1)原则上,国土资源数据中心物理安全应满足《GB/T 信息安全技术 信息系统安全等级保护基本要求》第三级物理安全的技术要求;
  2)涉密系统使用单位须依据国家的有关规定和法律法规建立保密管理制度。
  1)国土资源数据中心应具备性能较为完善的网络安全设施,非涉密系统网络基础设施建设应符合《GB/T 信息安全技术 网络基础安全技术要求》;
  2)涉及国家机密、部门敏感信息的局域网的安全标准不得低于《GB
计算机信息系统安全保护等级划分准则》中规定的第二级-系统审计保护级。
  1)国土资源数据中心应依据国家信息系统安全保护的相关规定和《GB/T 信息安全技术 信息系统安全等级保护定级指南》确定本中心信息系统的安全保护等级;
  2)涉密信息系统建设使用单位应当依据《BMB20-2007 涉及国家秘密的信息系统分级保护管理规范》的有关要求,加强涉密信息系统运行中的保密管理,定期进行风险评估,消除泄密隐患和漏洞。
  1)所有汇交的数据资料应严格按照有关数据资料管理规定进行分类存档管理;
  2)应设立信息安全管理工作的职能部门,配备专职安全管理员,负责数据中心数据安全工作,并与关键岗位人员签署岗位安全协议和保密协议;
  3)根据国家保密有关法律法规,组织完成数据安全定级工作,明确制度、分清职责、分级管理、逐级落实;
  4)应采用数据加密、数字签名、数字证书及内容防篡改等技术,防止敏感数据被非法访问、修改和破坏,保证数据的完整性;
  5)应具备数据访问的身份鉴别、安全标记、访问控制、可信路径、安全审计、剩余信息保护等功能的用户识别系统,按照“用户级别及权限”的规定来授权用户对资料的访问,防止越权访问或未授权的有意或无意地泄露、修改或破坏数据;
  6)对于通过非网络下载形式提供的数据共享服务(包括涉密数据),定期将数据提供合同、协议或其它有效凭证的复印件等进行归档和备案;
  7)重要大型数据库必须运行于专门的服务器或工作站上,并实现异地备份;
  8)在数据资源终止阶段,对于数据转移、暂存和清除、设备迁移或废弃、存储介质的清除或销毁等活动须按照《GB/T ×××××-××××信息安全技术 信息系统安全等级保护实施指南》的要求执行,如果是涉密数据,应该按照国家相关部门的规定进行转移、暂存和清除;
  9)涉密数据资料的存储、传输、共享、使用应指定专人负责,并严格按照国家有关保密的法律、法规执行。
(规范性附录)
国土资源数据中心数据运行与维护管理要求
 为了规范各级国土资源数据中心的数据管理、运行和维护,保证国土资源数据安全和数据服务功能实现,根据《国土资源数据中心数据管理与维护指南》的原则和基本要点,制定本管理要求。
 国土资源数据中心应本着科学、高效、共享、保密的原则进行数据的汇交接收、组织建库、数据存储、运行与维护、数据更新、共享交换等运行维护管理工作,实现数据管理的安全和规范化。
 本要求适用于国家、省和市县级国土资源数据中心数据管理与维护工作。
数据管理与维护的基础条件
 为了保障国土资源数据中心数据安全和系统的正常持续运行,数据中心需具备以下场地条件、软硬件基础设施和人员组织:
  1.具备与信息系统安全等级相适应的独立工作场地和机房。制定机房管理规定。
  2.具备必要的网络相关设备、信息安全设备、数据库服务器、WEB服务器、数据存储备份设备等和数据库管理系统和数据存储管理平台。制定软硬件设备管理规定。
  3.根据需要和实际条件建立与级别相适应的电子政务专网、内部局域网,恰当处理与Internet的连接关系,应将涉密网和非涉密网物理隔离。制定网络管理规定。
  4.应制订数据管理工作预案,建立相对独立的容灾系统,有条件的可建立异地容灾。
  5.应设置固定岗位并配备相应数量工作人员,明确职责分工。制定数据中心人员组织管理规定。
数据接收管理
 国土资源数据中心应依据有关行政管理机关授权制定相应的数据成果汇交管理办法等相关制度。
  1. 数据接收应由数据中心具体统一负责,各责任单位分工协作完成。
  2. 应明确数据汇交的责任单位和汇交数据范围。
  3. 应明确数据接收的程序。
  4. 应明确数据汇交的内容、方式、期限、责任和义务等基本要求,以及汇交数据的检查、审核、登记、保存技术方法。
  5. 应指定专门人员负责数据的接收、审查、签收和接收后数据的管理。
  6. 涉密数据的汇交须根据国家有关保密的法律、法规执行,涉密数据不得通过Internet进行汇交。
数据组织与存储管理
 国土资源数据中心应制定数据组织管理规范。
  1.以相关标准为依据,形成一套完整的数据库数据组织规范和存储框架,便于数据中心各类数据库统一应用服务。
  2.针对数据中心管理的海量各类国土资源数据,根据专题、区域、类型等特征建立数据资源目录,实现数据资源统一管理和共享服务。
 国土资源数据中心应制定数据存储管理规范。
  1.制订数据生命周期管理策略,实现分级存储管理,提高对海量国土资源数据存储管理水平。
  2.采用,并建立元数据库。
  3.制定严格的质量检查和控制制度,统一、规范数据入库管理。
 国土资源数据中心应制定数据存储归档管理制度。
  1.制定数据存储管理策略,明确数据存储模式、要求等内容。
  2.制定数据归档管理制度。明确数据归档流程。
  3.制定数据档案管理制度。
数据运行与维护管理
 国土资源数据中心应制定数据的运行与维护管理制度。
  1.制定科学合理的数据运行与维护方案。
  2.明确数据运行维护人员的职责、工作内容、安全操作规范等事项。
  3.明确数据中心的日常维护、例行巡检和监控管理内容,实行异常、突发事件报告制度。
 国土资源数据中心应建立数据备份与恢复管理相关制度。
  1.应对备份信息的备份方式、备份频度、存储介质和保存期等进行规范。
  2.应根据数据的重要性和数据对系统运行的影响,制定数据的备份策略和恢复策略,备份策略须指明备份数据的放置场所、文件命名规则、介质替换频率和将数据离线运输的方法。
  3.应建立控制数据备份和恢复过程的程序,对备份过程进行记录,所有文件和记录应妥善保存。
  4.应定期执行恢复程序,检查和测试备份介质的有效性,确保可以在恢复程序规定的时间内完成备份数据的恢复。
  5.应在统一的应急预案框架下制定不同事件的数据应急恢复预案,应急预案框架应包括启动应急预案的条件、应急处理流程、系统恢复流程、事后教育和培训等内容。
数据更新管理
 国土资源数据中心应制定数据更新管理制度。
  1.应建立数据更新管理制度,进行更新前,向主管领导申请,更新和更新方案经过评审、审批后方可实施,并在实施后将变更情况向相关人员通报。
  2.应制定数据更新策略,明确数据更新的责任单位、更新周期、更新方式。
  3.应建立数据更新控制的申报和审批程序,对更新影响进行风险分析,记录变更新实施过程,并妥善保存所有文档和记录。
  4.应建立数据更新日志,确保历史数据可追溯。
  5.应建立中止更新并从失败更新中恢复的文件程序,明确过程控制方法和人员职责,必要时对恢复过程进行演练。
数据共享与交换管理
 国土资源数据中心应制定数据共享管理制度。
  1.建立国土资源数据共享机制,保证共享服务有效运行。
  2.建立数据共享平台,制定数据共享应用策略。
  3.制定共享管理办法,确定共享数据内容、共享数据等级、数据共享范围、方式、措施等内容,明确数据共享审批程序、保密要求、用户责权、处罚措施等。
  4.建立信息发布平台,制定信息发布安全管理策略。
  5.明确信息发布的主体、审核程序、信息更新机制、信息安全策略等内容,以及突发事件的应对措施。
  6.应对共享用户进行审核,根据用户权限提供服务,防止越权使用数据。
  7.数据发布应建立用户登记、权限管理和数据发布审查等相关制度。
  8.对于涉密和非公开数据共享,必须满足国家有关保密的法律、法规要求。
 国土资源数据中心应制定数据交换管理制度。
  1.数据交换应实行统一领导,统一管理的原则。
  2.应建立数据交换标准体系,规范数据交换的格式、内容、元数据、技术文档等。
  3.应建立数据交换审批文件化程序,记录交换实施过程,并妥善保存所有文档和记录。
  4.数据交换需填写数据交换日志。
  5.数据交换管理应建立数据安全控制方案、用户交叉权限体系和实时监控机制。
  6.涉密数据的交换必须根据国家有关保密的法律、法规执行。
数据安全管理
 国土资源数据中心建立数据安全管理制度。
  1.根据数据安全工作的总体方针和安全策略,对数据安全管理活动中的各类管理内容建立相应安全管理制度和操作规范。
  2.形成由安全策略、管理制度、操作规程等构成的全面的信息安全管理制度体系。
 国土资源数据中心应设立数据安全管理工作的职能机构。
  1.明确管理机构职责和安全工作的目标、范围、原则和安全框架等。
  2.设立安全主管、安全管理各个方面的负责人岗位,并定义各负责人的职责。
  3.建立健全数据日常管理操作规程。
  4.组织安全意识教育、岗位技能培训和相关安全技术培训。
 国土资源数据中心建立数据安全审批、检查和考核制度。
  1. 应根据数据安全机构和岗位的职责明确授权审批事项、审批部门和批准人等。
  2. 针对数据变更、重要操作、物理访问和系统接入等事项建立审批程序,按照审批程序执行审批过程,对重要活动建立逐级审批制度。
  3. 记录审批过程并保存审批文档。
  4. 制定数据安全审核和安全检查制度,规范安全审核和安全检查工作,定期按照程序进行安全审核和安全检查活动。
  5. 应定期对各个岗位的人员进行安全技能及安全认知的考核,并对考核结果进行记录并保存。
 国土资源数据中心人员安全管理。
  1. 应配备专职安全管理员,不可兼任。
  2. 关键事务岗位应配备多人共同管理。
  3. 应签署保密协议。
  4. 应从在职人员中选拔重要岗位人员,并签署岗位安全协议。
  5. 应指定或授权专门部门办理数据安全人员录用、调离手续。
 国土资源数据中心数据存储介质管理。
  1. 应建立数据存储介质安全管理制度,对介质的存放环境、使用、维护和销毁等方面做出规定。
  2. 数据存储介质在物理传输过程要严格执行审批制度,涉密介质必须经过审批才能带离机房或办公地点。
  3. 应对存储介质的使用过程、送出维修以及销毁等进行严格的管理,对带出工作环境的存储介质进行内容加密和监控管理,对送出维修或销毁的介质应首先清除介质中的敏感数据,对保密性较高的存储介质未经批准不得自行销毁。
  4. 应对介质归档和查询等进行登记记录,并根据存档介质的目录清单定期盘点。
  5. 应根据数据备份的需要对某些介质实行异地存储,存储地的环境要求和管理方法应与本地相同。
  6. 对重要介质中的数据和软件采取加密存储,根据所承载数据和软件的重要程度对介质进行分类和标识管理。
 国土资源数据中心密码管理。
  1. 根据国家密码管理局《信息安全等级保护密码管理办法》,应建立数据中心密码使用管理制度,使用符合《国家密码产品生产管理规定》的密码技术和产品。
  2. 应确保密码产品采购和使用符合国家密码管理局的要求。
 依据《涉及国家秘密的计算机信息系统分级保护技术要求》、《涉及国家秘密的信息系统分级保护管理规范》等有关规定,制定涉密数据安全使用管理办法。
  1. 应明确数据保密的边界和安全保护等级。
  2. 应组织相关部门和有关安全技术专家对数据保密定级结果的合理性和正确性进行论证和审定。
  3. 数据保密定级结果须经过相关部门的批准。
  4. 保密数据传输过程要有严格的审批制度。
  5. 存储、管理和传输保密数据的涉密系统网络建设与使用必须经过有关部门批准。
 在数据中心数据接收、组织存储、运行维护、更新交换过程中,明确职责和责任人,制订相应处罚措施。
 本要求的解释权属于国土资源部。
 本要求自发布之日起施行。
  [1] SDS/T
科学数据共享工程技术标准《科学数据共享概念与术语》第1部分:概念
  [2] ,公通字[2007]43号
  [3] ANSIX 3.1 72-1990 美国信息系统国家标准字典(ANDIS)
  [4] 国家科学数据共享工程技术标准《国家科学数据中心建设规范》,2005
  [5] SDS/T ,科学数据共享工程技术标准《科学数据中心(网)运行管理》
  [6] 全国国土资源信息网络系统安全管理规定(试行),国土资源部信息中心,2002
  [7] 全国国土资源信息网络系统建设规范,国土资源信息化工作标准,2002
  [8] 全国金土工程总体方案,国土资源部,2006年
  [9] SZl1 成果地质资料电子文件汇交格式(试行)
  [10] SZ1999XXX-200X 全国国土资源信息网络系统建设规范(试行)
  [11] GB/T 信息安全技术 信息系统安全等级保护基本要求
  [12] GB/T XXXXX -XXXX 信息安全技术 信息系统安全等级保护实施指南(报批稿)
  [13] BMB20-2007 涉及国家秘密的信息系统分级保护管理规范
  [14] GB/T
基础地理信息要素分类与代码
  [15] GB/T
信息安全技术 数据库管理系统安全技术要求
  [16] GB/T
地理空间数据交换格式
  [17] GB/T
文献保密等级代码与标识
  [18] GB/T1.1-2000 标准化工作导则 第1部分:标准的结构和编写规则
  [19] GB/T1.1-2002 标准化工作导则 第2部分:标准的规范性技术要素内容的确定方法
国土资源数据库数据质量检查验收规范
Specification for data quality inspection and acceptance
of land and resources databases
国土资源部信息中心
  1   范围
  2   规范性引用文件
  3   术语和定义
  4   数据检查验收的基本要求
  4.1   检查验收的依据
  4.2   检查验收方式
  4.3   检查验收方案的制定
  4.4   检查验收程序
  4.5   数据质量等级的划分
  5   数据质量元素和缺陷分级
  5.1   数据质量元素
  5.1.1   数据质量定量元素
  5.1.2   数据质量定性元素
  5.2   缺陷
  6   质量检查评价流程
  7   数据质量检查内容
  8   数据抽样方案和抽样方法
  8.1   接收质量限(AQL)
  8.2   数据抽样方案
  8.2.1   连续批抽样方案表
  8.2.2   连续批抽样方案查找方法
  8.2.3   连续批数据正常、加严和放宽检验的调整规则
  8.2.4   单批数据的抽样方案及查找方法
  8.3   数据抽样方法
  8.3.1   统计抽样
  8.3.2   判断抽样
  8.3.3   空间抽样
  9   数据抽样检验
  9.1   抽样检验流程
  9.2   抽样检验过程
  9.2.1   确定数据质量定量元素
  9.2.2   确定抽检的检查项及范围
  9.2.3   确定接收质量限AQL及缺陷分级
  9.2.4   确定抽样方案和方法
  9.2.4.3    属性数据抽样
  9.3   批的接收判定规则
  10   检查方法及检查结果的记录
  10.1   检查方法
  10.1.1   计算机自动检查
  10.1.2   计算机辅助检查
  10.1.3   人工检查
  10.2   检查结果的记录
  11   数据质量评价
  11.1   数据质量合格的判定规则
  11.2   质量评价方法
  11.2.1   按通过与不通过判定数据质量的评价方法
  11.2.2   按优秀、良好、合格与不合格判定数据质量的评价方法
  11.3   数据质量报告
  附 录 A (资料性附录) 数据的缺陷分级
  附 录 B (规范性附录) 数据抽样方案
  附 录 C (资料性附录) 数据抽样方法示例
  附 录 D (资料性附录) 多级表数据抽样方案示例
  附 录 E (资料性附录) 数据质量报告格式
  附 录 F (资料性附录) 市级矿产资源总体规划数据库整合成果检查验收示例
  附 录 G (资料性附录) 土地利用数据库成果检查验收示例
  参考文献
国土资源数据库数据质量检查验收规范
  本标准给出了国土资源数据质量元素、缺陷分级;规定了国土资源数据库数据检查验收的基本要求、程序、检查内容、抽样检验方法、质量评价方法以及检查验收过程中相关文档的内容和格式要求等。
  本标准适用于国土资源数据库生产过程和验收阶段的数据质量检查和评价。
2 规范性引用文件
  下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
  GB/T 3 计数抽样检验程序 第1部分 按接收质量限(AQL)检索的逐批检验抽样计划
国家基本比例尺地形图分幅和编号
  GB/T /ISO 1 地理信息 质量评价过程
  GB/T /ISO 1 地理信息 质量原则
3 术语和定义
  下列术语和定义适用于本标准。
数据质量元素 data quality element
  说明对数据产品规范或用户要求符合程度的数据质量特性。
  注:对于数据产品而言,完整性、逻辑一致性、可用性等质量特性都可以是数据产品的质量元素,可分为不同的级别。
数据质量定量元素 data quality quantitative element
  数据质量特性可定量描述的部分,又称数据质量量化元素。
  根据[ISO 19113]改写。
数据质量定性元素 data quality overview element
  数据质量特性可定性描述的部分,又称数据质量非量化元素。
  根据[ISO 19113]改写。
个体 item
  质量检查的基本单元,又称检验单元。可以是图幅、实体或数据项。
总体 population
  检查的全部个体。
  汇集在一起的一定数量的个体。
  根据[GB/T 3]改写。
批量 lot size
  批中所含个体的数量。
  根据[GB/T 3]改写。
样本 sample
  从检验批中抽取的用于检查的全部个体的总称。
  根据[GB/T 3]改写。
样本量 sample size
  样本中所含个体的数量。
  根据[GB/T 3]改写。
缺陷 defect
  质量元素不满足规定的要求。
致命缺陷 the most serious defect
  个体的极重要质量特性不符合规定,或个体的质量特性极严重不符合规定,以致不经返工处理不能提供用户使用。
  根据[GB/T ]改写。
严重缺陷 the more serious defect
  个体的重要质量特性不符合规定,或个体的质量特性严重不符合规定,对用户有重大影响。
  根据[GB/T ]改写。
重缺陷 serious defect
  个体的较重要质量特性不符合规定,或个体的质量特性较严重不符合规定,对用户有较大影响。
  根据[GB/T ]改写。
轻缺陷 light defect
  个体的一般质量特性不符合规定,或个体的质量特性轻微不符合规定,对用户使用有轻微影响。
  [GB/T ]。
缺陷率 rate of defect
  样本(或批)中缺陷数除以样本量(或批量),再乘以100。
  注:对于具有不同级别缺陷的样本或批,缺陷数为除致命缺陷外所有其他级别的缺陷按比例换算后的最低级别缺陷个数。
不合格品 nonconforming item
  缺陷率不满足要求的个体。
  注:在国土资源数据中,以图幅为个体的数据采用不合格品衡量数据质量,此时图幅被视为批。
不合格品率 rate of nonconforming item
  样本或批中不合格品数除以样本量或批量,再乘以100。
接收质量限(AQL) Acceptable Quality Level
  可接收的批数据的最大缺陷率或不合格品率。
  根据[GB/T 3]改写。
抽样检验 sampling inspection
  利用所抽取的样本对数据进行检查,并根据检查结果判定批数据是否接收的检验。
  根据[GB/T ]改写。
抽样方案 sampling plan
  规定每批应检查的样本量和有关批数据接收准则的具体方案,用(N,n,c)表示,N为批量,n为样本量,c为接收数。
4 数据检查验收的基本要求
检查验收的依据
  a)检查验收的内容和任务依据项目工作合同、协议或任务书;
  b)验收阶段的检查验收工作依据本标准;
  c)检查验收的质量指标依据各专业数据库的标准、指南、规范或相关要求。
 检查验收方式
  实行项目承担单位初检、项目组织单位验收的方式。
  a)初检
  初检是在数据生产完成以后,由项目承担单位组织的对数据的全面检查,并根据检查结果对数据进行质量评价。
  b)验收
  数据通过初检后,由项目组织单位组织专家或委托有关机构按照相关要求进行验收。验收一般只检查重点内容,也可以根据项目组织单位的具体要求进行全面检查,在检查与评价的基础上给出验收结论与质量报告。
 检查验收方案的制定
  本标准为国土资源数据库数据的检查与验收通用规范。在具体数据库的检查验收时应根据实际情况对规范中的相关内容进行选择和细化,以4.1为依据制定具体的检查验收方案。
  一般说来,应根据制定的数据产品质量检查验收方案对数据产品进行实验性检查评价,按照实验性检查评价的情况,对方案进行调整完善。
  数据产品质量检查验收方案内容见表1。
  表1 数据产品质量检查验收方案内容
数据检查验收依据和要求
确定数据产品检查和验收所参考的标准和依据;
确定数据产品检查和验收的具体要求,包括标准要求和用户要求。
数据产品成果内容
确定数据产品包括的成果内容;
根据成果内容的不同划分数据产品数据集;
确定各数据集的权重。
各数据集质量元素
确定各数据集质量元素内容,包括一级质量元素及其包含的二级质量元素。
检查项、检查方式和方法
根据划分的质量元素确定数据产品的检查项,检查项要依据数据集特点详尽列举;
根据检查项确定检查方式,是计算机检查还是人工检查;
根据检查验收的要求、人力和时间确定抽样方案;
根据检查项确定检查方法。
按质量元素和检查项,根据数据产品各数据集内容确定缺陷分级,缺陷分级应详尽列举。
检查评价流程
依据数据集特点确定接收质量限AQL,根据数据产品特性和质量要求,确定数据集和数据产品的检查评价方法,制定具体数据产品检查评价流程。
检查验收程序
  检查验收程序由初检、提交、验收和复核(复检)四个阶段组成,如图1所示。
  a)初检
  数据库建设项目完成并经过项目组自检和互检后,由项目承担单位组织专家对数据产品质量进行初检,并提交初检报告。
  初检内容包括数据质量、完成任务情况、元数据和其它相关文档等验收所需资料。初检依据具体的验收方案所规定的检查内容和方法,对所有数据进行全面的检查和测试,填写检查记录表,编写初检数据质量报告。初检时只判定数据是否完成任务、质量是否达到验收要求,不计算具体得分。
  b)提交
  数据经初检合格,项目承担单位对初检所发现的问题进行全部修改完善后,将数据、相关文档和初检报告提交给项目组织单位。
  c)验收
  在初检的基础上,项目组织单位组织专家或委托有关机构对承担单位提交的数据产品进行验收。验收方案和初检报告是验收的主要依据。
  项目组织单位或委托机构组织专家对数据产品进行验收。验收专家组分为检查组和综合评价组,检查组负责对数据产品进行检查并如实记录检查结果,综合评价组依据检查结果确定缺陷级别并进行评价,提出验收意见,编写数据质量报告。
  d)复核(复检)
  经验收通过的数据产品,根据项目组织单位的要求和数据产品质量情况,返回承担单位进行修改完善,完成后提交项目组织单位复核。验收未获得通过的数据产品返回项目承担单位修改或重做,完成后进行复检(重新检查和验收)。
 图1 国土资源数据库数据检查验收程序图(略)
数据质量等级的划分
  采用两种方式对数据质量水平进行等级划分。
  第一种方式:采用通过与不通过表征数据质量水平。适用于对数据质量评价结果进行定性评价。
  第二种方式:采用优秀、良好、合格、不合格等四个级别表征数据质量水平。适用于对数据质量评价结果进行较精细定量评价。按百分制的得分划分质量等级。S为得分,数据质量等级划分标准通常为:
  a)优秀     S≥90分
  b)良好   90>S≥75分
  c)合格   75>S≥60分
  d)不合格    S<60分
5 数据质量元素和缺陷分级
数据质量元素
  根据GB/T/ISO1《地理信息 质量原则》确定了数据质量元素,包括数据质量定量元素和数据质量定性元素。数据质量元素是数据质量检查与评价的基础,也用于构成元数据标准中描述数据质量的元数据元素。
  数据质量元素分为两个级别,一级数据质量元素是具有相同本质的二级质量元素的集合,二级质量元素是数据质量的具体特性。
  5.1.1 数据质量定量元素
  数据质量定量元素是数据质量的定量组成部分,包括数据完整性、逻辑一致性、空间定位准确度、属性数据准确性以及图面整饰规范性等。
  数据质量定量元素的组成与描述见表2。
  表2 国土资源数据质量定量元素
二级质量元素
数据完整性
实体、实体属性和实体关系的多余和缺失程度
数据集中多余数据的程度,如图层、空间实体、数据表、记录、数据项、符号、注记与文档等。
数据集中遗漏数据的程度,如数据范围(工作量)、图层、空间实体、数据表记录、数据项、符号、注记与文档等。
逻辑一致性
数据结构、属性及关系的逻辑规则的一致性程度
概念一致性
与标准的符合程度:如与数据库结构的符合程度。
值域一致性
值对值域的符合程度。值不应超出值域的范围;值应满足值域之间的运算关系。如按照地类和行政区划进行统计的面积结果应一致。
格式一致性
数据存储同数据集的物理结构匹配程度,包括数据文件、图层命名和数据格式等。
拓扑一致性
拓扑特征的准确度:如点、线、面类型定义正确、不同图层共用界线的一致性、多边形封闭、结点关系正确,如线状实体交叉应建结点等。
接边一致性
相邻图幅间接边实体的类型和属性描述的一致性。
空间定位准确度
空间实体位置的准确度
数学基础精度
坐标系、投影参数、图廓点、坐标网交点、控制点坐标等的准确程度。
校正控制点数目与分布的合理性,校正后数据符合精度要求。
(包括影像校正和矢量数据校正)。
空间实体位置与可以接受的值或真值的符合程度,包括扫描和矢量化精度,形态控制精度等。
相邻图幅间接边吻合度,接边线(如标准图幅内图廓线或行政界线等)之间的误差满足要求,接边实体(线或弧段)误差满足要求。
属性数据准确性
定量属性的准确度、定性属性以及实体及其属性分类的正确性
分类的正确性
实体及其属性分类与真值或参考数据集的符合程度。
定性属性正确性
定性属性的正确性,如岩性描述的正确性。
定量属性准确度
 定量属性的准确度,如数据值及其单位的正确性;土地线状地物、零星地物的面积计算的准确性;图斑面积相对线状地物、零星地物面积及行政界线扣除的正确性。
图面整饰规范性
符号、注记和图廓整饰的规范性
符号规范性
 符号正确、定位准确、表示合理,符号与符号以及符号与其它要素压盖关系合理;
线划光滑、符合要求、线型设置正确;
符合相关专业的色系标准或规范;
网纹类型、颜色、高度、宽度和透明系数等是否正确。
注记规范性
注记正确、可读,压盖关系合理。
图廓整饰规范性
图廓整饰符合有关标准或规定,图面结构搭配合理,美观。
  5.1.2 数据质量定性元素
  数据质量定性元素是对数据质量的间接描述,包括数据生产的目的、适应性、用途和数据志等,见表3。
  表3 国土资源数据质量定性元素
一级质量元素
二级质量元素
生成数据集的原因及其预期用途
  适用性
满足用户要求的能力
可提供数据格式的种类
 易操作性
说明数据集已经实现的应用
  数据志
数据集的历史。描述数据源以及从数据源到数据集当前状态的过程
数据现势性
数据完成时间、数据更新程度、更新频度和最后更新时间等。
数据源的状态
生成数据集的原始资料完成的时间、介质、质量等。
处理步骤或历史信息
描述在数据集演变过程中的事件或变化等。
  数据质量定性元素一般不作为数据检查验收时的直接评价依据,而是一种间接的数据质量信息,可帮助用户判断数据质量是否满足其应用要求。
 缺陷指个体的任何一个质量元素不符合规定的要求。在数据质量检查评价中,用缺陷来量化检查中出现的各类不符合规定的问题。
  本标准用质量元素的重要程度和质量元素不符合规定要求的严重程度划分缺陷的级别。为提高质量量度的准确性,将缺陷分为六级,即致命缺陷、严重缺陷、重缺陷、次重缺陷、轻缺陷和次轻缺陷。为便于质量评价,赋予除致命缺陷以外的其他5个缺陷级别之间的换算比例,推荐比例为16:9:5:2:1。有些数据的检查需要将出现的多个问题记为一个次轻缺陷,使用者可根据具体情况进行调整。
  以图形为主的空间数据、以属性为主的数据(包括点空间数据)和符号化制图数据的缺陷分级及不同级别缺陷的转换比例见附录A。
6 质量检查评价流程
  国土资源数据库是一种数据产品,通常由多个数据集组成。在对各个数据集检查评价的基础上,综合评价数据产品质量。
  质量检查评价一般需要经过制定验收方案、确定检查内容和方法、实施检查和评价四个阶段。检查评价流程见图2。
  图2 国土资源数据库数据质量检查评价流程图(略)
7 数据质量检查内容
  数据中的每个数据质量特性都可能包含多个检查项。例如空间数据库完整性中的二级质量特性“多余”包括图层、空间实体、数据表、记录和数据项等检查项。根据数据质量元素和国土资源数据特点确定的数据质量通用检查项见表4。
  表4 国土资源数据质量通用检查项
一级质量元素
数据完整性
数据覆盖范围、图层、数据表、空间实体、记录、符号、注记与文档等
要求的空间数据、属性(表格)数据、元数据和文档数据无遗漏和多余。内容包括:
1.空间数据的地理覆盖范围完整、无遗漏和多余图层(必选图层不可遗漏、可选图层根据实际情况确定、增加图层必须说明)、空间实体无遗漏和多余;
2.元数据和属性数据的数据表、记录和数据项无遗漏和多余;
3.文本数据符合相关要求,如工作方案、技术方案、工作报告及相关说明文件等无遗漏;
4.制图数据完整,如符号、注记等无多余与遗漏。
数据覆盖范围、图层、数据表、空间实体、记录、符号、注记与文档等
逻辑一致性
概念一致性
分层、表、表间关系,数据项的名称、类型、长度和约束条件
空间数据的要素分层(如要素层名称和几何特征)、属性(表格)数据结构(如属性表名、字段长度、字段类型和约束条件等)与标准保持一致;
表与表、表与层等逻辑关系符合标准要求。
值域一致性
属性表格的数值型数据项的值以及值间逻辑关系
值应符合值域范围的要求;值间应符合规定的逻辑关系。
如同一行政辖区的土地利用数据库按照不同地类、不同级别行政区划进行面积统计的结果应一致。
格式一致性
图层名、数据文件名以及文档文件名等
空间数据格式和属性数据格式等
图层、元数据、属性(表格)、文档等文件的命名符合标准要求;
空间数据、属性(表格)数据、文档数据的格式与标准要求一致。
拓扑一致性
点、线、面拓扑的关系
是否按规定建立拓扑关系,建立的拓扑关系是否正确,如线状实体相交建立结点、多边形封闭、不存在多余标识点、悬挂节点、坐标点重叠、线和弧段自相交等现象;
不同图层间的共用界线保持唯一,有向线状实体的方向正确。
接边一致性
相邻图幅间接边实体的类型和属性
接边实体类型保持一致;
接边实体属性结构和属性内容保持一致,如地类代码。
空间定位准确度
数学基础精度
坐标系、投影方式及其参数设置
各比例尺空间数据坐标系要符合相关标准要求;
投影方式的选择及参数的设置要正确。
校正方法,校正控制点数目与分布的合理性,校正后数据符合精度要求。(包括影像校正和矢量数据校正)
校正控制点数目不少于四个,应尽量覆盖全图,应均匀分布,图形四个角点应首先选取。
校正后精度符合标准要求,图廓点、坐标网点误差、图廓边长误差和对角线误差不超过范围值。
数据采集或转换精度
图形扫描精度:分辨率、变形程度
矢量化精度:采集点坐标、线坐标的空间位置误差,线圆滑程度
转换精度:转换过程中空间实体的位置、要素、属性内容和精度;影像分辨率
图形扫描分辨率和变形程度满足要求;
矢量数据采集过程中严格按标准并依比例尺采集各图层要素,并表示准确;
转换精度:要求数据转换过程中点、线、面实体无遗漏和多余,要求转换前控制点和转换后控制点坐标保持一致,要求数据转换过程中实体的属性内容不丢失、精度不降低;影像数据在格式转换过程中,应保证图像分辨率不降低。
相邻图幅间接边,接边线(如标准图幅内图廓线或行政界线等)之间的误差,接边实体(线或弧段)误差
接边点位精度应符合标准要求;
不同比例尺矢量数据接边时,低精度数据应服从高精度数据。
 属性数据准确性
分类的正确性
实体及其属性分类
实体及其属性分类与真值或参考数据集的符合程度,如地类代码正确性。
定性属性正确性
定性属性的描述要正确,如矿区描述。
定量属性准确度
定量属性的属性值、计量单位正确,如线状地物、零星地物的面积数值和单位正确。
图面整饰规范性
符号规范性
 符号、符号与符号以及符号与其它地物压盖关系
线型设置、线划
点、线及面的颜色
网纹类型、颜色、高度、宽度和透明系数
线划质量,线划是否圆滑自然,连续清晰,线型和线划粗细设置是否符合图式要求;
要素符号是否正确,尺寸是否符合图式要求;检查各要素关系是否合理,是否有重叠压盖现象;
名称、注记是否正确,位置是否合理,指向是否合理,字体是否符合规定;
符号、注记是否压盖重要地物或点状物;
图面配置、图廓内外整饰是否符合规定,是否美观;
注记规范性
图廓整饰规范性
图廓内容整饰
数据源现势性
数据源完成的时间
数据源完成的时间、介质、质量是否满足规定要求;
数据是进行局部更新还是全面更新,数据更新的周期和最后时间;
如土地利用空间数据库的数据源完成时间为日,数据库完成日。
 数据现势性
数据完成时间、数据更新程度、更新频度和最后更新时间
8 数据抽样方案和抽样方法
  数据质量检查分为全检和抽检。
  全检是指对批数据中的所有个体进行逐一检查。能够用计算机软件自动检查的一律全检。通常拓扑一致性、格式一致性和值域一致性等易于计算机全检。
  抽检是指按照确定的抽样方案,采用适当的抽样方法从批数据中抽取部分个体作为样本进行检查,并根据样本质量来判断批数据质量。
  进行抽样检验的数据应是在统一的标准或规范指导下,由基本相同的数据源、在基本相同的时段和软硬件条件下生产的数据。连续生产的系列批数据为连续批数据,数据的生产和质量检查不具有连续性,一次性生产的数据为单批数据。上述数据在时间和经费有限的条件下通常需采用抽样检验。
接收质量限(AQL)
  数据的质量检查采用缺陷率或不合格品率作为质量指标。多图幅组成的批数据通常采用不合格品率作为质量指标。单图幅或属性数据组成的批数据通常采用缺陷率作为质量指标。AQL是可接收批数据的最大缺陷率或不合格品率,是确定抽样方案的重要参数。无论连续批还是单批数据均使用AQL和批量查找抽样方案。
  本标准中AQL的取值范围为0.01-50。等于或小于10的AQL适用于以缺陷率或不合格品率作为质量指标的检查,大于10的AQL只适用于以缺陷率作为质量指标的检查。
  AQL的确定见9.2.3中的a)。
数据抽样方案
  抽样方案是规定每批数据应检查的样本量和有关批数据接收准则的具体方案,用(N,n,c)表示,式中N为批量,n为样本量,c为接收数。其含义是从批量为N的批中抽取n个个体构成样本,并对样本全检,样本中包含的不合格品数或缺陷数小于或等于c时接收该批。
  本标准对连续批数据采用调整型计数抽样方案,是参考GB/T2828.1制定的。单批数据的抽样方案采用样本量增大两级的连续批正常检查抽样方案。
  数据的抽样方案通过查找抽样方案表确定。本标准给出了确定国土资源数据抽样方案的连续批(正常、加严和放宽)和单批检验的样本量表以及相应的接收数查找表。
  8.2.1 连续批抽样方案表
  连续批数据的样本量表见附录B的表B.1;连续批正常检验抽样方案表见附录B的表B.2;连续批加严检验抽样方案表见附录B的表B.3;连续批放宽检验抽样方案表见附录B的表B.4。
  8.2.2 连续批抽样方案查找方法
  数据抽样方案的查找包括两个步骤,一是根据批量和检查的严格程度确定样本量;二是根据样本量和AQL确定接收数。
  a)确定样本量
  根据批量N和检查要求,从附录B表B.1中的正常、加严或放宽列中查出相应的样本量n。
  b)查找接收数
  根据检查要求(正常、加严或放宽),在附录B的表B.2、表B.3或表B.4的样本量列查找样本量所在行,在AQL数值栏查找规定的AQL值所在列,样本量所在行和AQL所在列交叉处的数字即为接收数c。批量N、样本量n与接收数c构成抽样方案。
  注:凡表中标注 * 处,应对给定的批量N进行全检,抽样方案为(N,N,0)。在这种情况下,只要检查出一个不合格品或缺陷,则拒收该批。
  数据连续批抽样方案查找示例:
  (1)对某连续批数据实施抽样检验,给定批量为1600, 规定AQL为1.0,试查找正常检验的抽样方案。
  ① 首先根据批量1600和正常检验要求,从附录B的表B.1正常列中查出样本量为125。
  ② 在附录B的表B.2样本量列找到与样本量125对应的行,并在AQL数值栏查找1.0所在列,样本量125所在行和AQL为1.0所在列的交叉处的数字3即为接收数。抽样方案为(,3)。
  对于加严检验,则步骤①中由附录B的表B.1加严列查找出样本量为160,在步骤②中使用附录B的表B.3查找接收数,抽样方案为(,2)。
  对于放宽检验,则在步骤①中由附录B的表B.1放宽列查找出样本量100,在步骤②中使用附录B的表B.4查找接收数,抽样方案为(,4)。
  (2)抽样方案表中出现箭头时,抽样方案查找示例:若本示例中AQL为0.05,试查找正常检验的抽样方案。
  ① 首先根据批量1600和正常检验要求,从附录B的表B.1正常列中查出样本量为125。
  ② 在附录B的表B.2样本量列找到与样本量125对应的行,并在AQL数值栏查找0.05所在列,发现样本量125所在行和AQL为0.05所在列的交叉处为箭头,此时选择按箭头所指的抽样方案。即抽样方案为(,0)。
  对于加严检验,则步骤①中由附录B的表B.1加严列查找出样本量为160,在步骤②中使用附录B的表B.3查找接收数,发现样本量160所在行和AQL为0.05所在列的交差处亦为箭头,此时亦选择按箭头所指的抽样方案,即抽样方案为(,0)。
  对于放宽检验,则在步骤①中由附录B的表B.1放宽列查找出样本量100,在②中使用附录B的表B.4查找接收数,即抽样方案为(,0)。
  (3)抽样方案表中需要作样本量降级处理时,抽样方案查找示例:若本示例中AQL为40,试查找正常检验的抽样方案。
  ① 首先根据批量1600和正常检验要求,从附录B的表B.1正常列中查出样本量为125。
  ② 在附录B的表B.2样本量列找到与样本量125对应的行,并在AQL数值栏查找40所在列,发现样本量125所在行和AQL为40所在列的交叉处需要作样本量降级处理,此时选择降级后的新的样本量对应的抽样方案。即抽样方案为()。
  对于加严检验,则步骤①中由附录B的表B.1加严列查找出样本量为160,在步骤②中使用附录B的表B.3查找接收数,发现样本量160所在行和AQL为40所在列的交差处亦需要作样本量降级处理,此时亦选择按降级后的新的样本量对应的抽样方案,即抽样方案为()。
  对于放宽检验,则在步骤①中由附录B的表B.1放宽列查找出样本量100,在步骤②中使用附录B的表B.4查找接收数,发现样本量100所在行和AQL为40所在列的交差处亦需要作样本量降级处理,此时亦选择按降级后的新的样本量对应的抽样方案,即抽样方案为()。
  8.2.3 连续批数据正常、加严和放宽检验的调整规则
  a)在生产过程中如果采用抽样检验方式检验数据质量,则应加严检验;
  b)在数据验收检验的过程中,如果样本数据不符合要求,则应在后续检验中增大样本量进行加严检验;如果样本数据质量普遍较好,则实施放宽检验;
  c)连续批数据的首次验收应加严检验;
  d)验收阶段如果质量验收结论为优,复检时应放宽检验;如果质量验收结论为良,复检时按正常检验;如果验收结论为及格或以下,复检时应加严检验。
  8.2.4 单批数据的抽样方案及查找方法
  单批数据抽样方案的样本量表见附录B的表B.1,接收数查找表同附录B的表B.2。
  单批数据样本量查找附录B的表B.1的单批列,接收数查找的步骤和方法与连续批正常检验的查找方法相同。
数据抽样方法
  抽样方法是抽取样本的方法,其目的是使抽出的样本能够充分代表批。数据的抽样方法既包括统计抽样方法,又包括非统计抽样方法。对于空间数据,在抽取样本的过程中还应考虑数据的空间分布进行空间抽样。
  8.3.1 统计抽样
  统计抽样方法的核心是随机抽样,即在抽取样本的过程中,使批中的每个个体都有同等被抽取的机会,以保证样本的代表性。数据质量检验常用的统计抽样方法主要包括简单随机抽样、系统抽样、分层抽样和整群抽样等。
  简单随机抽样是从总体里随机地抽取个体组成样本的方法,也称单纯随机抽样。它是一种最基本的抽样方法,是其他抽样方法的基础。常用的实现方法包括抽签法和随机数法。
  系统抽样将总体中的所有个体按一定顺序排列,在规定的范围内随机抽取某个体作为初始单元,然后按事先确定的规则抽取其他样本单元。系统抽样方法可按时间、空间或产品编号的顺序抽取,其代表性强,实施简单,在数据质量抽样检验中常与整群抽样组合使用。
  分层抽样又称分类抽样,或类型抽样。将总体分割成互不重叠的子总体(层),然后从不同的层中独立、随机地抽取样本,各层的样本构成总样本。分层抽样适用于同一批数据是由不同单位或个人生产的情况。分层抽样方法的示例见附录C中的示例1和示例2。
  整群抽样是将总体分为许多群,每群由个体按一定方式结合而成,随机地抽取若干群,并由所抽群中的所有个体组成样本。整群抽样适用于以表的形式存储的属性数据,如矿产地、钻孔、自然重砂和地质灾害数据库等。
  8.3.2 判断抽样
  判断抽样是一种非统计抽样,指应用专家知识和经验进行的抽样。主要适用于批量小于8或空间分布不均匀的数据。
  8.3.3 空间抽样
  空间抽样是基于空间分布形态在一定区域内抽取样本的方法。空间抽样适用于图幅数据(包括以图形为主的空间数据和符号化制图数据)组成的批。下述两种情况都需考虑空间分布,使抽出的样本能够代表批数据的质量。一是从多图幅数据中抽取一定数量的图幅(幅间抽样),二是从单图幅数据内抽取要素(幅内抽样)。由于国土资源数据空间分布的不均匀特点,通常由专家根据经验选择一个或多个空间区域抽取样本。
9 数据抽样检验
抽样检验流程
  数据质量抽样检验的流程一般包括确定下列内容的步骤:抽检的检查项、每个检查项的范围、接收质量限AQL、缺陷分级、不同数据类别的抽样方案、抽样方法、抽取样本、选择检验方法并实施检验。国土资源数据质量抽样检验一般流程参见图3。
抽样检验过程
  9.2.1 确定数据质量定量元素
  按照下列原则从第5章的表2中选取或增加适用的数据质量元素。
  a)不同类型数据的质量元素不同。根据数据的类型与特点、质量要求及用于数据质量检验与评价的资源(人力、物力、时间等)状况选取。
  b)数据完整性、逻辑一致性和属性数据准确性适用于任何类型数据。
  c)空间定位准确度适用于空间数据;在确定非空间数据的质量元素时,不选取空间定位准确度以及制图数据的数据质量定量元素。
  d)确定制图数据的质量元素时,可不选取属性数据准确性。
  e)当本标准的数据质量定量元素不满足应用要求时,可根据实际情况扩充一级或二级质量元素。
  9.2.2 确定抽检的检查项及范围
  a)根据确定数据质量元素,从第7章选择或确定抽检的检查项。
  b)逐一确定实施抽检的检查项的范围。
  c)当扩展检查项时,需要规定相应的缺陷级别。
  9.2.3 确定接收质量限AQL及缺陷分级
  a)AQL的确定
  l AQL应由数据产品质量规范或用户要求给出。如果没有规定可根据历年数据质量情况或预检结果确定。
  l 确定AQL应考虑的因素:质量要求、产品的复杂程度、检查项的数量和检验的经济性等。
  l 多图幅数据需要确定两个AQL值,一是数据集的接收质量限,即该数据集可接收的最大不合格品率。二是单图幅数据的接收质量限,即该图幅可接收的最大缺陷率。
  l 单图幅数据和属性数据的AQL是该批数据可接收的最大缺陷率。
  b)根据5.2中的内容确定或调整缺陷分级,最低级别缺陷的权重为1。
  l 在属性数据的抽样检验中,有时需要将出现的多个问题计为一个次轻缺陷,便于更好的区分数据质量的差别。
  l 当调整现存缺陷级别或确定新增检查项的缺陷级别时,应保证不同质量元素的同一缺陷级别对数据质量的影响程度基本一致,即具有同等的重要程度。
  9.2.4 确定抽样方案和方法
  数据的抽样检验主要分为三类:多图幅抽样、幅内抽样和以属性数据为主的数据的抽样。
  本节主要阐述上述三类连续批数据抽样方案的查找步骤和查找方法。单批数据的抽样方案查找步骤与连续批的查找步骤相同,只是确定接收数所用查找表的列不同。
  9.2.4.1 多图幅数据的抽样
  以图幅为个体的抽样,也称幅间抽样。多图幅包括标准图幅和非标准图幅。标准图幅指按国家标准《国家基本比例尺地形图分幅和编号》(GB/T )进行的分幅。非标准图幅指按行政区划、某种研究或统计区域等;
  9.2.4.1.1  确定抽样方案
  a)图幅数大于1幅小于8幅时,采用专家判断法抽样。根据以往检验结果和对图幅质量的要求,确定抽取的样本数及接收数。
  b)大于等于8幅的数据则按下述步骤确定抽样方案。
  1)确定AQL,即确定该批数据可接收的最大不合格品率。
  2)从附录B的表B.1中查找与总图幅数N对应的样本图幅数n。
  3)连续批数据根据检验的严格程度要求从附录B的表B.2,表B.3或表B.4中查找与n、AQL对应的接收数c(图幅数);单批数据从附录B的表B.2中查找与n、AQL对应的接收数c。
  9.2.4.1.2  确定抽样方法
  多图幅抽样通常采用分层随机抽样方法抽取样本。分层的具体原则如下:
  a)当批数据由不同单位生产时,将每个单位生产的数据作为层(子总体),应保证每个单位的数据都必须抽到,且各单位数据之间样本量分配比例基本上等同于子总体的比例。
  b)当个体的复杂程度和重要程度不同时,可按以下三个原则进行分层抽样:
  1)内容简单的图幅基本不抽。
  2)抽取单幅时,选择复杂程度或重要程度最高的图幅。
  3)抽取两幅以上时,复杂(重要)与中等复杂(重要)程度抽取概率相同。
  多图幅抽样方法的示例参见附录C中的C.2和C.3。
  9.2.4.2 单图幅数据的抽样
  以图幅为总体,以要素为个体的抽样,也称幅内抽样。
  9.2.4.2.1  确定抽样方案
  a)确定AQL,即确定该图幅可接受的最大缺陷率。
  b)从附录B的表B.1中查找与该图幅内的总要素数N对应的样本量n。
  c)连续批数据根据检验的严格程度从附录B的表B.2、B.3或表B.4中查找与n、AQL对应的接收数c;单批数据从附录B的表B.2中查找与n、AQL对应的接收数c。
  9.2.4.2.2  确定抽样方法
  考虑要素空间分布的不均匀性,采用专家判断法抽取满足样本量要求的空间区域作为样本。
  实施过程:确定样本量(要素数)n后,采用专家判断法,选择一个或多个空间区域抽取样本,直到区域内的总要素数不小于n为止。
  注:当由软件统计区域内的要素数时,应特别注意与边框相交的要素,不能遗漏和重复。
  9.2.4.3 属性数据抽样
  属性数据通常由单表、多级表或其组合构成。属性数据的抽样以数据项为个体,采用整群抽样,即以数据项的个数计算批量和样本量,以实体(包括点)为群抽取样本。本节给出属性数据的抽样方案和方法。
  9.2.4.3.1  确定抽样方案
  本节给出单表、多级表或其组合构成的数据集抽样方案的确定方法,抽样示例见附录C。
  a)单表抽样方案
  1)确定AQL。
  2)计算批量N:N=该单表数据的总记录数Na×规定的每条记录需抽检的数据项数m。
  3)根据N,从附录B的表B.1中查出对应的要抽检的数据项数n,即样本量。
  4)计算抽取的记录数n1,n1=n÷m,若n1为非整数,则取整加1。
  5)连续批数据根据检验要求从附录B表B.2、表B.3或表B.4中查找与n、AQL对应的接收数c;单批数据从附录B的表B.2中查找与n、AQL对应的接收数c。
  b)多级表抽样方案
  1)确定AQL。
  2)在一级表中以数据项为个体计算一级表数据的批量,按照比正常检验低二级的原则从附录B的表B.1中查出样本量,除以一级表中需抽检的字段数,得出应抽取的记录数,并抽出相关记录。
  3)将与一级表中抽出的记录相关联的所有下属表中的记录抽出。
  4)将抽出数据中需要抽检的所有数据项(包括一级表与所属表中需抽检的数据项)个数作为该多级表数据的样本量。
  5)使用该样本量和AQL,连续批数据从附录B的表B.2,表B.3或表B.4中查找接收数c;单批数据则从附录B的表B.2中查找接收数c。多级表数据的样本量和查出的接收数构成多级表数据的抽样方案。
  6)如果该样本量大于6000,则应根据一级表记录的个数将该多级表数据进一步划分为更小的子集分别抽样。
  具体示例见附录D。
  c)由多个单表和多级表组成的数据的抽样方案
  1)将每个单表及多级表划分为单独的数据子集,为所有子集分配权重,必要时应规定评价规则,进行综合评价。
  2)根据本节中的a)和b)分别确定每个单表和多级表的抽样方案。
  9.2.4.3.2  确定抽样方法
  按整群抽样方法计算群数,然后采用简单随机或系统抽样方法抽取群,即拟检查的实体记录数。系统抽样特别适合于依次编号的数据。系统抽样的示例见附录C中的C.4。
批的接收判定规则
  根据样本的检验结果,若发现的不合格品数或缺陷数小于或等于所选的抽样方案中给出的接收数c,则判该批为接收批;若发现的不合格品数或缺陷数大于所选的抽样方案中给出的接收数c,则判该批为拒收批。
10  检查方法及检查结果的记录
 数据常用检查方法包括计算机自动检查、计算机辅助检查和人工检查。
  10.1.1 计算机自动检查
  计算机自动检查是依据数据结构或相关标准的要求编制检查软件,对图形数据、属性数据及数据间的相关性进行检查。计算机自动检查主要包括计算检查、数据模板分析检查和空间约束分析检查。
  a)计算检查:采用理论计算、统计计算、容限计算或其它计算来判断数据的正确性。
  理论计算:根据数学公式计算得到的理论值与被检查数据进行比较分析。可用于检查与位置有关的数据,如图廓点、坐标格网交点和高程值等。
  统计计算:根据数据之间的相关性进行统计计算,由计算结果来检查判断数据的正确性。主要用于存在统计关系的数据检查,如同一区域范围按照地类和行政区划分别进行统计的总面积应一致。
  容限计算:通过预先设定的限差值,将被检查数据或经有关计算的数据与限差值进行比较来判断数据的正确性。可用于检查数据精度,如扫描或矢量化数据的校正精度、图幅拼接精度等。
  b)数据模板分析检查:根据相关标准、规范和要求规定的结构、命名规则或代码表等建立的数据模板与待检查数据进行对比分析。
  可用于检查数据库结构、数据表结构与相关标准的符合程度和数据的完整性等,如属性结构、属性设置、 要素分层、文件命名及存储格式与相关标准符合程度。
  c)空间约束分析检查:根据空间实体应满足的拓扑规则(空间实体间面面、面线、面点、线线、线点和点点等拓扑关系)进行拓扑一致性检查。可用于检查多边形封闭、多余标识点、悬挂点和悬挂线、线和弧段自相交、重复公共边、破碎多边形、多边形间重叠和空洞等。
  10.1.2  计算机辅助检查
  计算机辅助检查是指在不能实现计算机自动检查时所采用的人机交互检查。计算机辅助检查主要包括放大漫游检查、图层叠加检查、数据关联检查和数据格式转换检查等。
  a)放大漫游检查:采用屏幕放大和漫游进行数据的正确性检查。
  可用于检查空间数据的地理覆盖范围、套合程度和接边一致性等,如扫描矢量化图和原图的套合程度、空间实体无遗漏或多余和水系方向的正确性等。
  b)图层叠加检查:通过不同图层数据的叠加显示,检查数据的正确性和完整性。
  可用于检查图层套合、空间实体压盖、符号和注记是否压盖重要地物或点状地物、接边实体类型一致性和不同图层间的共用界线唯一性等。
  c)数据关联检查:根据空间实体与实体之间、实体与属性之间以及属性与属性之间的关联正确性来判断数据正确性的检查。
  如通过将空间实体的属性内容进行关联显示,根据空间实体和其属性内容的一致性来判定空间实体和属性内容的正确性。通过关键字对具有对应关系的属性表(特别是多级表及挂表数据)进行关联,检查属性表结构及内容的正确性。
  d)数据格式转换检查:根据一些数据具有可转换性的特点,将空间数据转换成文本数据或将属性数据转换成空间数据,利用空间数据的可视性和文本数据的可计算性对数据进行正确性检查。可用于检查属性数据值域、属性字段类型、定量属性计量单位和属性数据正确性等。
  如将点空间数据导入Excel表中,通过统计查询等方式检查点空间数据的坐标和属性内容的正确性;通过将带有坐标的属性数据转换成空间数据,并与其它图层套合,检查属性数据的正确性。
  10.1.3 人工检查
  检查人员根据有关标准或要求、专家知识及经验进行的数据检查。主要用于计算机软件难以实现的数据检查。人工检查主要包括实地检查、资料对比检查、经验判断检查和打印输出检查等。
  a)实地检查:当有关数据的真实值或参照值无法确定时,需要野外实地测量或调查,以检查其正确性。
  可用于检查空间点位、空间实体尺寸等正确性。例如对控制点或地籍点位置以及建筑物尺寸数据等的检查。当原始数据本身错误或数据年代已久,参照值无法确定时,需野外实地测量或调查以检查确认其正确性。
  b)资料对比检查:将被检查的数据与数据源对比。
  可用于检查数据采集精度、空间实体数据缺失、空间实体压盖、数据完整性和现势性等。
  c)经验判断检查:检查人员根据专业知识和经验对数据进行的分析判断检查。
  可用于检查定性属性描述正确性、图面整饰和注记规范性、数据格式正确性、文档完整性和规范性等。如空间数据地理覆盖范围、空间实体、图面配置、图廓内外整饰、文档及其内容是否符合规定或要求等。
  d)打印输出检查:将数据(图或表)打印输出检查其正确性和完整性。
  可用于图幅接边、图层套合与压盖;线划圆滑自然,连续清晰,线型和线划粗细设置是否符合图式要求;要素符号和尺寸是否合理;各要素关系是否合理,是否有重叠;也可用于属性数据的正确性检查。
检查结果的记录
  数据质量检查结果的记录是数据质量检查过程中形成的原始记录凭证,是评价数据产品质量和编写质量报告的基础。根据数据质量检查结果填写数据质量检查记录表,其中表中缺陷描述应包括缺陷发生的位置、错误的程度等,检查记录表的格式参见表5。
  根据数据质量检查记录表(表5)记录的检查结果和缺陷分级的规定,确定缺陷级别,统计各级别缺陷的数量,并按照表6的格式汇总。
  表5 数据质量检查记录表
数据产品名称
 承担单位
 数据集名称
 检查单元名称或编号
对应质量元素
检查个体数
或抽样方案
     2
     …
     需要特殊说明的问题:如表示缺陷实际状态的屏幕截取图。
         
 检查日期
  在完全由计算机进行检查时表5可以不填,直接填写表6进行汇总。
  表6 数据集质量检查汇总表
数据产品名称
数据集名称
个体数或(N,n,c)
严重缺陷(16)
重缺陷(9)
次重缺陷(5)
轻缺陷(2)
次轻缺陷(1)
主要缺陷描述
此页不够可续页 
注: (16)~(1)为各级别缺陷与最低级别缺陷即次轻缺陷的比例,用于缺陷换算(换算方法为:1个严重缺陷等于16个次轻缺陷,1个重缺陷等于9个次轻缺陷,1个次重缺陷等于5个次轻缺陷,1个轻缺陷等于2个次轻缺陷)。
  检查方式列表:1:全检;2:抽检。
(N,n,c)为抽样方案,N为批量,n为样本量,c为接收数。
第&&&[3]&&&&&&页&共[9]页
上面法规内容为部分内容,如果要查看全文请点击此处:

我要回帖

更多关于 苹果序列号查询 的文章

 

随机推荐