夜上海论坛本站小编为你精心准备了上海统计元数据研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
《统计科学与实践杂志》2014年第六期
夜上海论坛一、元数据标准管理与运用
(一)国际上运用元数据标准管理数据的做法1.美国联邦普查局。美国联邦普查局从2003年开始建设元数据管理系统,该系统主要包括两个子系统:一是电子数据传播系统,用于支持数据用户通过英特网等渠道获取数据;二是统计业务全流程自动化系统,用于支持统计人员在线开展统计规划、设计、操作、处理并评估统计调查项目。2.加拿大统计局。加拿大统计局基于元数据管理建立的总体业务框架,涵盖业务流程、计算机软件、硬件以及组织机构等统计业务各个方面,对问卷开发、数据收集、数据加工和信息进行统一管理,最大程度地减少了业务流程和计算机系统的数量,避免了部门内部的重复劳动,提高了整体效率。3.澳大利亚全国卫生信息库。澳大利亚全国卫生信息库是一个存储澳大利亚国民卫生健康信息元数据的电子网站,配有一个强大的查询工具。使用者可以在这个数据库中对各类信息进行查询。这个知识库还提供了一个直达澳大利亚全国健康状况信息计划各项主要内容版面的综合接口。
(二)国家企业一套表主要元数据标准2011年国家统计局以国家企业一套表制度为管理对象,参照国内和国际相关标准,研究制定统一规范的统计元数据标准,旨在实现统计元数据的规范化和标准化管理。统一规范的元数据标准有助于对统计数据的一致性理解,为统计数据和元数据的高效共享和交换提供基础。1.国家企业一套表元数据标准的主要内容。国家企业一套表元数据标准主要包括统计指标元数据标准、统计分组元数据、统计目录元数据标准以及报表元数据标准。2.国家企业一套表元数据库覆盖范围。国家企业一套表元数据库以国家企业一套表制度为对象,内容覆盖国家企业一套表制度中的全部报表、指标、分组目录,涉及工业、建筑业、批发和零售业、住宿和餐饮业、房地产开发经营业等行业,以及调查单位基本情况、劳动工资、能源、科技及信息化等专业统计,共计报表47张,指标450个,分组23个,目录17个。3.国家企业一套表元数据标准的优点。2011年国家统计局针对国家企业一套表制度设计国家企业一套表元数据标准,并建立覆盖国家企业一套表范围的元数据库,其优点主要体现在以下几个方面:创新性:国家企业一套表元数据标准是国家统计局参照国内和国际相关标准,结合我国统计工作实际,为满足国家企业一套表业务流程以及数据收集和管理要求,首次创新性提出的统计元数据标准。示范性:国家企业一套表元数据标准的提出为全国统计系统整理统计报表、指标、分组、目录,规范统计工作,提高统计工作的信息化水平,提供了示范性文本。可持续性:国家统计局继2011年提出国家企业一套表元数据标准和元数据库后,于2013年8月出台统计元数据维护与管理办法,就管理范围、工作职责、工作流程作出了相应规定。使国家企业一套表元数据标准和元数据库成为一项具有可持续性的统计标准化管理工具。4.国家企业一套表元数据标准的不足。经过对国家企业一套表元数据标准的研究,结合上海市统计工作实际,课题组认为国家企业一套表元数据夜上海论坛标准和元数据库在以下方面尚存在不足:(1)覆盖范围有限。国家企业一套表元数据库内容覆盖国家企业一套表制度中的全部报表、指标、分组目录。而现行统计报表制度中除了纳入企业一套表制度范围的报表外还包括针对“四下”企业的统计报表制度、根据上海市统计工作需要增加的地方统计报表制度,以及普查制度和专项调查制度等。对于这些未纳入国家企业一套表范围的统计报表制度,国家企业一套表元数据库尚未进行整理。因此,国家企业一套表元数据库在覆盖范围上尚显不足。(2)部分属性不便于查询和管理。统计指标代码属性,是由企业一套表主要元数据代码编制规则确定的唯一码,由一级类别代码、二级类别代码、核心指标代码和顺序码组成。在实际工作中,若要对各类别的指标进行筛选查询,通过该代码无法迅速查询到下属指标。因此拟将该指标代码属性根据一级类别代码、二级类别代码、核心指标代码和顺序码拆分成四个属性,便于实际工作中的查询。分组/目录元数据标准中的分组/目录代码属性,是分组/目录的唯一编码,采用四位顺序码的形式。该编码规则无法反映该分组/目录使用的领域,因此拟将指标代码的编码规则运用于分组/目录的编码,将指标与分组/目录结合起来,便于实际工作中的筛选和查询。
夜上海论坛二、上海建设统计元数据标准的思路和方法
(一)增加部分属性反映上海市统计报表制度对国家统计报表制度的修订针对国家企业一套表元数据标准无法满足上海统计报表制度对国家统计报表制度的补充这一不足,拟增加部分属性,以进一步完善地方统计元数据库功能。1.报表元数据标准中增加:(1)报表管理级别。分国家统计局、上海市统计局、国家统计局上海调查总队三种情况。“国家统计局”表示该报表为国家统计局布置报表;“上海市统计局”表示该报表为根据上海市统计工作实际需要增加的地方统计报表;“国家统计局上海调查总队”表示该报表为国家统计局上海调查总队增加的地方统计报表。(2)与国家报表相比调整情况。分新增报表、增加频率、增加指标、扩大调查范围、无变化五种情况。“新增报表”表示该报表为上海市增加的地方统计报表;“增加频率”表示该报表在国家报表基础上增加调查频率;“增加指标”表示该报表在国家报表基础上增加部分指标;“扩大调查范围”表示该报表在国家报表基础上扩大调查范围;“无变化”表示上海市严格执行国家报表,未做任何修订。该属性旨在反映上海市针对国家报表制度三增一扩的情况。(3)上报平台。分清华同方、和利时3.0、京云万峰。由于上海市联网直报数据采集平台有3个,除国家企业一套表范围内报表在清华同方平台上进行数据采集外,其他报表根据实际情况在三个平台上分别采集。因此上海统计元数据标准中增加“上报平台”属性记录以联网直报方式填报的报表具体上报平台。2.在分组/目录元数据标准中分别增加:与国家分组/目录相比进行的调整。为适应服务地方统计需求,满足反映上海市产业发展水平和结构,对国家统计制度中的分组/目录进行调整,如增加部分上海市特有的产品目录等。通过该属性记录与国家目录相比的调整。
夜上海论坛(二)增加部分属性以便于查询和管理1.在指标元数据标准中增加:将指标代码根据指标代码编码规则拆分成一级类别、二级类别、核心指标和顺序号。一级类别包括调查单位基本情况、从业人员、人工成本、生产经营、土地和固定资产支出、科技活动、信息化情况、效益和分配八大类,对各一级类别分别进行细化形成二级类别和核心指标。2.在报表元数据标准中增加:报表涉及行业范围、报表所属制度。此外,为记录报表、指标、分组和目录的动态变化,增加版本说明属性,反映统计报表、统计指标的精简、统计指标口径、指标解释、计算方法的调整以及统计分组和目录条目的增减变动等,动态管理上海统计制度中报表、指标、分组、目录,并可以查询到历史变化。
(三)扩大国家企业一套表元数据库的覆盖范围针对国家企业一套表元数据库仅覆盖国家企业一套表制度这一不足,上海统计元数据库将整理范围扩大到上海政府统计体系中的所有基层表制度,包括常规年定报制度、普查制度和专项调查制度。考虑到上海政府统计体系统计报表制度的复杂性以及上海统计元数据标准尚在探索阶段,还不成熟,故建议分三阶段推进上海统计元数据标准及元数据库建设(表1)。
夜上海论坛三、建立上海统计元数据标准和元数据库的职责分工与业务流程
夜上海论坛上海统计元数据标准和元数据库建设分为设计建立、运用和常态维护三大阶段,需要设管部门和专业部门分工协作,本课题将各阶段各部门的职责分工与业务流程以流程图的形式介绍如下:
四、加强元数据建设的思路和方向
(一)完善指标代码编码规则现阶段,上海统计元数据标准中的指标代码编码规则使用国家企业一套表主要元数据代码编码规则。由于该指标代码体系是基于国家企业一套表制度整理归纳的,能覆盖国家一套表制度中的指标,而上海市建立的上海统计元数据库将覆盖范围扩大到上海统计系统所有基层表制度。该编码规则无法满足上海统计元数据库的整理归类需求,部分指标无法对应到具体的细分类。如:金融业统计报表制度等上海市增加的地方统计报表制度中的指标,只能笼统归入其他类别,不利于对指标的归类整理和筛选查询。拟在上海统计元数据标准建立过程中,在国家企业一套表主要元数据代码编码规则基础上,增加二级类别和核心指标,满足上海统计元数据库建设的归类需求。
(二)研发适用于信息化平台的元数据管理程序上海市的统计元数据建设为起步阶段,主要完成了元数据标准的建立和元数据库的初步整理。如何将事后管理转化为事前管理,在报表制定设计之初就将报表、指标、分组和目录规范化、标准化,是今后元数据标准工作的努力方向。下阶段将首先研究如何将元数据标准和元数据库应用于上海市信息化平台,将元数据库转化为可供平台使用的格式,尝试在平台定制报表的过程中可从元数据库中直接调用标准化的指标、分组和目录,起到对统计报表的事前管理,提高统计信息化管理水平。
(三)细化元数据管理的职责分工和业务流程对元数据标准和元数据库管理的职责分工和业务流程提出的初步设想,目前元数据库的更新维护工作主要由设管部门牵头负责在年度年定报制度修订完成后进行。这样的操作模式存在几个弊端,一是时效性差;二是存在重复劳动现象;三是如果元数据库仅是年度修订更新可能会遗漏一次性的专项调查制度,不利于元数据库的统一管理。拟进一步细化元数据管理的职责分工和业务流程,形成设管部门牵头,各业务处室按照业务分工负责维护的工作制度;加强宣传与培训,明确工作要求,将元数据管理同时融入年定报制订、审批环节和日常的地方统计调查报表设计、审批管理过程中,确保上海市元数据库更新的及时性和完整性,更好地发挥元数据在统计管理中的积极作用。
夜上海论坛作者:上海市统计局课题组