夜上海论坛前言:我们精心挑选了数篇优质仓库档案管理文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

关键词:数据仓库;档案工作;信息化
中图分类号:TP311 文献标识码:A 文章编号:1006-8937(2015)02-0144-02
夜上海论坛 1 数据仓库的概念及档案信息的特点
随着信息化进程的不断推进,当今人类社会正逐步步入一个以科学技术为主导的知识经济时代。而档案工作作为一种社会现象,伴随着历史车轮的前进,其自身技术手段与管理模式也在不断的更新之中。但这种变化反过来却又无法满足人们对档案信息的科学性、系统性、集中面向主题的现实需求。为此,档案工作可以引入数据仓库技术来解决这一矛盾。
数据仓库概念最早是由Devlin和Murphy在上世纪八十年代提出的,而数据仓库之父W.H.Inmon在其著作《Building the Data Warehouse》中为数据仓库所下的定义则被人们广为接受。他将数据仓库定义为:“一个面向主题的、集成的、随时间变化的、非易失性数据的集合,用于支持管理层的决策过程”。由此概念我们可以发现数据仓库的一些重要特性,即面向主题性、数据集成性、数据的时变性、数据的非易失性、数据的集合性与支持决策作用。如果我们将这些特性与档案工作内容相结合,便可得出在数据仓库环境下,档案信息具有的特点:
①档案信息内容面向主题,并以某种数据集合的形式存储。在数据仓库中档案信息的存储并非面向某一具体应用程序,而是以主题为归类标准,每一主题面向一个宏观的分析领域,例如:档案工作中不同性质的档案、档案来源所在地、档案流转方式以及档案用户各项具体信息等均可作为主题组织数据,一切以便于有效检索利用为宜。②来源于不同结构和系统的档案信息的数据结构与编码的标准是统一的,并且具有某种程度上的综合。③档案信息中存在保存价值的历史数据具有稳定性。④档案信息随时间推移而不断增长,且数据单元都具有时间标记(时间戳)。⑤对档案信息资源的数据挖掘可以用来预测用户需求,提高档案工作的社会服务能力,推动社会的发展与进步。
档案信息的这些特点对于档案工作的开展是非常有利的,如果将这种特点具体到档案管理夜上海论坛工作的各个环节中去,并结合数据仓库的体系结构,便可大致构造出以下的流程模式如图1所示。
夜上海论坛 2 档案的收集工作
该步骤对应于数据仓库的源数据部分。从所收集档案信息的来源角度我们可以把源数据分为外部档案信息和内部档案信息两部分。所谓外部档案信息即不为本数据仓库所属机构所操作、拥有、控制的档案信息及其元数据;内部档案信息则与之相反,包括机构内的各种信息以及信息的元数据。从所收集信息的载体形式角度我们则可将源数据划分为纸质文件信息与电子文件信息。为了提高档案的管理、检索、传输与利用效率,大多数具有保存价值的纸质档案,在保证其真实性与完整性的前提下,通常会进行数字化处理,将其转换为电子文件,与纸质档案一同进行双套制保管。档案的收集工作除了要面向历史,反映人类社会原始的历史记录之外,更要以信息主体的需求为本,大力丰富和优化馆藏资源。
夜上海论坛 3 档案的整理、鉴定工作
由于档案信息最初收集到一处时是杂乱状态,需要进一步条理化,有序化,区分具有不同保存价值的档案信息入库保管。在这一过程中,由于档案部门使用的软件型号不一,规格各异,无法相互兼容,致使源数据可能是来自不同的数据库系统和操作系统,在编码、特性、命名规则等方面具有差异性。
①需要针对多个数据源,使用合适的技术进行数据抽取。②对于抽取得到的数据进行数据转换。在转换过程中,第一步要对不同数据源的数据进行清理,排除多个系统中抽取出重复档案信息的可能,检查多个数据源之间编码或者压缩格式的矛盾,然后实施数据转化,将抽取到的数据进行标准化,并按主题组合。③将汇总完毕的数据装载到数据仓库之中。在此处,数据装载包括两个层次,第一层是在数据仓库设计和建设完毕的时候使用大量时间将大量数据装载到数据仓库中;第二层是在数据仓库开始工作后,继续收集来自不同信息源的档案信息,并按数据仓库的要求对其进行转化之后追加到数据仓库中。
4 档案的保管工作
数据仓库正式运行之后,我们同样面临着传统档案工作档案的保存与管理问题。由于档案信息内容具有不同的保存价值与保密程度,所以需要进行分级管理。这就涉及到数据仓库中的数据分区问题。恰当的数据分区可以提高系统的安全性和稳定性,提高数据仓库各种数据处理功能的效率,使得数据增长和管理的实现变得容易。通常依据档案在数据仓库中的时间特性标准来进行系统层与应用层划分,将不同归档时间、不同保管期限的档案区分开来,利于保管与利用。在数据仓库中,数据被组织为早期细节级、当前细节级、轻度综合级和高度综合级四个级别。源数据最初通过集成进入数据仓库时,处于当前细节级,根据系统需要,再对当前细节级的数据进行轻度或高度的综合,得到的综合级别称为粒度,粒度设计的好坏,则直接影响数据仓库所要存储的数据量以及系统能回答的查询类型,所以,为满足不同层次的需求,数据仓库在组织数据的时候,一般需要根据当前状况进行多粒度级设计。对档案的销毁工作也是档案管理中不得不面对的步骤。对于一些丧失保存利用价值的档案如果继续保存在数据仓库中,不仅占用存储空间,对其的维护工作也是一项相当大的系统开销。为此,数据仓库中的数据,一旦老化(保存年限已经满足档案信息最初进入数据仓库时所预设的年限),便进入早期细节级,系统管理人员可以请相关人士对档案做出鉴定,如有继续保存价值则可存档到一个更低持久性、但更大I/O承受能力的始终可用以进行用户查询的子系统中,如无保存价值,则即刻销毁。
5 档案的利用工作
档案的服务利用是档案工作的总目的,充分利用档案信息资源,可以提高政府机关行政效率、提升企业竞争力、增强信息优势、推动社会政治经济科学文化发展。由于档案服务对象的年龄层次不同、智力水平不同、知识结构不同,于是用户对档案信息的需求也不尽相同。这给档案利用服务工作提出了很大的挑战。基于数据仓库的数据挖掘技术、联机分析处理技术(OLAP)、多维数据库管理系统等技术可以改善面向用户的服务质量。通过对数据的分类挖掘和聚类挖掘可以获得隐藏在档案信息中、人们所感兴趣的有用的信息和知识,解决数据过量但可用信息匮乏的矛盾。通过建立基础事实表与维表的范式,可以建立多维空间,通过钻取、卷起、切片。切块与旋转等基本活动让用户可以从不同角度、不同细节程度观察数据,拓宽用户的视野。
数据仓库技术是在传统的数据库基础上发展起来的,以上仅仅是一些数据仓库知识加诸于档案管理过程中构建的一种简单模式,数据仓库技术在档案管理领域的广泛推展和使用还需要大批的尖端技术人员的开发与相应软硬件系统的配合才能完成。
参考文献:
[1] 马费成.信息管理学基础[M].武汉:武汉大学出版社,2008.
[2] 陈京民.数据仓库原理、设计与应用[M].北京:中国水利水电出版社,2004.
夜上海论坛 [3] Paulraj ponniah(美).Data warehousing fundamentals[M].北京:电子工业出版社,2004.
夜上海论坛 【关键词】档安 管理系统 数据仓库
夜上海论坛 在现阶段,各种档案管理系统主要是采取交易的方式,主要功能是检索和统计。后期的数据是没有任何进一步的开发和利用,随着数据的积累,数据的的丢失情况会越来越严重,而且产生了巨额的维护和维修费用,而且容易造成数据丢失更严重。为了更好地利用现有的信息和数据档案,充分反映这些数据的价值,这些数据被充分挖掘隐性知识,并进一步利用已迫在眉睫。数据库技术现在已经无法达到完成这个任务,要想对数据进行深入分析,充分发挥技术资料的作用,就要建立数据仓库,来对数据进行深入的挖掘和处理。采用数据挖掘技术技术,不仅能大大的提高档案的安全性,而且也使档案保存更加方便快捷。随着计算机技术的发展,数据存储量也快速增长,如何才能从这些随机的,不完整的,模糊的数据中提取隐含的数据的,数据挖掘技术就能做到。
现以学生党员档案管理系统为例,建立数据仓库,来详细讲解应用数据挖掘技术,如何来建立数据仓库。
1 学生党员的管理系统,主要是从以下几个方面逐步实现
首先,由学校组织,进行基层组织调研,分析学生党员的基本情况,然后取得的一部分的实际数据,对现有的数据库表进行分析,以了解该每个字段的意义和作用,进行需求分析和专题设计。接下来从数据库表结构有用的字段中,选择合理的事字段信息和三维数据。最后通过数据转换服务来构建数据仓库,通过SQL Server2005中分析服务器配置工具来配置基于多维的数据集,在这个过程中,数据处理的过程主要是通过微软的OLAP功能,通过SQL Server7.0中将数据整合进去,接口的可以选择OLAP的COM的接口,并通过一系列的服务给数据仓库的应用提供程序支持,开发人员可以使用Vc或其他语言开发用户前端客户端,数据透视表服务还允许在客户在本地上传地存储的数据。MMC提供调度、存储管理、监控、报警和核心管理服务的功能。在本设计中,我们使用SQL Server 2010作为数据仓库,可以采用Access和Excel可以作为数据展现工具,除了SQL Server还支持第三方数据展现工具。
2 在数据仓库的设计阶段,我们从以下几个方面来入手
2.1 确定事实表
夜上海论坛 事实表分为学生党员目录信息表,党员情况登记表,党员接收情况登记表表,学生党员注销登记表等内容,其中党员的目录表根据类别,时间等其他情况又可以具体的细分为若干个表格。
2.2 明确事实表的分割方法
我们的档案资料,例如,最常见的方式是采用全宗划分,这样首先将全年的档案按年度来划分,一年内的档案按档案形成的部门或档案使用的单位来进行划分,在这种划分条件下,档案库中的档案是按以年度的方式的存放的,一般情况下一个单位的档案文档有几十到几百卷,一年中卷的文件目录的记录条数大概有几千到几万条,这样我们在数据仓库中储存这些数据时,就可以以年度的方式来存储,在对存储的数据进行数据挖掘时,就可以只通过年度来进行处理,这样就提高了处理数据的湿度,对数据在进行更新,添加或删除等操作时,可以更加方便快捷。
2.3 事实表数据的添加、修改和删除
事实表里面的数据还应该具备追加、删除、修改等综合处理功能,在对数据仓库更新操作中,添加和删除数据是一个经常性的工作,这些操作使数据仓库的质量得到可靠地保证。在进行添加操作时,首先要确保数据仓库中的数据那些是新的,一般情况下可使用通过时间来进行判断。删除操作相对简单,使用起来也更加普遍,只要通过一些搜索语句就可以实现。数据仓库中的操作做中,修改数据的功能用的比较少,在修改过程中,应当注意表和其他数据之间的关联性,保证数据的完整性,注意处理表和表之间的关系。在数据仓库,在基础数据的上会形成一些综合性的数据,在对基础数据进行操作之后,综合数据也会产生变化,所以对基础数据进行添加、修改和删除等操作之后,对响应的综合数据也要进行对应的修改,以维持综合数据的准确性和一致性。
2.4 数据仓库中维的确定及建立,维是同类数据的集合
维的层次结构很清晰,我们可以很容易地指定规则对数据进行运算,在维内,它的层次结构也是很有顺序的,利用维的这种特点,我们在对数据仓库进行数据挖掘的时候,可以很明显的提高数据挖掘的速度,质量也能得到大大的提高。以档案数据仓库为例,我们可以以文件编号,借阅单位,档案的文类号这三者建立一个三维立方体,要改变三维立体方的大小,就可以通过上卷或者是下钻的方式,要显示三维立体方的一面,就可以通过切边操作来进行。
夜上海论坛 完成了以上步骤,就可以着手构建数据仓库,收集和分析有关具体操作的基础上来构建数据仓库的模型,基于该模型的试运行情况,来完善设计方案,然后进入到数据仓库的物理设计阶段,在进行物理设计的时候,要注意选择安全可靠的硬件平台环境。
参 考 文 献
[1]S.Sarawagi,M.Stonebraker.Effieient Organization of Large.
Multidimensional In Proc.of ICDE[J].ACM Record,1994(5):207-208.
[2].
夜上海论坛 [3]中科永联高级技术培训中心,.
[4]Oracle.Oracle Warehouse Builder Transformation Guidel0g(10.2)[M].oracle,2005(08).
夜上海论坛 [5]数据仓库之路,.
夜上海论坛 [6]Oracle.Oracle 9i/SQL Reference(9.2)[M].Oracle,2002(03).
关键词:数据仓库技术;医疗档案管理;应用
1 前言
数据仓库(Data Warehouse)源于上世纪80年代中期,它是指支持管理决策过程的、面向主题的、集成的、随时间变化的、信息相对稳定的数据集合。将其应用于档案管理,不仅可以将档案数据信息进行知识化管理,建立信息知识库,使其能分门别类,达到实现知识应用的目的,而且还可将非数字化的信息纳入档案工作的范畴内,提高档案信息的利用率。当前,在医疗机构的档案管理中,基本也实现了数字化管理,但纵观其管理内容,则是档案数据只局限于存储、统计和查询等这些作用,却尚未从这些档案数据中挖掘出更为有用的知识,没有体现出档案数据应用的目的。在此,本文就数据仓库技术在医疗档案管理中的应用展开简要阐述,以供参考。
夜上海论坛 2 数据仓库的特点
2.1面向主题,即在进行档案管理的过程中,对档案信息用户的管理可以以用户的年龄、职业、爱好等等方面的内容为主题,以便查询。
2.2 集成性,即在进行管理的过程中,应在对原有仓库中的信息经过抽取、清理等基础上,同时经过再加工、汇总和整理,以使整个数据库中的信息是一个一致性和整体性的信息。
夜上海论坛 2.3 时间变异性,即数据仓库会随着时间的变化不断更新和增加新的内容,同时也要随着时间变化删除长期不被使用的内容。
2.4 相对稳定性,即是指数据库中的信息是为了提供综合、集成的、面向某一个主题的数据,这些数据在原则上是提供数据查询,而不允许被信息人员随意进行更改或是删除。
夜上海论坛 3 数据仓库技术在医疗档案管理中的应用
3.1数据仓库技术应用于医疗档案管理中的可行性
夜上海论坛 档案作为一种重要的信息资源,为人们提供鉴往知来、获取历史经验教训的重要信息功能。而医疗档案是指过去和现在各医疗机构中从事医疗技术活动直接形成的各种医疗文件、医疗图文资料等不同形式的医疗记录,它是医疗活动的结晶和产物,是已经文档化、实物化的知识。由于这些医疗档案信息资源具有时空分散性、数量庞大、记录形式多样等特点,使得档案信息的利用一直处于较低层次。如何真正盘活档案信息,使这些医疗知识和技能不论是存在计算机内,还是印刷在纸上,都能帮助医疗单位实现最大的产出。
而利用更高效数据仓库技术这样一种技术,采用数据仓库技术,可以实现有效的海量数据管理,提供数据管道实现多种数据源的综合,通过对数据的提取、分类整理及计算变换等方式进行处理,在精心规划的数据基础上,再通过有效、准确的分析软件充分地提炼和测试各种抽象的数学模型,找到数据间 “看不见”但客观存在的一些规律,以求能帮助医护工作者和领导者根据数据分析情况做出相应的决策。
夜上海论坛 3.2 数据仓库技术应用的相关内容
夜上海论坛 数据仓库的应用按用户的需求可分为信息的使用和知识的挖掘两类,数据挖掘即为知识发现中的一个步骤。一般,知识发现过程由以下几个步骤组成:1.数据清理;2.数据集成;3.数据选择;4.数据变换;5.数据挖掘;6.模式评估;7.知识表示。而数据挖掘是指从存放在数据库、数据仓库或其他信息库中的大量数据中识别出有效的、新颖的、潜在有用的以及最终可理解的知识的过程。
将数据仓库技术应用于医疗档案管理中,建立起相应的医疗档案知识管理工具库,为了方便人们能快速而方便地学习或了解所需要的信息和知识,在应用的过程中我们需要把知识仓库进行分类整理、存储及管理,这也是数据挖掘的一个重要步骤。
当前,将数据仓库技术应用于医疗档案管理,其主要是通过对医疗档案数据开展研究,形成专业的数据处理系统。一般,数据处理系统主要形式有两种:基于知识库的模糊推理和基于库存医疗档案资料的模糊推理。
夜上海论坛 4 数据仓库技术在档案管理中应用的前景
4.1 应用数据仓库技术,可以对档案的管理和建设决策给予支持,即体现在以下几方面:(1)通过对档案用户构成、各类用户特点等分析,帮助档案馆决策应采取什么样的措施来挽留和扩大自己的用户队伍。(2)通过对档案馆所拥有资料构成情况分析,可以知道本馆资料在类型、涉及面、层次等多方面的信息。(3)通过数据仓库系统可以模拟分析各部门之间的关系、 工作量情况,为档案重新整合部门、调整人员配置和设备配置提供决策依据。
4.2 应用数据仓库技术,可以为档案管理的业务工作提供系统支持,如档案管理中的归档工作、对档案信息用户行为的分析、对客户关注点进行分析及预测用户需求、为档案信息查询提供系统支持等。在归档工作中,可通过数据仓库及数据挖掘技术,对当前及历史上的各种归档和利用的相关信息数据进行分析,并通过绘制各种直观的图像、表格形式,提供科学、合理的信息分析结果及预测报告,做好归档工作。而在对档案信息用户行为的分析中,利用数据仓库技术,如可利用分类分析法和聚类分析法,对信息用户的利用方式和对象范围进行科学分析,并在利用现有技术和分析结果的基础上,对医疗档案利用趋势进行了科学准确的预测和分析,以满足信息用户的个性化需求。而在其他的业务工作范畴内,利用数据仓库技术,建立一些直观的图像和表格等,可以很清楚的了解信息用户的需求,同时也可开发一个集信息组织、检索和提供于一体的功能强大的档案信息服务数据仓库,方便用户的查询。
5 在医疗档案管理中建立知识数据仓库时应解决的几点方案
建立知识数据仓库时,应重点注意以下几个问题的解决方案:
夜上海论坛 5.1 设计数据提取模式,建立数据模型,要解决提取什么数据和如何整合编排数据的问题。例如,建立以病人为核心的一体化的信息流,并以此为主题进行模式划分,需确定从各个系统中所要抽取的表,并确定表的关系模式。与医疗密切相关的内容主要包括门诊、住院病历数据、体检信息、用药情况、费用情况、检验数据、手术情况等。由此可以定义分析维度和分析度量。如门诊的分析维度就包括:就诊科别设置、医生、护士人员配置、诊疗质量及状况等;分析度量则包括:就诊数量、时间、流量对比值等。
夜上海论坛 5.2 数据形式的格式化问题。医疗单位的医疗信息是各类型数据的集合,部分数据类型并不适用于建立数据库。根据数据仓库的特点,解决数据的规范化和格式化问题是建立档案知识化管理数据仓库的一个首要问题。在数据采集时采取格式化录入,是解决这个问题的有效方法。由于目前我们在各类基础医疗数据的信息录入时还没有固定格式,将给信息的交换制造极大的障碍。另外,自由格式医疗文档以及图像、图表等各类信息在数据仓库中如何规范运用等问题的解决方法,也是必须考虑的。
夜上海论坛 5.3 结合医疗实施需求,实现档案知识化管理数据仓库的有效运用。通过广泛收集一线医护人员对信息的需求,建立面向医疗工作实际的数据仓库的应用模式,充分发挥知识化管理数据仓库在提高医疗质量、为医护人员提供优质服务的作用。
6 结束语
夜上海论坛 综上所述,数据仓库技术作为近些年来刚被提出的新技术,在电信、金融等领域已经有了广泛的应用,并发挥了重要的作用。在本文中,就数据仓库技术在医疗档案管理中的应用展开了一系列的阐述,以期能利用数据仓库这一先进的技术,完成对医疗档案知识进行有效的收集、整理、存放、评价、共享、获取、传递和提炼工作,从而大大提高医疗档案数据的利用率,并强化档案管理工作者和医护人员之间的沟通、交流和协作,最终使医护人员和管理者们能从医疗档案知识管理中得到实惠和效益。
参考文献
[1]冉朝霞.数据仓库技术在档案管理领域的应用[J].档案管理,2009(3).