前言:我们精心挑选了数篇优质网络可视化管理文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

1)网络夜上海论坛中交换机越来越多,多种厂家网络设备不能集中统一进行管理,所有交换机处于无序管理状态,线路拓扑结构没有清晰明了的视图,只是机械的添加、更换维护等状态,具体某个竖井位置有几台交换机如何级联都不能清晰明了地了解,不能很好地统筹管理。
2)交换机的级联层级越来越多,具体不能确定到底有几级。因为由于不断地增加交换机,每台交换机与核心交换机之间有几级不能确定。注意的是交换机不能无限制级联,超过一定数量的交换机进行级联,最终会引起广播风暴,导致网络性能严重下降。
3)交换机出现环路情况无法及时诊断与确定。因医院科室地面需要定期清洁,需要把相应的线路进行收起来后重新清洁地面。往往清洁完地面后,人为原因导致把一根网线的2端都插入到交换机上,造成了整个网络死锁,并导致整个网络瘫痪。这种故障不易排查,发作也比较突然。
4)网络中某一交换机出现故障,导致其级联下的全部中断。故障不能及时发现,必须到现场进行逐个测试排查,从故障终端向上追溯逐个检查,直到检测到相关设备故障,才能解决故障,不能及时定位到具体哪台出现故障,整个检测过程比较费时费力。
5)交换机的数据转发性能有差别,如何将合适的交换机配置到合理的位置,只能根据网络流量大小进行分布,传统的网络不能监控网络中交换机端口的流量,只能凭借经验及管控的大小进行分析,有时分析不当会造成网络出现瓶颈或者浪费问题存在。实时的流量监控可以出现流量异常现象不能及时处理,对医院网络系统硬件监控力度不够。
6)核心交换机及服务器集换机出现故障如何及时发现,往往该交换机出现故障后相关故障灯没有报警,整个网络出现中断,服务器无法进行访问,到底是服务器故障还是核心交换机故障,在排查过程中费时费力。这个是医院网络威胁最大的故障,并且是最难发现排查的。如何第一时间发现故障、排查故障是很关键的。面对以上的问题,传统的网络管理方法单一、管理力度不足、管理操作复杂,已不能全面高效地管理现有的网络,不能实时监控到相关设备的报警信息,不能及时排除网络故障,更不能对网络资源和业务进行全面的融合管理与调配。以下将通过可视化网络管理软件与合理的布局可视化网络管理软件的服务器端与客户端就可以很好地发现解决以上问题。
夜上海论坛 2网络管理软件实现可视化管理与对策
夜上海论坛 2.1可视化前期准备
先将网络中的服务器、存储、交换机等资源进行融合管理,对相应的服务器及存储进行IP地址分配管理,网络中的交换机通过交换机的console口对全院内网交换机进行了统一的IP地址分配与相关策略配置,全部内网交换机都重新打上了标签进行编号标注,对没有可管理功能的交换机进行替换升级,保证对交换机的管理覆盖到终端,很大程度上实现了对数据中心网络的全覆盖管理,更方便了当终端出现故障时可以第一时间进行定位排查。
2.2可视化管理
夜上海论坛 H3CiMC智能管理平台创造性的使用业界主流虚拟化软件(VMware,Hyper-V)等对服务器、VM的管理能力,将网络管理服务器、网络管理报警客户端及交换机统一纳入到资源可视化管理中,虚拟网络拓扑以实际的链接拓扑方式体现相应设备之间的从属与链路关系。同时,通过设备之间的链接关系,展示出网络设备所在的网络地理位置。满足数据中心基础设备间的链路关系、所见即所得的管理需求。可使医院的交换机分配具有了可视化监控,出现故障也可及时查看与排除。通过网络拓扑结构图,对现有的交换机层级进行了线路优化,使得山西省人民医院的交换机层级达到最小化。医院外部的医疗联合体医院网络也通过专线也实现了网络实时监控。在可视化界面上可以实时查看相关设备的运行状态、设备属性及当前报警信息等。
夜上海论坛 2.3流量性能与报警管理
流量性能管理方案包括IMCNTA,ACLM,QoSM等组件。流量性能管理可以使用支持NetStream/sFlow/NetFlow等技术的网络设备提供网络流量信息,也可以使用DIG探针采集器对网络流量信息进行采集。通过可视化界面实时查看各设备流量的分布图与明细图,在对流量分析的基础上,通过ACLM、QoSM从实际应用层次上去规划网络管理,创建QoS规划、控制QoS部署、监控QoS部署效果,优化部署策略,屏蔽底层设备差异,实现QoS服务保证所见即所得,实现流量异常实时报警功能。并且提供SLA工具,通过获取抖动、时延、丢包率等指标数据来量化QoS,并输出图形报表,使得关键的业务得到端到端的带宽保证。从而使人们从实时输出图形报表中分析流量,并且进行相应的管理与优化。iMC提供了通过对交换机相关属性设置,自动监控网络中的交换机状态及链路情况,甚至细微到每个交换机的端口启停状态,自动发现应用、应用监控、主机监控、分类监视等模块,同时拥有丰富的报表功能。当被监视的交换机相应的状态出现异常时,系统就会自动产生告警,通过这些告警,可以鉴别出网络故障出现问题的根本原因。
2.4总结经验优化管理
夜上海论坛 网络管理服务器与网络管理报警客户端地理位置不在一个地方使用,网络管理服务器在密封的机房环境内统一管理,而网络管理报警客户端则在办公室机房内使用,二者之间要实现实时管理需要交换机进行连接,故障发生时,如果之间的交换机有一个发生故障就会导致系统瘫痪,实时监控就无法使用了。总结经验,把网络管理服务器与网络管理报警客户端的所有交换机都去掉,对网络管理服务器新增了第二块网卡,在网络管理服务器与网络管理报警客户端新增加专线,采用双网卡把二者直连起来,当网络中出现故障时,排除了相关交换机出现故障导致网络不能进行实时呈现监控。从很大程度上提高了系统的稳定性、实时性。
夜上海论坛 2.5网络内部安全管理
夜上海论坛 因院内网机器数目多,使用人员多,操作复杂,导致内网感染病毒较多,最终造成网络及内网程序不能正常工作。为解决此类问题,通过使用网络版杀毒软件,经过对比各类杀毒软件性能,采用了赛门铁克局域网杀毒软件,并设置了相应的杀毒、管理及升级策略,定期每周进行杀毒软件病毒库的升级。安装后的客户端计算机不能卸载,所有移动存储设备、光驱等都被相应禁止掉了,无法使用。该杀毒软件上线以来,从一定程度上遏制了病毒的传播和破坏,进一步保证了院内网信息系统网络的安全性。
2.6培养优秀的信息系统管理人员
医院信息系统网络管理需要24小时人员值班,处理故障需要快速及时有效,这就需要工作人员,技术水平高,并具备高度的责任心。他们即要熟悉医院的相关医疗事务,医疗信息系统的管理与维护,以及医院网络系统的设计、安装与日常的维护工作,还需要及时处理各种网络突发故障,因此,工作人员水平的高低与医院信息系统管理服务质量密切相关。在人才建设方面,科室树立以人为本,人员每周五下午轮流给大家讲课并相互交流经验,定期每个月初先进的技术厂商前来进行相关先进技术讲学。
3结束语
随着信息时代的发展,网络的普及,固定宽带网络作为一种高效、低价和稳定的互联网接入方案仍然是目前用户的首选。随着用户数量的与日剧增,相应的通信基础设备也在不停的增多。目前,基础通信设备的数量已经很难用常规的方法进行管理和维护,在可预见的将来,大量的网络设备的管理和用户信息监控将成为网管部门工作的难点。如何在大量数据的状态下准确定位设备,维护设备,保证工作质量,提高工作效率成了急需解决的问题。目前,在工作实践中原管理方式存在几下几个突出问题:(1)维护人员使用传统的手工输入命令的方式进行网络设备的信息检索与维护。这种原始的方法一方面人工输入的方式增加了错误发生几率,另一方面人工输入方式效率极低,无法应对未来发展。(2)没有严格的权限管理。权限的开放使得所有维护人员都可以对设备进行管理,甚至越权管理。在出现问题的时候没有办法追溯问题原因,追究责任,造成过程不可知、结果不可控的问题。(3)设备数量的增长导致维护任务的增多,在保持原有维护人员和管理方法的情况下,会造成管理跟不上数据的增长的现象。没有一套实用又简单的管理程序代替工作人员完成繁琐的数据整理工作将会使管理任务堆积,设备可靠性降低。针对以上问题和矛盾,设计并研发了网络设备管理系统。该系统能够对现有城域网中设备的管理,通过数据可视化技术对设备进行图形化检索和展示,降低了底层维护工作人员的操作难度,简化了操作流程。同时,系统能够实时采集用户上网信息,分析并进行过滤处理,能够提高错误定位效率,极大提高了障碍处理的速度。在安全方面,实现了维护人员权限分级,相应的权限只能处理相应权限内的信息,记录维护人员的操作流程,能够形成完整的操作日志并对追溯信息进行管理。
2.网络设备管理系统
夜上海论坛 网络设备管理主要针对接入网络内的以下几种设备:(1)OLT(OpticalLineTerminal)OLT是光线路终端,用于连接光纤干线的终端设备,可以与前端(汇聚层)交换机用网线相连,转化成光信号,用单根光纤与用户端的分光器互联。(2)ONT(OpticalNetworkTerminal)ONT是光网络终端,是xPON网络接入方案中的产品,是一种用于用户端的光网络设备,主要应用于最终用户。(3)ONU(OpticalNetworkUnit)ONU是光网络单元,也是一种用户端的光网络设备,他与用户之间通常还有其他的网络设备,比如交换机、路由器、网桥等。其中多个ONU设备与ONT设备连接在OLT设备下,多个OLT设备连接到数据中心,构成一个树形拓扑网络结构。针对网络结构的特点和具体的业务需求,系统主要分为用户账户管理、上网信息管理和设备信息管理三大模块。网络设备管理系统的主要特点如下:①系统采用B/S架构,以HTML5通过浏览器呈现数据,无需安装客户端,能够适应几乎所有的操作系统平台。②系统基于开源数据库存储数据,自主加密数据储存,数据的安全性、可靠性得到充分保证。③系统具有一定的自我维护能力,能够辅助管理人员,将管理人员从繁琐、重复性的工作中解放出来,提高维护效率,真正实现软件适应用户。④系统数据展示方式多样,除了传统的表单方式,还有更加直观的图形方式,使管理人员操作难度降低,提高用户体现。⑤系统实现了从网管中心到分局的数据全面共享,使不同部门的操作人员管理、协作更加方便。⑥规范化的操作日志记录功能将所有账户的操作情况记录在案,做到所有操作可追溯,方便责任认定。⑦系统可根据管理员提供的关键字查询OLT设备、ONT设备和ONU设备的信息,可以对ONT设备进行注册、删除操作,替代传统的拆装机工作。在开通PITP(PolicyInformationTransmissionProtocol,策略信息传送协议)或PPPoE(Point-to-PointProtocoloverEthernet,以太网上的点对点协议)功能的服务器上,可追踪话单信息,查询用户所使用端口、VLAN、MAC地址、登陆账号、登陆时间和离线时间等信息。当出现障碍时,维护人员可以通过系统查询用户登陆账号或MAC地址等关键信息快速定位到用户设备所在地,做到故障及时排查。
3.数据可视化
传统系统采用列表式展示数据结果,在设备数量过多时,具有相同关键字的数据将会特别多。比如以区域进行检索,结果常常达到数百条,维护人员很难在长达4-5页的检索结果内定位故障设备。分局信息以拓扑图形式直观的展示出来,通过点击分局可查看分局下挂接设备的拓扑结构。通过拓扑图方式,网络设备的层次结构,状态信息得到了直观的展示,维护人员可以不依靠关键字,甚至不依靠键盘的情况下依靠鼠标或触摸设备准确查询设备信息。这种方式还适用于移动便携式客户端使用,为现场处理故障提供了可行、可靠的判断依据。
4.结论
夜上海论坛 关键词: 可视化运维系统; 网络管理; 应用实践
中图分类号: TP393 文献标识码: A 文章编号: 1009-8631(2012)06-0065-01
前言
夜上海论坛 随着互联网业务的蓬勃发展,VoIP、IPTV、移动服务、VPN业务、游戏以及越来越多的增值业务在IP/MPLS网络上运行。如何管理客户的各种质量体验、实时监控业务质量、业务出现故障时准确快速故障定位、新业务开展前的能力评估、7*24小时的业务综合质量评估是当今电信运营商面临的新挑战。
一、可视化运维系统的应用意义
由于IP网络运维存在三个“不可视”的问题,导致网络运维效率整体偏低。
1.承载的业务品质不可视,不能感知终端用户体验。网络性能与业务品质是分离的,业务部门和网络部门认识故障的维度不统一,没有统一的度量尺度,造成故障定位需要跨部门专家协同工作,人员技能要求高,故障定位效率低。
2.路由不可视,看不到业务路径。IP网络引入动态路由,三层网络是一片云,看不到业务的路径。路由不可视导致在IP网络运维过程中,经常出现终端用户申报了故障,而当运维人员进行故障定位时,故障又消失了,问题无法重现,又没有历史信息可以查询,无法找到故障原因,无法彻底解决用户的问题,造成排除故障隐患困难。
3.端到端管道不可视,创建过程复杂,且状态不可视。端到端管道的创建过程需要跨域部署,并且配置内容复杂。在业务部署过程中,需要运维人员全盘考虑每个节点上业务部署的参数和参数之间的相互关系,一旦发生参数配置错误,也很难检查和纠正,对IP运维人员的专业技能要求高。
对于承载着各种业务的运营商网络,如何判断承载的业务质量劣化、如何评估网络承载业务的能力、如何监控网络健康状况,特别是当网络出现故障的时候,如何通过测试手段快速而准确地定位故障点、区分是业务平台的问题还是网络自身问题,成为当前IP网络维护面临的新挑战。
可度量,才可管理;可管理,才可改进。在网络IP化后,最先需要解决的问题就是可度量,也就业界提出的IP运维可视化方案。
夜上海论坛 IP网络可视化运维有以下三个要求:快速解决故障,即当网络和业务出现故障时,需要快速解决问题,实现迅速的故障定界和定位;主动预防问题,即对业务质量和网络性能实时监控,及时发现问题,IP承载网的故障需要关联到被影响的业务上,并通过趋势分析,提前做出预警;网络日常管理,即建立网络质量监控和健康评估系统,通过整套的指标体系来反映和管理用户体验,掌握网络的实际运行状态,不断提高用户的忠诚度。
二、陕西铁通可视化IP网络运维应用实践
陕西铁通互联网网管主要使用IP城域网综合网管及其子系统实现对省内互联网业务的全方位综合监控管理。综合网管系统可以对城域网核心层、业务控制层、接入层网络运行情况进行实时监控。
三、综合网管系统在网络质量管理中的应用
夜上海论坛 1.设备和链路性能管理
通过综合网管系统对在网设备的实时监控,不仅可以发现当前网络中正在发生的故障,还可以通过其强大的后台信息库系统,追查故障的历史记录信息。并且通过定期检查在网设备TOP N排名情况,对存在问题的局点,深入分析问题根因,采取适当措施进行整治,如对接入层设备的上行带宽进行扩容、对存在隐患的设备进行更换或进行线路整改等。
2.用户质量管理
(1)面向接入层的用户质量管理
用户资料准确率,端口速率达标率,用户异常掉线率,是衡量网内宽带用户接入层质量最重要的三项指标。综合网管系统可以按地市、分局、机房、型号、类型等有选择的显示所有接入层DSLAM、LAN、PON设备信息。后台数据采集任务对所有网元进行扫描测试,提取用户端口和线路参数,形成宽带用户历史信息数据库。各类报表的输出可以对用户端口达标率及掉线率的统计分析工作提供有效的数据支持。
夜上海论坛 通过综合网管系统,可以做到接入层设备可控可管理可查询,包括设备局点、端口、用户资料等多方面信息,为各种数据分析、数据挖掘、数据统计等提供了完整的原始资料,为维护和故障查修部门提供了整治依据,逐步提高接入层网络质量,从而在一定程度上改善了用户体验。
(2)面向用户感知的端到端质量管理
陕西铁通近年来端到端时延/丢包合格率始终控制在96%左右,优于业内认可的平均指标,但仍有用户频繁反映下载速度慢、视频缓冲、游戏卡等问题,这也间接反映出以时延/丢包为主的网络质量评估系统难以全面准确反映客户的上网感知。
通过综合网管系统,能够对全网数据进行采集分析。不仅可以对各链路流量进行单独评估;也可以细化网内流量模型中的各种成分,如对P2P,VOIP,HTTP等业务进行细分,并进行针对性控制;还可以基于特定用户进行流量流向的统计分析,为我们掌握用户的上网行为提供了有力的数据支持。通过这些方法,我们将得到的信息进行深入分析,并根据分析结果展开互联网链路优化,流量流向分配,用户差异化管理等工作,大大提高了IP网络运维的主动性和针对性。
同时,为了解决端到端用户体验不可视问题,我们建立了一套独立的用户Q值体验系统。通过该系统,我们对采集的原始数据进行分析,并对比本地其它运营商的用户测试结果,找出网络质量差异。对不达标的项目,有目的的进行限期整改,使用户综合质量感受始终保持在较好的水平。