不想错过重要资讯?
马上订阅新闻邮件!
 
a 您现在的位置: 中计在线 >> 人物 >> IT厂商 >> 文章正文
北塔王凡:网络运营 管理之道
作者:王凡    文章来源:中计在线    更新时间:2007-4-19 10:02:12
【字体:
 中计在线信息化频道全心上线!全力推动中国信息化进程!信息决策,易如反掌,尽在CIW信息化!
盖茨访华:慈善下的商业战略
[农村包围城市] [慈善基金会二次创业? ]
·访微软首席架构师:Web转型的宁静革命
·马化腾:登上《时代》杂志 QQ是最大功臣
· 微软5年后决战GOOGLE的杀手锏
·3月IT产品广告投放监测图、表

    “第八届中国信息安全大会”于2007年4月18日在北京新世纪日航饭店隆重举行。本次大会以“和谐网络&应用安全”为主题,并组织了四场分论坛,主题分别为“安全网络&绿色上网”、“特色产品&行业应用”、“信息安全管理&合规性”以及“业务协同下的应急管理”,以下是本次大会的精彩演讲之一

王凡:谢谢主持人,各位领导、各位来宾大家好!很感谢今天有这样一个难得的盛会,把自己在IT领域的一些体会跟大家分享一下。

首先是我自己简单地介绍,我是上海北塔通讯网络科技发展有限公司系统工程师,所以我讲一下我们网络运维方案的时候要符合哪两个方面,第一个是产品,你产品要符合用户的需求。但是在用户需求这一块,我们首先要分清楚,什么是用户的要求,什么是需求,要把用户的要求和用户的一些需求要分开。而且,我觉得我们作为厂商来讲,我们有责任帮助用户把他自己的一些要求提炼成需求。

第二点就是服务,因为我借的现在整个的软件业是朝着SOA的方向在转型。所以我觉得SOA是衡量你软件成熟度的标志。在服务里面引出了我们这样基于事前管理理念的运维的管理解决方案

我们先讲一下北塔公司的简介,还有为什么需要管理,然后是北塔网络管理解决方案,然后是系统的功能及特点,最后是成功的案例。北塔公司是国内的网管厂商里面本土的品牌里面是排在整个行业的前茅。公司的总部是在上海,目前在北京、广州、成都、西安都有我们的分支机构,在很多的省会城市都有我们的办事机构。这样可以为所有的用户提供本地化的支持的服务,而且软件这种东西跟硬件还不太一样。你的服务必须是很有保障的,而且是可衡量的。

我们公司是从00年开始研发,像我提到的这款产品是01年就面市了,然后这些是取得的成绩。这些是我们公司的30多个合作伙伴,所以很多全球前列的厂商都是我们在管理方面的一些搭档。

这个是我们一些典型的客户,而且很多的客户都是我们层次化管理解决方案部署的客户。这个是IDC的数据,主要是通过目前的市场的管理、运行的数字,在这个方面用户的需求还是呈快速的增长的势头。

接下来我们看一下管理的必要性,因为我觉得其实在坐的很多专家可能在安全、管理这边都耕耘了很多年,所以我们简单地过一下。首先就是网络环境越来越复杂,异构的网络环境。我们当前的企业用户里面的状况、服务器、电路、设备都不是同一个厂家的,是属于跨厂商、跨平台的异构的环境,所以这里面的设备的水平是参差不齐的,而且还有PC、服务器等等的混杂的准备。而且它面临着下属单位的管理的需求,所以我们面临跨平台的需求,我们需要有一个综合的统一的管理系统,把它全面地管理起来。

第二个是多种业务的运行,需要有差别的服务,其实这个在大的行业客户里面大家可以看到,它有很多的自己的业务系统。我们知道现在的IP网络是朝着多业务承载的方向发展。就是说网络上数据的比例可能比较缓慢,像语音、视频这种多媒体的业务,增长是比较快的。所以我们网络上多业务在并行的时候,我们必须提供有差别的服务。首先我要透明,这样的话我可以根据不推的级别提供有差别的服务,这个引起伍引出了北塔的理念叫做透明牌的管理思想。所以我只要针对透明化,针对你具体的业务,就可以保证你整个的业务系统是在7×24的不尖端地运行。

及时地把故障定位于发现,防患于未然。这是我们所有做产品的厂商的理想,为什么说这样是一个理想呢?因为当前的用户的网络环境里面的故障都是不可预知的,不知道在什么时候会瘫掉。但是有一些资深的管理人员,他可以凭借自己的经验做一些判断,但是作为普通的运维人员来讲,他没有专业的经验,会导致他日常的工作很被动。可以说是来电响应式的维护,就是接到电话就疲于奔命、忙于救火,这样的时效性很差。这样每天的工作很繁重,但是业务部门不许可你,所以对业务系统造成了损失。所以我们怎么样及时地进行故障定位和发现是非常重要的。

投资的有效性和合理性受到怀疑。这个就是说我们企业,其实我们的网络可能每隔一个周期,或者是几年随着业务的发展都需要扩充,包括我们的业务系统也是一样的。都需要新上一些服务器或者是新的应用。比如说我新上一个服务器,我到底需要购买什么样性能的服务器,还是说我网络部扩容,那我的瓶颈到底在什么地方?你要做一个IT的投资或者是预算的时候,你必须有一个分析的报表,分析出当前薄弱的环节和我需要改进的点。那么分析报表从什么地方来呢?这个跟北塔的产品记录和报表是结合在一起的。我们是通过历史记录把日常系统里面一些性能指标或者是参数,他一个阶段内的运行趋势记录下来。如果我们根据这个投资报表做一些投资或者是记录的时候,拿给领导看,我觉得领导会改观的。

现在我们都面临着服务级别的保证,就是怎么样能够保证我们的IT服务质量呢?这样的话是需要我们有一个综合的运维的平台,来改变我们目前包括IT部门的一些很大的工作压力,需要有一个平台级的系统。所以刚才分析了那么多,我们目前在管理上面存在的弊端,或者是还不太完美的地方,当前中国用户在管理方面的现状,就是缺少有效地管理手段和管理方法,使得来电响应式的管理成为了实质。就是不出问题都不知道,出了问题大家都埋怨你。其实这个角色并不是由信息人员本身的素质或者是水平造成了,而是由于我们管理的平台造成的。

接下来我们看一下北塔的网络管理的解决方案,其实说大网络管理,我觉得对于整个网管的产品是有4个层级的划分的。第一个级别是网民级的管理,第二个是网络机关,第三个是服务机关,第四个是事物机关。其实北塔的这个产品是立足于一个网络级的管理,而且现在也是慢慢朝着服务级的管理在进行转型的。首先,我们看一下我们需要什么样的管理,这个也是北塔在研发这个BTM产品的出发点,我们是基于什么考虑。

首先希望网管系统能够主动地告诉我们一些潜在的故障,而不仅仅是数据查询的系统。因为大家都知道网络管理的系统,他从大面上分,分成数据的采集层、加工层面,最上面是数据展现的层面,是这三个层次。所以从数据采集的层面,各个国家的采集方式都是大同小异的,都是一些常规的东西。在采集这个层面所有的厂家的差别不是很大。

但是比较有差别一点的是数据加工和处理的层面。作为北塔来讲,我们希望提供给用户的信息是更有价值,更有异议,能够更帮助你日常的运维管理。所以我不只是我通过SNP把你这个数据抓上来然后有一个展示的方式,不是简单的查询系统。

然后有一个功能的告警和预警的系统,来实现机房的无人职守,这一块我们告警和预警两个方面,我们首先是对网络健康时候的运行状态我们要恢复记录。其实我们碰到很多的用户在部署完了网管系统之后,比如说有一些告警的值设多少不清楚。我们应该从某一个指标的长期的观测中来,比如说通过历史,我这个流量多大算大?多小算小。这样我通过一个变化的趋势得到最大最小三个值,这样我可以通过这个值来设值,如果你比最大值大,或者是你比正常时间的平均值背离很多,这肯定存在问题。

 还有就是远程解决故障。我们这个BTM产品提供远程协助的解决方式。这个我觉得是作为所有的网管厂商里面蛮有特色的工作,就是说因为软件这个对象,我们面对行业的具体用户的时候,他们的水平也是千差万别的。他们经常软件不会配就会打电话,但是电话里面存在着语言的差异和理解的能力,所以电话里面并不能解决任何的事情。所以只要打开我们的远程协助会自动连到我们上海的技术中心,我们那边值班的公司,在得到用户授权的情况下,登到你的网管机上,帮你做配置和解决问题。

跨平台、跨厂商的集中控制和统一管理。其实我觉得跨平台跨厂商这一点,我听到这个东西没有任何的新意。但是北塔倡导的这个跨平台跨厂商有自己独到的地方。因为我觉得作为网管来说是基于SMP这个协议。但是从我个人学习这个协议的过程中,我总感觉这个协议有很多不是很完美的地方。这个协议在设计的时候是很单纯的,它跟ISO的其他的协议,比如说MIT或者是MOT比,我觉得很多细节的东西,他概括化了。这样的话,导致了每个厂家,尤其是一些个别的差价说可能在这个协议实现的过程中,有一些细节考虑得不是很全面,或者是在这个协议当中搀杂了个性化的东西。那么如果你抓到的数据都有问题,你怎么加工和展现呢?所以北塔倡导的跨平台和厂商,是我们在这个领域做了几年,我们对于全球差不多30多个厂商积累的经验,把不太规范和有待完善的地方加进来。这样可以保证主流厂商或者是小厂商,我们都可以进行集中地控制和统一管理。

信息关联,提高运维的效率,其实信息关联也是很重要的。因为我觉得,作为一个负责任的厂商来讲,我们不能说只是把这些设备采上来就完了。而我们是着力剖析各种表之间的关联性,希望可以找到现象背后的一些东西。

然后是优化部门的流程,减轻工作压力。因为现在国内很多的企业用户和大的团队用户,他在上网管系统之前,其实基本上还是依靠手工或者是很产生的方式管理,所以他没有一个工作的流程。我们是希望通过我们这个产品,把整个的工作的流程理顺,而且我们认为北塔的这款产品,这其他的产品有什么不同的话,着眼点我们不仅仅是为了解决某一个具体的技术问题。因为其实我觉得如果你在某一个专项上来讲,你为了解决一个具体的技术问题,可能在某一点上不如其他厂商在这个项目上纵深做得更深。所以,我们是希望提升整个企业管理的水平。

还有对一些跨地域的大型的行业用户,比如说省、地、市这种三级的大型的政府、单位或者说行业用户,就是说我们可以对他在广域网的范围内分布的IP系统进行分层次多用户的统一管理。

不要改变游戏规则,因为我觉得我们接触到的很多的国际的能源、电力的企业,在上网管之前的策略已经固化下来了。这样的情况,你部署一个产品的时候,你必须要坚固他的策略和规则,你不可能去撼动他,那么怎么样灵活地迎合这个规则呢?这也是需要考虑的一点。

还有就是简单应用,不需要太多的背景知识。其实简单应用这一点不仅仅局限在中文界面了,因为很多的页面都已经中文了,所以我们是怎么样面向中国用户使用的特点、习惯来进行产品的部署或者是使用。

自动生成报表,便于了解IP运维的状况。我们是通过这几点来考虑我们整个产品是需要面向用户的哪些需求。

 还有一个是降低管理成本,管理的代价不仅仅是指产品购买的代价,更要考虑设备的投资、人力的投资、培训等等,是一个总拥有成本。为什么国内的用户购买了产品之后都没有用起来呢?我觉得不仅仅是购买的代价,一些国外的厂商的产品确实比国内的先进。因为其实很多国外的厂商在80年代末90年代初的时候就开始研发产品了,比我们国内的厂商多跑10来年的路。像BTNM我们不需要对环境做太大的改动。不需要太多专业的技术,普通的用户就可以掌握,所以我们在业内也是号称不用看说明书的。

我们的自动生成物理拓扑结构图,我们这样可以直接告诉用户你需要什么,他一看到这个颜色,我应该察看一下哪些问题,所以用颜色告诉用户应该关注的点。其实图中有几个小的Case,我们看一下超发这个地方,这是36个路由器,CPU的负载是黄颜色的,这证明他是比较高的。但是与他相连的M40的流量是最低的等级,我们觉得很奇怪。为什么呢?因为你CPU负载比较高的时候,你肯定是频繁地路由计算来解析,但是在频繁地计算的同时,你肯定是有问题的。果然是这里面有广告病毒,在不停地扫描,保证你路由器的负载很高。

 我们还有跨厂商、跨区域的管理,我们提供了真实面板图的管理。在这里面我们可以一目了然的看到状态,其实我们还综合了很多的信息。大家可以看到,有一些端口下连的PC或者是数据,我们可以很轻松地点出来。这个Case其实是北塔倡导的整个的处理流程。整个的流程我们倡导从问题的发现、到追踪、定位、解决一系列的步骤。如果大家有兴趣,我们可以会后再介绍一下。

 这个是北塔的多种告警方式来实现无人的职守。涵盖了网络管理、IT管理等方方面面,我们通过多种的展现方面要展现出来。这里面有一个第三方的告警,我们其实是可以做一个世界的联动,这样便于你有一个故障分析的机制。

这是我们大型的网络层次化的管理,这主要是面对广域网,我们进行一个分布式的管理,这个大家简单了解一下。

这是北塔对于应用系统,对于服务器我们全方位的监视,因为北塔对于服务器的管理,跟国内其他厂商的着眼点不太一样,就是说我们是通过这4个层面。首先我们在网络层,保证服务器的物理地址的固定和安全,我们可以把服务器的地址和所相连的交换机的断口做绑定,这样他的位置不会发生非法的迁移,然后他的IP地址不会被人盗用。我们可以做一个用户的仿真,我们可以设立一些特定的端口,最黑我们从服务器的内部检测一些数据和应用,还有进程的运行的情况。比如说有7个进程,这7个进程是不是都是对服务器实现全面的管理。

这个是数据报表,我们可以把日常比较关心的一些性能的指标,我们可以做一个历史记录,这样的话,来观察他在一个时期变化趋势,可以很方便地插到我们的网络运行分析报告里面来,这样可以形成一个有数据、图表的展现方式。

接下来我们看一下整个系统的框架,就是首先在管理对象来讲,是对整个的IT基础设施所有的方面都是我们管理的对象。然后,我们还是通过之前提到的管理方式,把它的一些性能参数指标都提取上来。在我们对象管理层里面做一个二次加工,其实我们跟业内的一些其他厂家的产品我们可以有一个数据上的传递的。就是说他的那个东西,都是通过这个抽象化传递过来,我们也可以跟他有一个交互。处理完了之后,通过基础平台转到我们后台数据库里面,做一个存储。通过我们业务层和功能模块进行信息的承载,通过SRPC来转到用户界面。大概是这样一个框架,这个框架我不细说了,因为展开说太多了。

这是我们整个功能模块的组成,在物理拓扑这一块,北塔是国内厂商里面在拓扑的精度和准确度方面是比较高的,我们可以根据用户的具体环境设一些算法。这个也是一个性能管理,我们通过各种颜色,包括我们可以通过线路的粗细反映这个流量的大小。其实关联性强的性能参数,浏览和设备是一些表象。

  地址簿提一下,这是我们产品非常有特色的东西,我们是通过地址簿来自动交换交换机的地址表,还有路由表,这样我们可以找到IP Mac和所在的地址关系。为什么说这个地址簿有价值呢?其实这个地址簿来源于这两张表,但是在ARP这张表很充溢得到,但是在IP  Mac本身搞得很零乱,如果你没有经验处理,你取的东西,那个后果就很难说了。

数据流,北他的数据流是在业内的厂商里面是为数不多的三种数据流的分析技术,而且它是比较简单应用的,是抓住了你在日常的应用管理里面应用最多的功能。大家从这个界面上看是比较简单的,我们通过对这个流量做一个快照就知道里面整个的细节。

咱们系统的特点是简单易用,主动直观,通用性,真实性,实用性,扩展性,便捷性,安全性,服务能力。所以,我们最终的目标还是致力于提高中国IT网络企业运维的水平,所以我们的发展方向是完全来自于中国用户的需求。

最后是我们成功的案例,这是我们之前部署的大的客户的列表。

  我的演讲结束,谢谢大家!

责任编辑:罗提
  • 上一篇文章:
  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
     相关文章
    北信源何悦:网络终端安全管理技术研讨
    宋忠良:信息安全从基础开始
    刘海峰:针对要害切实有效地选择安全产品
    E-cop 徐为群:7×24安全监控外包服务MSS区
    合勤范振华:新一代UTM
    郭红:国家电子政府外网一期工程安全方面的
    周勇林:合理规避互联网的不当使用
    杜跃进:事件处理与网络安全保障
    吕华:独创串流技术 筑就内外防线
    高华:构建安全高效的边界网络
     相关评论
    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    用户名:
    · 您将承担一切因您的行为、言论而直接或间接导致的民事或刑事法律责任
    · 留言板管理人员有权保留或删除其管辖留言中的任意内容
    · 本站提醒:不要进行人身攻击与无聊谩骂。谢谢配合。
    热门文章
    最新推荐