绪论:写作既是个人情感的抒发,也是对学术真理的探索,欢迎阅读由发表云整理的11篇数据机房解决方案范文,希望它们能为您的写作提供参考和启发。
1 前言
随着企业信息化建设的不断深入,企业内部建立了大量的应用系统。对于企业来说,数据的重要性不言而喻。然而在企业信息化建设进程中,由于缺乏对信息化建设的统一规划,当企业实施一个新的管理信息系统时,部门间缺乏沟通或出于数据保密等原因,对其所涉及的数据进行独立存放,这就导致企业内部多个信息系统之间的数据彼此独立、无法实现共享,从而形成了一个个的数据孤岛。
数据集成技术就是要实现不同操作系统平台中的异构数据源的集中存储,而SOA架构最大的特点就是与平台无关,使用SOA架构可以较好的解决企业中的数据集成难题,在SOA架构中,最重要的是服务的概念,SOA中的服务可以是Web服务和消息等其他各种形式的体现,但Web服务仍然是最常见的实现方式。
1.1 数据集成难点
数据集成主要面临如下几个难题:(1)异构的操作系统和数据库平台。需要集成的数据分布在异构的操作系统中以及异构的数据库中,而且还有可能是一些桌面数据源,如Excel或XML等;(2)分布式系统。需要集成的数据分布在网络中的不同结点,需要考虑到网络传输性能、网络安全等方面的问题;(3)统一不同的语义。不同应用系统对同一个业务领域的概念具有不同的数据定义,数据集成需要对数据进行加工处理。
1.2 SOA
SOA(Service-Oriented Architecture,中文译为面向服务架构)是从结构化编程、面向对象编程、基于组件编程逐渐发展而产生的一种构建应用程序的新方法。基于SOA的应用程序的功能实现是基于一系列称之为“服务”的基本单元之上,应用程序与这些服务之间通过事先制定好的契约和规范进行数据交互。并且这些服务是与操作系统、计算机硬件以及程序设计语言无关的,应用程序开发者只需要关注服务的具体功能是否能够满足需求即可。
2 基于SOA的异构数据集成解决方案
2.1 方案设计
假设当前需要将数据集成到中心数据库SQL Server中,而待集成的数据可能存储在异构的数据库中,如SQL Server、Oracle以及MySQL,如何在异构数据库之间进行数据集成,是本系统需要考虑的关键问题。
在解决这一问题时,本文采用了基于SOA的数据集成方案。第三方业务系统通过调用数据集成服务将存放在异构平台、异构数据源中的业务数据“推送”到中心数据库中。
如图1所示的设计方案。
如图1所示,SOA中的“服务”采用了Web服务的形式,其实现过程如下:
(1)在数据集成系统的Web服务器中部署数据集成的Web服务,对外进行;
(2)由第三方业务系统(待集成数据存放的系统)进行服务发现和订阅;
(3)第三方业务系统中将待集成的数据转换成约定好的xml数据格式规范;
(4)第三方业务系统对服务进行调用。
(5)数据集成系统接收到服务调用后,根据消息类型进行路由,找到相应的服务以及服务响应处理程序,对数据进行必要的处理后保存至SQL Server数据库中。
通过服务,屏蔽了具体的实现细节,包括底层的操作系统、数据库、编程语言以及具体实现方式;其次数据在网络间通过xml进行传输。由于xml是数据存储和传输的标准,能够较好的解决异构数据在网络中进行传输的问题。
2.2 系统主要模块
SOA架构包含服务提供者、服务注册管理中心以及服务调用者。其中服务提供者需要提供对服务的声明功能,并考虑到服务的安全性;服务注册管理中心需要提供对服务的注册、等功能;服务调用者需要通过服务注册管理中心发现服务,然后进行调用。系统主要设计以下几个模块:
(1)服务声明模块。服务声明模块主要根据系统需求声明实现各个Web服务,从而实现对各类业务数据的集成,最终保存到中心数据库中。
(2)服务管理模块。服务管理模块主要实现服务的注册、等操作,为服务调度和业务运行提供服务支撑。当服务被声明后,通过服务管理界面,将服务注册到服务平台上。经过对服务的测试验证,管理人员将可以稳定运行的服务到平台上。服务后,进入到服务目录中,供第三方业务系统进行订阅和发现。当服务组件过程或功能不满足业务要求时,可以将服务组件从服务平台注销掉。
(3)服务调度模块。服务调度模块主要根据第三方业务系统的服务请求,完成身份认证和服务解析,并根据消息类型进行消息路由,完成服务调用和处理,并返回服务调用结果。
(4)服务安全模块。服务安全模块主要提供传输通道安全和数据安全,并提供用户签入授权与身份验证,确保服务平台应用信息安全。 系统主要通过以下两种安全策略保证系统的安全:①数据传输安全策略:使用加密算法对xml元素进行加密,保证数据传输的安全性。②身份验证策略:对用户进行身份验证和服务签入授权的两级验证方式,保证服务的安全性调用。
3 总结
本文应用了一种基于SOA的数据集成解决方案,具体的服务形式采用了基于SOAP的Web服务,并设计了数据集成系统的核心模块。本解决方案能够实现对不同平台中异构数据的集成。SOA的特点使模块间的耦合程度降到了最低,同时使系统具有较强的扩展性。
参考文献
[1]Mike P. Papazoglou,Willem-Jan Heuvel.Service oriented architectures: approaches,technologies and research issues[J].The VLDB Journal,2007(3).
[2]张文江.地质灾害数据集成关键技术研究[D]. 成都理工大学,2013.
随着信息技术的发展,网络应用越加广泛,更多的企业开始使用OA系统进行办公,财务、ERP等线上系统更加普及。随着经济的发展,更多的企业选择在不同地区设立更多分部,各分部间的生产网、视频会议系统都依托于运营商的通信网络支撑,市政交通等部门的监控系统分布区域及其广泛,也更多是依赖IP网络运行。这些跨地区的资源调配就产生了大量的数据专线需求。
虽然数据专线业务并不是新型业务,但随着移动网络的发展,如何能更好的建设通信网络满足客户需求仍是值得研究的问题。
一、概述
集团客户专线是指通信运营商利用自有或租用通信资源,为集团客户提供互联网访问、语音业务、或为其机构各网点间提供点到点或点到多点的专用链路,从而实现集团客户专享的高质量网络通信及各种定制的综合业务信息化服务。
集团客户专线按业务类型分主要有语音专线、互联网专线和数据专线三类。
(一)语音专线:通过运营商的传输网络将集团客户语音交换机接入到运营商的交换网络,为用户提供固定电话及企业彩铃等各种增值语音服务。
(二)互联网专线:为集团客户提供各种速率的专用链路,链接至公用互联网骨干网络,从而为客户提供方便快捷的高速互联网访问服务。
(三)数据专线:为集团客户提供透明的数据传输通道,通道为“纯透明的”,用户自己组网,用户承载语音、数据、视频等多种业务。
二、业务需求
运营商提供的透明的传输链路,为集团客户提供从总部到各分部之间的数据传输通道。可为各金融机构提供各分支网点的生产网络,企事业单位各分支机构间的视频会议系统及办公自动化系统,公安交通等视频监控系统提供安全稳定的传输链路。集团客户由于其性质、业务、覆盖区域需要,对传输电路通常有以下要求:
(一)安全性:数据专线业务对安全性要求很高,要求运营商提供专用的内网电路供集团客户内部使用,并与互联网隔离。保证信息在边界接入过程中不被非法获取,一旦出现数据失密将导致严重后果。需要从物理层、网络层、应用层等各个层面实施数据保密性工作。
(二)可靠性:需提供电信级的业务可靠性,专线业务要求高QoS保障,依客户需求提供备用电路并在规定时间内完成故障修复。使用标准化的协议,达到互联互通。
(三)可扩展性:考虑客户后期发展及业务拓展,需预留一定量的传输资源及设备升级空间。
(四)覆盖性:大型企事业单位各地分支网点较多,运营商提供的传输链路应能覆盖到各分支网点,为其提供快速接入。
(五)需求多样化:需按客户需求,提供不同速率的带宽,并针对客户设备接口不同提供相应的接口。
三、解决方案
(一)SDH方式
从90年代起移动开始建设SDH传输网,核心层以10Gb/s和2.5Gb/s设备为主,汇聚层已2.5Gb/s设备为主,接入层以622Mb/s设备为主。SDH传输网覆盖范围广、自愈性能强,可靠性高,但现阶段集团不再新增SDH传输网的投资,现网资源比较紧张。
金融类客户一般对系统安全性可靠性要求较高,部分客户明确要求以SDH方式实现。以某银行地市分行到各支行、ATM网点的传输电路为例:在银行分行总部部署一台华为OSN3500光端机,根据客户需求配置相应板卡,用于汇聚所在分部的数据,电路链接至分行客户路由器。在每个网点部署1端华为Metro 100光端机,为客户设备提供FE接口或2M接口,新建光缆与运营商SDH接入网对接。考虑银行系统对安全性和可靠性要求较高,银行总部的SDH设备上联至运营商的汇聚机房OSN7500,并提供双路由保护。在每个网点都提供光端机下沉。拓扑图示意如下:
采用SDH方式组网,技术成熟稳定,系统安全性高,符合金融类系统对高可靠性的要求,但现网SDH接入环传输资源利用率已经很高,部分接入环时隙不足,接入该部分接入环的客户点,需提前将SDH传输网上的大颗粒数据业务迁移到PTN网络或GPON上,或提前对接入环进行拆组环,需要增加额外的投资及工期时间。
(二)PTN方式
PTN是面向分组业务和传送网络的技术,以分组交换为核心并提供多业务支持,能在保证网络质量的前提下答复提高网络带宽。但PTN传输网现阶段覆盖率还未达到100%。部分集团客户接入点不具备PTN接入条件。因SDH资源比较紧张,集团客户需求带宽较大时建议采用PTN方式实现,以某县政府视频会议系统为例,运营商为其提供该县政府到所辖10个乡镇视频会议系统所需传输电路,每条电路带宽为6M,客户设备接口为以太网接口。在该县政府新增一台三层交换机,用于汇聚数据,在每个分支机构提供1台多端口PTN光纤收发器,通过FE口上联至最近的PTN基站,通过PTN传送网连接至该县县政府,完成数据传输。PTN传输网资源丰富,可为集团客户提供高速数据传输,后期可为客户提供带宽扩容。在各接入点预留空余设备端口,可用于开通其他业务。拓扑结构示意如下:
现阶段还有少数区域PTN未完成全部覆盖,可考虑暂时使用SDH和PTN混合组网方式,待PTN开通后进行割接。
(三)GPON方式
GPON网络系统是构建于无源光分配网络上的宽带接入技术,由光线路终端OLT、无源分光器POS和光网络单元ONU组成。可以提供高带宽多业务的承载方式。近两年移动综合业务网市区和县城已基本完成覆盖,集团客户接入点位于综合业务区覆盖区域可利用综合业务网资源完成快速接入。以某单位市局至各县局间数据传输电路为例,在市局和各县局接入点新增1台符合客户设备接口需求的ONU,布放光缆至最近的综合业务网光缆交接箱,光交箱中新增1:16或1:32分光器,上联至综合业务网机房OLT设备,OLT上联至城域网汇聚交换机,由城域网汇聚交换机上联至MSG路由器,通过路由器完成数据传输。
四、方案比较和建议
Abstract: In this paper, we discuss a number of domestic and international big-data telecommunications architectures and propose our own lean big-data architecture. This new architecture combines the practical application scenarios of operators, and the universal large platform is abandoned. There are two directions in big-data development: improving business efficiency and providing data as a service (DaaS). Capturing, managing, and mining core data of a telecom operator is the basis for service implementation. Rapid deployment and application of big data is the final target. A balance also needs to be struck between in efficiency, cost and time when deploying a big-data architecture.
Key words: big data; telecommunications network; lean architecture; data as a service
中图分类号:TN915.03; TP393.03 文献标志码:A 文章编号:1009-6868 (2013) 04-0039-003
1 电信运营商建设大数据
思路及关键技术
运营商的网络和用户是运营商的核心资产,而其中流动的数据(包括用户配置基础数据、网络信令数据、网管/日志数据、用户位置数据、终端信息)是运营商的核心数据资产。对于运营商来说,最有价值的数据来自基础电信网络本身,对于基础管道数据的挖掘和分析是运营商大数据挖掘的最重要方向。抓取、管理和挖掘这些数据是运营商的当务之急[1-2]。运营商基于核心数据的大数据应用可从两个方面入手:
(1)通过大数据应用提升自身运营效率。比较典型的应用包括:信令多维分析、网络综合管理及分析、业务和运营支撑系统(BOSS)经营综合分析、精准营销等。
(2)通过数据即服务(DAAS)拓展新的服务内容,提供对外服务。包括个体及群体的位置信息以及用户行为分析等,对于第三方公司(比如零售业或者咨询公司、政府等)都是非常有价值的信息。运营商可以基于这些数据提供对外DAAS服务,拓展市场空间。
为了构建电信运营的大数据应用,从技术能力的角度可以分为数据收集与存储、信息检索汇聚、知识发现以及智慧4个层面。电信大数据技术层面如图1所示。自下而上数据挖掘深度增加,难度加大,对于系统的智能需求提升。其中关键的技术包括抽取转换装载(ETL)、并行计算框架、分布式数据库、分布式文件系统和数据挖掘、机器学习等。
面对海量的大数据,如何有效进行数据处理是需要解决的迫切问题,分布式并行处理是有效手段。传统关系型数据库多采用共享磁盘(Sharing-disk)架构,当数据量达到一定程度,将面临处理的“瓶颈”以及扩展的困难,同时成本也偏高。当前有效的做法是采用分布式文件系统/分布式数据库结合做分布并行处理。目前基于开源的Hadoop平台是业界采用较广泛的一个实现方案。Hadoop[3]的核心思想是基于Hadoop分布式文件系统(HDFS)存储文件或者基于HBase数据库(也是基于HDFS),使用分布式并行计算框架MapReduce来并行执行分发Map操作以及Reduce归约操作。在Hadoop的计算模型中,计算节点与存储节点合一。存储数据的普通PC服务器可以执行MapReduce的任务。而在Sharing-disk模型中,存储节点与计算节点是分离的,存储的数据需要传送到计算节点做计算。Hadoop计算模型适合离线批处理的场景,比如Log日志分析、文档统计分析等。它是关系型数据库管理系统(RDBMS)的有益补充。
在私有技术上实现分布式存储和并行处理,在调用接口上与Hadoop兼容,这是一个可行的技术方案。这种方案可以避免上述Hadoop的缺点,同时在性能上做更多的优化。有效的手段包括增加数据本地性(Data Locality)特性,在多次迭代的计算过程减少数据在不同节点之间的传送;使用索引和缓存加快数据的处理速度。结合存储和计算硬件进行调优也是有效的手段,可以使用数据的分层存储,将数据分布在内存、固态硬盘(SSD)、硬盘等不同介质上[4],使得与计算资源达到很好的平衡。
面对海量数据实时性的要求,比较有效的方式是采用复杂事件处理(CEP)[5]。实时流处理采用事件触发机制,对于输入的事件在内存中及时处理。同时对于多个事件能合成一个事件[6]。实时流处理需要支持规则以满足灵活的事件处理要求。实时流处理可以使用分布式内存数据库、消息总线等机制来实现快速实时响应。目前商用的CEP产品有不少,但是在功能、性能以及适用范围上有较大差异,选择成熟度高以及合适的产品是关键。
针对大数据中大量的半结构化或者非结构数据,NoSQL数据库应运而生。NoSQL数据库放弃关系模型,弱化事务,支持海量存储、高可扩展性、高可用及高并发需求。NoSQL数据库在特定应用场景下有很高的优势,是传统数据库的有效补充。按照数据模型,NoSQL主要有四大类:键-值(Key-Value)型、列存储型、文档型、图型,它们对应不同的应用场景。比如Key-Value型适合简单键-值对的高效查询,而图型适合社交关系的存储和高效查询。
针对大数据挖掘分析、搜索以及机器自适应学习等技术在企业系统中逐步应用。相关的算法种类很多,当前需求较多的是分布式挖掘和分布式搜索。
由于数据类型以及数据处理方式的改变,传统ETL已经不适用。运营商需要根据应用场景做不同的规划。目前来说,由于运营商应用系统差别较大,尚未有一种统一的处理模式。比较可行的一种方法是依据数据的功用以及特性做分层处理,比如大量的数据源首先做初筛,初筛完之后有部分数据进入数据仓库或者RDBMS或者其他应用。初筛可以使用Hadoop或者CEP或者定制的方式来完成。
针对运营商的不同应用场景,需要采用不同的技术或者技术组合。比如用户实时详单查询,数据量巨大,但是它的数据类型简单,数据以读为主,不需要复杂的Join操作,数据的分布性好。相比传统的RDBMS,使用Hadoop可以大大提升查询性能,降低处理成本。更多的应用可能需要多种技术的组合。比如信令采集及多维分析,信令数据特别是分组域(PS)信令数据量大且实时性要求高,有效解决海量数据处理与实时性要求是它的关键,需要CEP与Hadoop的组合。在当前阶段,不同的技术成熟度不一,由于业界大数据应用进展较快,我们认为当前针对不同应用的精简方案是最合适的,也就是依据应用场景,挑选最合适的组件做组合,摒弃通用化的大平台。
2 中兴通讯大数据实践
中兴通讯依托在云计算等领域的长期积累,针对大数据形成了一套完整的技术体系架构。ZTE大数据技术体系架构如图2所示。架构依据运营商的不同的应用需求,注重采用组件搭建的方式,形成端到端的精简方案。下面以两个具体的案例进行说明。
(1)用户实时位置信息服务系统
该系统实时采集蜂窝网络用户的动态位置信息,并通过规范接口提供DAAS服务。实际工程中,当期接入的用户数达两千多万,每天用户位置更新数据可达40多亿条,高峰期更新达到每秒几十万次。除了采集的位置,还可以结合其他数据源比如用户年龄等属性做分析,以应用编程接口(API)开放给上层应用。此外该系统需要有良好的可扩展性,后续可以接入其他区域的数据源。另外这套系统需要有良好的性价比,成本可控,时间可控。依据这些需求,我们在成熟的组件K-V NoSQL 数据库的基础上搭建了系统。用户实时位置信息服务系统如图3所示。
用户实时位置信息服务系统是一个典型的精简方案,它基于分布式Key-Value NoSQL数据库的分布式缓存(DCache),组装了对位置流事件实时处理的系统。DCache既是消息总线,也是内存数据库,能很好地满足实时性的要求。同时DCache基于x86刀片服务器,采用分布式架构,系统的扩展性很好,成本较低。该系统性能优越,稳定可靠,取得良好的效果。
(2)信令监测多维分析系统
随着运营商数据业务快速增长,运营商对于网络质量提升、网络运营效率有着更大的压力。通过采集网络Gn接口、Mc接口信令并加以处理分析,可以获得网络运行的完整视图,基于信令的相关专题分析,比如网络质量分析、流量效率分析、多网协同分析、客户投诉及服务分析等对于运营商网络运营有极大的价值。
信令监测多维分析的难点在于信令流量大且数据量大,比如某运营商省公司Gn接口峰值流量可以达到4 Gb/s,每天信令数据可达1 TB。需要采集信令并做多种分析以服务于不同的部门。
信令监测多维分析系统采用分层的架构,便于数据共享及和应用的扩展。信令监测多维分析系统如图4所示。使用实时流处理满足实时性高的数据分析要求,对于会话或事务详单(XDR)初步处理完的数据采用传统RDBMS存储供后续分析查询使用。对于数据量庞大的XDR采用Hadoop HBase存储并查询,原始信令采用分布式文件系统存放在本地。
在这个方案中,数据根据它的使用特性采用不同的方式存储和处理,突破RDBMS处理“瓶颈”和扩展性的“瓶颈”,达到了很好的效果。在测试中,4节点PC服务器可以全部承担某运营商省公司PS域XDR的存储,入库性能可达50 Mb/s,针对上百亿条记录查询,可以在10 s内返回。取得了很好的实践效果。
3 结束语
电信运营商面临大数据发展的机遇,都在积极推动大数据的试点和商用。在当前大数据技术快速发展的形势下,根据需求和应用场景搭建精简方案,可以帮助运营商在当前激烈竞争环境中快速获得竞争优势,在效率、成本和时间上取得最佳平衡。
参考文献
[1] Cisco Systems. Cisco visual networking index global mobile data traffic forecast update, 2011 - 2016 [EB/OL]. [2013-03-25]. http://.
[2] MANYIKA J, CHUI M, BROWN B, et al. Big data: The next frontier for innovation, competition, and productivity [R]. McKinsey Global Institute, 2011.
[3] WHITE T. Hadoop权威指南 [M]. 2版. 周敏奇, 王晓玲, 金澈清, 译. 北京:清华大学出版社, 2011.
[4] SNIA. 2012 SNIA Sprint Tutorials-NextGen Infrastructure for Big Data [EB/OL]. [2013-02-15]. http://
[5] NEUMEYER L, ROBBINS B, NAIR A, et al. S4: Distributed stream computing platform [C]//Proceedings of the IEEE International Conference on Data Mining Workshops (ICDMW’10), Dec 14-17,2010, Sydney, Australia .Los Alamitos, CA, USA: IEEE Computer Society, 2010:170-177.
[6] SHARON G, ETZION O. Event-processing network model and implementation [J]. IBM Systems Journal, 2008,47(2):321-334.
Distributed Small and Medium-sized Enterprise Remote Data Secure Transmission Solutions
Zhang Ding-xiang
(Guizhou Commercial College GuizhouGuizhou 550004)
【 Abstract 】 According to the demand characteristics of business of the distributed small and medium-sized enterprises(SMEs), I have researched and analyzed several common scheme about remote data transmission safety, and combined with the practical application of cases, to set in one body with variety of security technology and social free resources,Proposed a cheap solution based on the VPN. Let more similar enterprise can build up and use up, For SMEs to solve the problem of the remote data security exchange and sharing of safety.
【 Keywords 】 distributed?small and medium-sized enterprises; remote data; security transmission
0 引言
将那些在地理分布上较为分散,但在管理上却需要敏捷集中、信息交流十分频繁的中小型企业称之为集散式中小型企业。而这些集散式中小型企业将越来越需要利用公众互联网平台开展自己的业务,与异地分支机构、移动办公人员和商业伙伴频繁地交换秘密信息,以降低公司的管理成本,提高公司的管理效率和应付日益复杂的环境需求及情况变化。同时也受到来自公众互联网的各种安全威胁,如系统攻击、数据窃取、数据泄露等,这些企业数据的传输和共享受到了网络安全威胁和资金投入的限制,如果不能有效地解决这些问题,将会严重阻碍我国集散式中小型企业的正常发展。
1 解决方案
无论采取何种方式解决集散式中小型企业远程数据的安全传输问题,都要以确保数据信息的机密性、完整性、可用性、可控性、抗抵赖性等安全属性为构建目标。
1.1 构建专用线路方案
在该方案中,整个线路仅为企业专用,安全性和数据传输速度都很好,就是建设成本和维护成本很高,一般情况下中小型企业是无法承受这个高额费用的。
1.2 基于防火墙的解决方案
人们通常的做法是购置路由器、防火墙、入侵检测系统等硬件设备,对它们进行简单堆砌,造成财务负担重,安全效果不明显的局面。防火墙主要解决网络安全隔离技术,却无法解决抗抵赖性、数据压缩传输、数据加密传输和密钥管理等问题。
1.3 硬件VPN方案
利用公众互联网链路架设企业私有的虚拟专用网(即VPN),VPN融合了隧道传输、加密解密、密钥管理、身份认证、访问控制等多方面的先进技术。建立VPN实质上是扩展企业内部网络,为企业分支机构、商业伙伴、移动办公人员等建立可信的网络安全连接,实现数据安全传输和内部资源安全共享。
VPN相对于专线方式而言,在价格上有着绝对的优势;相对于普通PSTN拨号连接,VPN在安全性、保密性上更胜一筹。人们通常采用硬件VPN解决方案,因为效果好、性能稳定,但建设成本和维护成本较高,中小型企业难以接受。
1.省略)、88IP()等。
采用以上方案,解决了无固定公网IP地址主机的访问问题,得到了免费的公网IP地址和域名。
(3) 集成型VPN网关软件的选用
软件VPN除具有硬件VPN同样的功能外,还具有价格低、寿命长、灵活性和扩展性强的优点;缺点是安装配置复杂、性能一般,可采用较强性能的计算机作为软件VPN的运行支撑环境,解决软件VPN的性能问题。这里,将基于VPN并集成防火墙、入侵检测、计算机病毒防治、网络拨号服务等重要功能于一体的VPN软件称为集成型VPN网关软件。
虽然集成型VPN网关软件在市场上不少,但适用的质量好的并不多见。笔者推荐使用Injoy Firewall集成型VPN网关软件,该软件在我国也有少量用户,并得到了中国公安部的安全认证许可。
Injoy Firewall集成型VPN网关软件可较好地解决数据安全传输和内网资源安全共享问题。Injoy Firewall内置了网络拨号(PpoE、PSTN)、VPN、防火墙、IDS、DHCP Server、远程配置管理等功能模块,且支持IPSec和NAT-T协议,支持多种高强度加密(DES、3DES、AES、AES-192/256)、多种认证(共享密钥、扩展认证、RSA数字签名)、数据压缩传输,提供隧道模式和传输模式两种工作方式。
(4) 运行环境
运行环境不能要求高,能运行于普通PC机和Windows(Linux)操作系统即可。
通过以上综合分析,得出了一个6+解决方案(PC机+Windows(Linux)+ADSL拨号+DDNS+二级域名+集成型VPN网关软件)。6+是一个经济、适用、易用、安全的远程数据传输方案,为集散型中小型企业构建远程数据安全传输平台是切实可行的。
2 应用案例
上述的综合解决方案已在贵州省几家集散式中小型企业和政府基层管理部门得到了较好的应用。现以某医院为例来说明该方案构建方法。
某医院为实现其异地分支机构(分院、社区医院、诊所)与中心医院的业务系统互联,数据统一集中存储、处理和管理,做到病人的刷卡和结算同步,构建了如图1所示的远程数据安全传输平台。在图1的网络拓扑结构图中,实线为物理连接线路,虚线为逻辑上的VPN隧道。在中心医院及其分支机构(A和B)的网络接入处都安装集成型网关(PC机+Windows 2000+ADSL拨号+DDNS花生壳客户端软件+二级域名+Injoy Firewall),集成型网关负责内网与ADSL Modem的连接,ADSL Modem的另一端与公众网络连接。其中,中心医院和分支机构B的集成型网关还额外配置了普通电话Modem,它们通过PSTN公众电话网进行电话拨号连接,作为ADSL的备用线路。中心医院和各分支机构都无固定的公网IP地址,通过ADSL拨号上网获得动态的免费公网IP地址。借助DDNS花生壳客户端软件和Injoy Firewall提供的NAT-T技术,使得各分支机构内网的任一台计算机均可安全地访问中心医院网络中的业务服务器或其它计算机。
该远程数据安全传输平台从2004年建成使用至今,仍然在稳定、安全、可靠地运行,实现了预期的业务需求和低成本的建设目标。
3 应用效果及展望
多家单位多年运用结果表明,采用本文提出的“6+”解决方案构建的信息交互平台运行效果良好,原有投资也得到了保护。这就为集散式中小型企业和政府基层管理部门找到了一个安全、够用、好用、价廉的远程数据安全传输解决方案。
但是,“6+”解决方案不适合传输大流量的视频数据,还有待于进一步的研究。
参考文献
[1] 曾庆凯.信息安全体系结构[M].北京:电子工业出版社,2010.
[2] 戴彬.基于IPSec的VPN技术穿越NAT的研究与设计[D].重庆:西南大学,2006.
一、系统设计及解决方案实现的背景
纵观券商IT发展现状,首先企业级业务应用越来越多,分工也越来越细,而企业级的业务应用需求和要求都越来越高,单个业务产品满足不了企业级应用需求,以下是目前券商主要面临的企业级应用需求:
1.面向上级监管部门的数据报送
2.企业级合规管理和风险控制要求越来越高
3.实时动态业务风险监控
4.企业决策支持平台
5.客户营销管理
二、数据中心目标定位
概括而言,数据中心一方面是现有营业部柜台交易系统、总部清算系统、稽核系统等业务系统的数据采集者和管理者,同时也是营销管理、稽核监控、风险管理、数据挖掘和多维分析系统的数据提供者。
(一)产品定位。企业数据标准中心,据交换中心,据服务中心。
(二)功能定位。致力于企业业务数据的管理方法和管理工具研发,包括业务数据组织架构规划、数据规范管理、数据质量管理、数据管理以及数据的复用性管理等方面的系统性工程。
(三)存贮设计定位
既要考虑高并发高效率的OLTP服务处理,也要考虑大数据量访问的OLAP统计分析要求, 基于未来5年到10年的数据存贮容量测算,以此来考虑系统的主机、存储架构设计以及数据处理技术应用等技术研究工作的方向。
三、系统设计原则
数据中心项目技术解决方案的设计原则体现在以下六个方面,使得有限的资源以较有效的协作方式共同发挥效用:
(一)可扩展性
数据模型:设计模型时,尽可能满足未来可能要上线的业务系统数据模型,同时还需制定一套合理的模型设计规范。
数据分发平台:在设计时应考虑,随着分发数据规模的扩大和分发节点的增多,对分发处理和传输处理的性能要求会越来越高。
(二)高性能
分发平台:需考虑大数据量条件下的文件传输效率,主要体现在特殊日期及特殊情况下的全量文件传输。数据库设计:同时要考虑分析类型的大批量数据或频繁访问需求,还要满足实时监控类的高并发访问要求。。
(三)可管理性
数据质量管理:报告的可读性,标准的可维护性,问题处理流程的可操作性。数据分发平台:需要充分考虑数据分发任务易于配置,传输结果易于监控。
(四)高可用性
数据模型的可用性:能屏蔽源系统结构的变化对数据中心系统带来影响。局部数据模型的扩展不会对其它数据模型产生大的影响。系统备份:生产系统出现异常时,备份恢复机制及时恢复处理。
(五)安全性。一是防止数据中心系统的数据资源被恶意修改和盗取;二是防止数据在传输过程中被截留和篡改。
(六)可重用性。可重用性是指尽可能避免数据中心项目的重复投入,应尽可能考虑包括物理设备、系统软件、框架组件、规范方法以及业务应用等多个层面上的复用。
四、数据库存贮方案设计
1.1 数据各逻辑层级划分。为保证数据中心能提供多层次、多粒度、多特征的数据服务,并保证ETL过程的清晰、可控、完整、准确,数据中心根据数据性质、处理阶段以及数据质量的不同分为原始层、标准层、模型层、数据集市层4个数据层,具体如下:
1.2 数据库系统的硬件架构设计。根据系统分析得出的各项数据,即可得到相应的硬件配置要求。
1.2.1 存储设备容量评估。本节提出的“存储容量规划”将支持过去5年以上的历史数据和未来10年的新增业务数据的存储空间要求。
1.2.1.1 基础数据规模评估。根据调查,某券商2002年以来(至2012年)的历史数据规模可按1.5T计算。
我们以此次配置的存储“满足未来3-4年(从2012年算起)的业务正常运行”、“将考虑未来10年的业务运行的扩展能力”这两个条件来评估,得出的基础数据规模为:
A2015=1.5T+(7G×25%×236)×(1.05+1.1025+1.1576)
约=2.9T
A2022=1.5T+(7G×25%×236)×(1.05+1.1025...+1.05^10)
约=6.8T
注:公式中的25%是增量数据因子。每次进行清洗时,通过一定的方法,将部分非增量数据丢弃(这75%的数据,我们通过比对法发现其与历史数据或存量数据有重复取值,将其载入后暂存待查或去除)的结果。
1.2.1.2 逻辑数据存储规模评估。上节评估出的“基础数据规模(后称A)”,将是本系统进行逻辑数据存储规模(后称B)的依据。原始层数据的规模B1:按最后年度的1倍采集数据量计算。ODS层数据的规模B2:考虑到原始数据被处理后的部分业务数据的重新组织和重定义,且会生成一定的聚集数据,应给予适当的冗余,此处的冗余因子设定为1.2。
EDW层数据的规模B3:考虑ODS数据将经过较大规模的重新组织和聚集处理(初步设计按10大主题进行分析)进入此层,需要考虑较大的冗余度,按业务特点初步设定此处的冗余因子设定为1.2×1.3=1.56。
1.3 备份环境设计。根据证监会的相关要求,系统需要建设本地“备份和应用测试机”环境。但如果我们只是刻板的将“生产环境”克隆一下,将极不经济。我们需要按照应用特点、数据处理要求,来定制备机架构。本地“备份和应用测试机”需兼顾“数据备份和本地容灾”双重职能。
1.4 数据备份需求评估。数据中心的稻荼匦虢立可靠有效的备份机制,避免由于数据丢失。初步规划:将数据中心管理的数据分成3类并分别制定备份策略。这3类数据可以使用用户隔离、表空间隔离相结合的方式,增强备份调度的可操作性。静态数据、配置信息表(/领域表):可以每日备份,并可覆盖性备份,保留最近3日或者5日的备份即可。
中图分类号:F407.6电 文献标识码:A 文章编号:
1引言
当受电器因机械故障、因瞬间电流变化或超铭牌使用设备等的原因使电源、变压器等承受接近或超过其正常的负载时,称为重载、过载。电气设备发生重载、过载故障(不包括短路事故)是允许有一定持续时间的,若超过这个时间,将因热效应等导致绝缘受损,设备损耗增加等情况,进而引发短路,烧损设备,或产生其他严重后果。因此怎么用去分析重载过载情况,从而解决电气设备的重过载问题成为现时供电所的必须解决的问题之一。
2电气设备重过载的类型
(1)变压器的重过载。指的是配电变压器在使用中,因正常周期使用,设备故障或用户设备启动等情况下,引起配电变压器超过其铭牌80%或超过100%使用的情况。
(2)中低压线路网的重过载。电流通过导线会发热,导线在不超过65C时,能够通过而不使导线过热的电流量,称导线的安全载流量,接近安全载流量的80%或超过100%时,称配电线路的重载、过载。
(3)其他设备的重过载。如盘柜、电容器等。
以上几项主要的配电网设备都根据配电变压器的容量而进行配置,因而在配电变压器不重载运行的情况下,其配套设备也不在重过载运行,因此我们在这里着重分析重过载配变的运行数据及解决方案。
3配电变压器的重过载
3.1 变压器的过载及耐受过载电流的时间
(1)据有关文献介绍,按GB1094标准生产的油浸式变压器,其允许的过载负荷倍数及持续时间如表1所示。
表1 油浸式变压器允许过负荷倍数及持续时间
(2)油浸式自然循环冷却变压器允许的过负荷运行及持续时间。当过负荷与额定负荷之比为1-3时,允许的过负荷时间分别是24 h(环境温度为0℃)、lOh(环境温度为10~C)、5 h(环境温度为20~C)、3 h(环境温度为30~C)和1 h30min(环境温度40~C)
(3)不明标准(其他)的变压器允许过载倍数及持续时间如表2所示。
表2 不明标准(其他)变压器允许过载倍数及持续时间
(4)各类干式变压器的允许过载倍数及持续时间与油浸式变压器差不多。由以上可知,当变压器事故负荷与其额定负荷之比为1-3时,其允许过负荷的时间为2 h,油浸式自然循环冷却,在环境温度为30~40℃时(我国平均最高气温),也是在1-3倍,持续2 h左右,即在允许过负荷的时间内,保护电器可以不动作。
4配电变压器的重过载运行的危害
4.1长期重过载的影响和危害
(1) 绕组、线夹、引线、绝缘及油的温度将会升高,且有可能达到不可接受的程度,如配电设备火灾;
(2) 配电变压器绝缘将会受到损害,增加内部故障的风险,减少设备的使用寿命;
(3) 套管、分接开关、电缆终端接线装置和电流互感器等也将受到较高的热应力,从而使其结构和使用安全裕度受到影响。
(4) 使得配套设备如电力电缆、中低压导线等也进入重过载运行。从而增加配网网的运行风险。
4.2 短期过负荷的影响和危害
短期增加负载将会使运行条件中的故障风险增加。短期过负载会使导体热点温度上升,可能使绝缘强度呈暂时性的降低。但是,接受这种短时过载条件可能比失去供电更好些。这类过负载预计是很少发生的,然而,一旦出现时,应在短时间内迅速降低负载或切除变压器,以免发生故障。这种负载允许时间小于整个变压器的热时间常数,并且它也与过负载前的运行温度有关。一般来说,它小于半小时。
5配电变压器的重过载分析及解决方案
5.1 数据分析来源
(1)计量自动化系统的负载曲线。
(2)现场实测的各路支线负载情况。根据计量自动化系统规定相应的时段进行测量。
5.2 预防性的分析解决方案
在配网运行中,采取配电变压器的负荷预测对设备的负载情况进行预防性监控,根据预测的结果进行分析处理。在这里采用的是配电变压器与气温的负荷特性进行预测,得出的结果再根据现场实测的数据进行对0.4KV线路的负荷情况进行预测。司前所某台区的分析见表3:
表3 2010年新建旧乡府台区各项负荷数值如下
因气温与负荷的数学模型较为复杂,此分析采取分段方法,粗略计算单位温度下的负荷升降变化。以下先分析各项负荷与气温的曲线关系,见图1图2图3。
图1负荷最大值与平均气温的温升曲线
负荷最大值的明显变化集中在27-29C区间范围变化,其他温度变化较为平稳,由此看出在29C以上温度对该台区影响更为严重。
月平均负荷平均值与平均气温的曲线:
图2月平均负荷平均值与平均气温的曲线
(一)曲线与最大负荷类似。
每月日最大平均负荷与平均温度曲线:
图3每月日最大平均负荷与平均温度曲线
由以上图表可以看出,该台区在27C-29C间的温升降差速度最为明显,计算分析后得出下表4:
表427C-29C间的温升降差速度的计算
按照2011年气温上升预测(气象局预测数据),上升0.7-0.9C,取值0.9C,计算得2011年最高有功负荷为378W,最高负荷达78%,出现在7月中下旬(极端温度时间区域)。
(二)各路支线负荷情况预测。
(1)台区用户成分构成
新建旧乡府用电比例如下:
住宅及商业用电占用电的4%,普通工业占96%,见图4。同样温升对占普通工业为主的台区有类似影响,负荷增加原因为对设备降温投入及生活用电的降温需求。
图4住宅及商业和普通工业的用电占比
(2)出线负荷比例
以本月的随机日负荷曲线为依据见图5,进行参考点取点:
图5月随机日负荷曲线图
以上看出去11时、15时测量各路支线的高峰电流作采取相似时间段进行实测。当日数据采集表见表5.
表5 日数据采集表
根据用电及实测得出甲乙出线负荷比例见表6。
表6 甲乙出线负荷比例
(3)计算预测2011年线路低压线路主线负载情况
负荷按照预测78%的平均出现比例,计算出每路支线2011年出现的负荷见表7。因实地测量的时间差,可能造成最后预计的电压有所差别,但差别影响较少。
表72011年甲乙出线负荷的计算结果
出线名称 实地测量(或从系统中导出)的电压、负荷数据 预测2011年最大负荷时的数据 结论
该回低压线路首端电流I(A) 该回低压线路首端电流Im(A) 支线主线型号 额定电流
从以上的几项预防性分析数据中,根据数据情况结合现场,可以制定更换配变、更换导线等相关措施应付未来的设备重过载情况。
5.3 现时存在的重过载情况分析及处理
5.3.1 现存变压器重过载的几个类型
(1)小工业私增容;
(2)大型机械的启动电流;
(3)居民用电的增加。
5.3.2 解决方案
(1)针对小工业私增容情况,我所采取的方法如下:安装限流装置。首先,营销线从电量数据中分析出每月电量增加比率异常的工业二级用户,对其进行用电检查。如发现出现私增容情况,则要求安装限流装置。如加装限流装置都不能降低配电变压器的负载,则采取综合台区错峰用电的办法,按时段进行用电。我所计划下半年对此类型较多的台区进行安装限流装置。
(2)针对大型机械的启动电流方案。启动电流是指电气设备(感性负载)在刚启动时的冲击电流,是电机或感性负载通电的瞬间到运行平稳的短暂的时间内的电流的变化量,这个电流一般是额定电流的4-7倍,国家规定,为了线路的运行安全及其它电气设备的正常运行,大功率的发动机必须加装启动设备,以降低启动电流。冲击电流是指输入电压按规定时间间隔接通或断开时,输入电流达到稳定状态前所通过的最大瞬间电流。常见的交流电机的启动方法有直接启动,串电阻启动,自藕变压器启动,星三角减压启动及变频器启动的方法来减小对电网的影响。供电所根据实际情况,通知用户进行就地的整改。
(3)针对居民用电增加无法满足用电需求的,建议采取新增电源点进行解决。
6建议
(1)投入更多资金进行增加电源点,减少配变重过载情况。
(2)多利用信息化系统进行数据的掌握通知,如利用计量自动化系统进行负荷的实时报警通知相关人员等手段,可以对配网的其他设备进行更多的运行情况掌握。
(3)加强重过载设备的巡视。
7结束语
解决配变的重过载情况,可以解决配套的盘柜、开关、导线等的负载情况,但以上的分析解决方案,只针对整套设备的配置方案,在实际中,还要通过设备的巡视,对每个单独的设备进行掌握。以上分析根据“一点数据,多点延伸”的原则进行,如有特殊情况应单独进行分析。
参考文献:
此次解决非在编专业技术骨干人员的人事编制关系,必须同时符合以下四项条件:
1、第一学历为全日制普通医药院校本科及以上学历,或者医药院校专科毕业,并已取得中级及以上卫生技术职称资格者,且在我市卫生医疗事业单位工作两年及以上(年月31日以前)。
2、医疗单位工作需要,考核合格。
3、遵纪守法,具有良好的职业道德,无不良记录。
4、身体健康。
二、办理程序
(一)单位申报
市卫生局所属的事业单位对符合上述条件的人员,进行登记审查,向市卫生局呈报“关于解决非在编专业技术骨干人事编制关系的请示”。呈报请示前,各呈报单位对符合条件的人员进行考核,并提出是否解决人事编制关系的意见。
1、各单位成立考核工作专班,由院长任组长,分管人事、纪检领导为副组长,具体从事人事工作的同志为成员。对符合条件的人员进行考核。考核的内容包括德、能、勤、绩、廉等,考核要通过座谈、民主测评等方式进行。
2、各单位召开班子会,听取考核组的意见,研究进编意见。
3、对院班子研究符合条件的人员进行公示。
4、各单位对符合条件的人员写出考核材料。
(二)市卫生局初审
市卫生局对各单位的请示和呈报材料进行初审。
1、各单位呈报时提交如下材料:
①解决人事编制的请示(一份);
②符合条件人员名册(一式三份);
③人员身份证、毕业证、资格证原件及复印件一式二份;
④工作时间证明材料(合同原件及相关证明材料);
⑤个人考核材料一式三份;
⑥单位开会记录原件及复印件一份。
2、卫生局党组进行初审,并提出意见。
(三)市卫生局初审后,会同市人事局、市委编办共同审核。
(四)市委编办、市人事局、市卫生局将审核情况进行综合,报市编委、市委有关领导批准。
中图分类号:TP309.3 文献标识码:A 文章编号:1007-9599 (2013) 02-0000-02
1 问题的产生和解决方案
1.1 问题的发现
在进行学校和科室的资料整理的工作中,发现日常的事务性资料的管理中存在很多的冗余数据。例如某位老师在入校时提交了一份详细的个人资料,可能在后期工作中又有可能需要他的个人信息,因此又让他提供一份详细的个人资料,而这两份个人资料之间有很多相同的文件(如电子照片、个人的工作经历等)。这些重复存储的冗余数据不仅给资料的管理带来了一系列的问题,还造成了存储空间的极大浪费,日积月累这些数据会成海量增加。假设每人有10M的冗余数据,学校有师生2000人,全市有146所中职院校,那么就有2920G的冗余数据,全省有559所中职院校,那么就有11180G的冗余数据。因此对资料管理系统中重复数据进行有效删除已迫在眉睫。
1.2 问题的解决方案
对于处理冗余数据和海量存储,最流行的企业级解决方案是采用重复删除技术。
数据的重复删除技术是通过去除冗余数据来减小数据存储系统的容量,从而降低数据存储系统的成本。重复数据删除系统的原理是将大数据分割成许多小的数据块,然后将它们和系统中现有的数据进行比较[1]。要存储的数据在数据存储系统中已经存在,则不复制该数据,这些数据在数据存储系统中没有记录,则把数据插入数据存储系统,并记录新插入数据的索引。
“重复数据删除”是指特定的数据简化方法,该方法基于这样一种原理构建而成:为特定数据集中长度可变的冗余数据块(数据段)替换引用指针[2]。重复数据删除的目的是增大磁盘阵列中可存储的信息量,并增加可通过网络传输的有效数据量[3]。基于长度可变的数据段进行重复数据删除,则提供比单实例存储技术更大的粒度,因而能够识别并且无需存储所有相同文件的重复实例[4]。
我们可以通过设计一个基于重复删除技术的资料管理系统来解决数据冗余的问题,所有的老资料必须由资料管理系统来管理,所有的新资料必须通过资料管理系统来录入。首先对资料管理系统中所有的资料内容进行分块,然后建立布隆过滤器,并通过哈希函数将所有的分块映射到索引数组中,然后通过对录入的资料进行哈希散列得到在索引数组中的位置,如果该资料在分块索引数组中存在,则认为是重复数据,对其进行删除。
2 方案的详细设计
2.1 布隆过滤器原理
布隆过滤器(Bloom Filter)是一个很长的二进制向量和一系列随机映射函数。布隆过滤器是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。布隆过滤器的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,可能会把不属于这个集合的元素误认为属于这个集合。
哈希函数的个数k不是越大越好,k 为 ln2 * (m / n) ,才能使得f最小,k个哈希函数越相互独立效果越好。
当集合S={x1, x2,…,xn}的所有元素都被k个哈希函数映射到m位的位数组中时,这个位数组中某一位还是0的概率是:
p=(1- 1m )kn e-kn/m
(1-p)k就表示k次散列都刚好选中1的区域,即失败率:
f=(1-e-kn/m)k=(1-p)k
2.2 布隆过滤器算法设计
首先将现有的资料内容分块建立布隆过滤器,并通过哈希函数映射到索引数组中。进行资料录入时通过第一级布隆过滤器来判断,要录入的内容在索引数组中是否存在,不存在则直接保存到资料管理系统中,若存在则再通过第二级布隆过滤器来判断,不存在则直接保存到资料管理系统中,若存在则再通过第三级布隆过滤器来判断,不存在则直接保存到资料管理系统中,若存在则说明录入的数据属于重复数据,将其删除。
2.3 资料管理系统设计
系统的总体结构设计中对程序的结构进行了分层处理,把用户层和底层的算法剥离开来,结构更加清晰,功能更加明确,同时也可以降低模块间的耦合性,提高功能模块间的独立性,易于重用,易于扩展。本程序中界面和算法是分开的,可以把算法当做独立的模块直接重用到其他的系统中,界面也可以方便扩展其他的功能,而不影响现有的功能。
整个系统结构分为二层:用户层和服务层。
1)服务层
服务层即底层算法层,由CBloomFilter类、CDigitBloomFilter类和CStringBloomFilter类构成,主要用来生成和管理布隆过滤器且封装了哈希算法的核心模块。CDigitBloomFilter类和CStringBloomFilter类都是CBloomFilter 类的派生类,其中CStringBloomFilter封装了字符串布隆过滤器的哈希算法和哈希散列的位数组以及检查元素是否在位数组中和插入位数组的操作,CDigitBloomFilter封装了数字布隆过滤器的的哈希算法和哈希散列的位数组以及检查元素是否在位数组中和插入位数组的操作。
2)用户层
用户层即用户界面为整个结构的最上层,主要负责用户的输入输出等操作和其他的一些内部逻辑操作,如文件的拷贝,文件目录的查找、文件的删除等。
3 总结与展望
本文的重点是研究布隆过滤器在资料管理系统中重复删除的应用,给出一个资料管理的解决方案,布隆过滤器可以通过低于1%的错误率换取存储空间的节省和读写效率的提高,适用于能容忍低错误率的应用场合。重复数据删除技术本身就是一项新兴的技术。因此,在重复数据删除领域,还有很多方面需要进一步完善和深入研究。
参考文献:
[1]A. Clements, I. Ahmad,M. Vilayannur, and J. Li. Decentralized deduplication in SAN cluster file systems. In Proc. USENIX ATC,2009.
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)29-0007-03
大数据作为一种新兴的数据处理技术,最早可追溯到20世纪80年代的美国。如今,商业银行在信息化的迅速发展中,产生了大量的业务数据、中间数据和非结构化数据等。大数据需要做的就是从这些海量数据中提取出有价值的信息,为商业银行的各类决策提供参考和服务。汇丰、花旗和瑞士银行是数据挖掘技术应用的先行者。在国内的商业银行中,大数据的思想和技术也已逐步开始在业务中获得实践和尝试。
基于大数据的精准营销方案是利用大数据平台的模型分析结果,挖掘潜出在客户,实现可持续的营销计划。
1 应用基础
1)物理基础。利用Hadoop平台作为大数据架构的物理基础,首先需要对商业银行整体的数据量作出评估,计算出需要设置的节点个数。在此基础上确定Hadoop中的每一块组件是否适合并能满足目前及未来的业务处理需求。Hadoop的物理架构如图1所示。
2)数据基础。商业银行需要在对内外部数据梳理、清洗、整合和建立映射的基础上,将各类不同数据关联成为一个有机整体,并构建统一的数据划分维度体系,以此作为大数据平台的数据基础。
数据基础基础主要由四大部分组成:数据采集模块、数据冗余模块、维度定义模块、并行分析模块,如图2所示。
2 应用需求分析
为获得更好的精准营销效果,并实现全流程的精准营销解决方案。整体的应用目标是希望依托大数据平台的分析结果在线获取客户的各类信息,再通过模型分析、客户个性化需求、不同产品的特点等,在客户与产品之间建立精准的对应关系。在业务操作上,还应当能帮助客户经理对客户做出准入判断、提供营销方案、实现限额管理、定价指导等智能决策信息。这些应用目标可以拆分成如下应用需求:
1)客户挖掘功能。精准营销的首要目的就是寻找目标客户,只有寻找到精准的营销对象才可能实现最终的精准营销结果。客户挖掘功能应当从不同角度、不同渠道进行挖掘,最大程度发掘潜在客户群。
2)智能决策引擎。在获得客户挖掘结果后,精准营销应用的下一步功能应当是针对具体客户,提供一整套智能决策方案,包括客户准入判断、产品推荐、定价指导等。对于集团客户、上下游客户或关联方客户等,还应当能够提出整体的营销计划。
3)业务统一工作平台。精准营销系统除了可以提供精准营销的方案、计划等决策结果,还应配备完整的业务操作平成业务实现。业务统一工作平台可以实现整个精准营销从客户挖掘直至业务完成的各工作环节,最大化程度缩短业务操作流程、减少贷前调查复杂程度,实现精准营销的“一站式”操作。
4)全生命周期的营销计划。精准营销的应用不应只以单次营销为目标,而是应当从纵向和横向两个方向提供持久的精准营销计划。纵向的可持续是指跟随客户的成长过程,在客户不同时期提供适时提供客户需要的产品和服务;横向的可持续是指通过集团客户、上下游客户和其他关联方客户不断挖掘目标客户,扩大精准营销范围。
3 系统功能详述
下面针对应用需求分析,从系统实现上把应用需求分解到系统功能点上进行详细描述。
1)客户类型初分。对于不同类型的目标客户,精准营销模型应当给出具有针对性的营销方案。因此需要对大数据平台里的所有客户进行类型的区分。建立合理的客户类型初分体系是精准营销的基础。客户类型初分可以按照图3给出的体系进行划分。
值得指出的是,在精准营销应用中,对公客户和零售客户并非完彼此独立。完备的精准营销应用应当具备从对公客户中挖掘零售客户或从零售客户中挖掘对公客户的功能。
2)准入客户筛选。客户准入筛选是对客户质量进行把关的工具,良好的客户准入筛选标准是确保客户质量、引导客户结构的保障。实践中考虑根据大数据平台的黑白灰名单对客户的准入进行判定:原则上白名单客户属于精准营销判定的推荐客户;黑名单客户则是禁止准入的客户;灰名单客户可设为风险提示类客户。
3)客户信息整合及验证。利用大数据平台打通内外部数据、不同业务数据、不同结构数据之间的壁垒,形成以客户为中心的“一户一条”数据记录。
为确保精准营销结果的准确性,还应建立严密的客户信息验证机制。客户信息校验包含两方面:一是错误信息的验证,如同一企业在不同系统中的行业分类存在差异,大数据平台将设置校验规则判定哪一来源数据正确,并自动用正确数据覆盖错误数据;二是数据时效的验证,如大数据平台有多个来源提供某个企业的营业执照有效期,系统将自动获取最新的日期作为改企业的营业执照有效期。
4)客户及场景标签设定。根据精准营销的不同角度设定不同类别的标签,标签应当具有灵活性,可以随着业务发展和精准营销场景的变换随时增减或改变。标签的设定主要包含以下几类:
客户标签: 主要区分客户的属性特征,如职业信息可设定诸如企业高管、普通白领、职场新人、全职妈妈、小企业主等。
0引言
快速信息化已经是我国经济社会发展的一个显著特征。许多的企事业单位,尤其是物流企业和电子商务企业已经把数据平台作为了自己的核心竞争力之一。但是基于信息技术和网络技术的数据平台正在面临着来自安全性方面的诸多挑战。
本文提出了一种通用的基于两种加密技术的加密系统,为解决数字平台所面临的安全性难题提供了可能。该系统融合了对称加密技术、非对称加密技术、验证技术,较好的实现了了数据交流者的身份认证、数据传输过程中的保密、数据发送接收的不可否认、数据传输结果的完整。本系统尤其适用于对保密度有较高需求的数据平台。
本文重点针对4个方面进行讨论:(1)数据平台安全性问题;(2) 对称加密体制与非对称加密体制; (3) 一种更加安全的加密与验证系统; (4) 总结.
1数据平台安全性问题
在数字时代,数据平台的构建已经是企业的必需。论文参考网。企业的关键业务数据作为企业的宝贵资源和生存发展的命脉,其安全性是不言而喻的。论文参考网。但是,现实是,这些数据却没有得到很好的保护。据赛门铁克公司2010年1月对27个国家的2100家企业进行的调查显示,被调查的所有企业(100%)在2009年都曾出现过数据丢失问题,其中有75%的企业曾遭受过网络攻击。
数据平台的建设要注意以下问题:
(1)严格终端管理【1】。
终端采用硬件数字证书进行认证,并要求终端用户定期修改PIN码,以确保终端和数据来源的真实性。
(2)采取访问控制技术,允许合法用户访问规定权限内的应用。
(3)保证通信链路安全,建立端到端传输的安全机制。
其中,解决数据安全性问题最有效的方法就是在存储和传输过程中对数据加密,常见的加密技术包括对称加密技术和非对称加密技术。
2对称加密体制与非对称加密体制
2.1. 对称加密体制
2.1.1对称加密体制的原理
对称加密技术在已经有了悠久的历史,以凯撒密码为代表的古典密码技术曾被广泛应用。现代的对称加密算法虽然比那些古典加密算法复杂许多,但是其原理都是一样的:数据发送方将明文数据加密后传送给接收方,接收方利用发送方用过的密钥(称作秘密密钥)及相同算法的逆算法把密文解密成明文数据。
图1给出了对称加密体制的工作流程。发送方对要发送的明文数据M用秘密密钥K加密成密文C后,密文经网络传送到接收方,接收方用发送方使用过的秘密密钥K把密文C还原成明文数据M。
图1: 对称加密体制工作原理图
2.1.2对称加密体制的特点
对称加密算法的优点是加解密时运算量比较小,所以加解密速度比较快[2]、加解密的效率也比较高。
该算法的缺点是不容易管理密钥。原因有二:一,在对称加密体制下,用来加密和解密的密钥是同一个,这就要求接收数据一方,即解密数据一方需要事先知道数据发送方加密时所使用的密钥。二,每对用户每次使用对称加密算法时,都需要使用其他人不知道的惟一的钥匙,密钥的需要量比较大。假如平台上有n个用户需要交流,根据保密性要求,每两个用户就需要一个密钥,则这n个用户就需要n(n-1)/2个密钥。论文参考网。
2.2. 非对称加密体制
2.2.1非对称加密体制的概念
与对称加密技术不同,在非对称加密体制下加密密钥与解密密钥不相同【3-4】。在这种体制下,每个用户都有一对预先选定的、完全不同但又完全匹配的密钥:一个是可以像电话号码一样进行注册公布的公开密钥KPub,另一个是用户需要保密的、可以用作身份认证的私有密钥KPri,而且无法根据其中一个推算出另一个。这样,数据的发送方(加密者)知道接收方的公钥,数据接收方(解密者)才是唯一知道自己私钥的人。
非对称加密技术以大数的分解问题、离散对数问题、椭圆曲线问题等数学上的难解问题来实现,是目前应用最为广泛的加密技术。
图2给出了非对称加密体制的工作流程。发送方把明文数据M用接收方的公钥KPub接收方
加密成密文C后经网络传输给接收方,接收方用自己的私钥KPri接收方把接收到的密文还原成明文数据M。
图2: 非对称加密体制工作原理图
2.2.2非对称加密体制的特点
非对称加密算法的优点是安全性比较高
非对称加密算法的缺点是算法十分复杂,加解密的效率比较低,用该技术加解密数据是利用对称加密算法加解密同样数据所花费时间的1000倍。
3. 一种更加安全的加密与验证系统
3.1加密与验证系统的框架
更加安全的加密与验证系统主要由数据的加密作业、数据的解密作业、数据完整性验证三大模块组成。
数据加密模块由数据发送方作业。发送方首先将待发送数据明文经哈希变换并用发送方私钥加密后得到数字签名。然后,使用对称加密中的秘密密钥对数字签名和原数据明文进行再加密。最后,使用接收方的公钥对秘密密钥进行加密,并将上述操作结果经网络传送出去。
数据解密作业模块由数据接收方作业。接收方首先用自己的私钥对接受到的、经过加密的秘密密钥进行解密。然后,用解密得到的秘密密钥对接收到的数据密文和加密后的签名进行解密。
数据完整性验证模块也是由数据接收方作业。接收方对解密模块作业得到的数据明文和数据签名进行操作,首先将该明文进行哈希变换得到数据摘要。然后,运用数据发送方的公钥对数据签名变换得到另一个摘要。最后,比较这两个摘要。若两者完全相同,则数据完整。否则,认为数据在传输过程中已经遭到破坏。
该系统框架将对称加密、非对称加密、完整性校验三者融为一体,既保证了数据的高度安全性又有很好的时效性,同时,兼顾了数据源的合法性和数据的完整性,能有效地规避仿冒数据源和各类攻击,是一种值得推广的数据存储和传输安全系统模型。
3.2加密与验证系统的实现
图3给出了这种种更加安全的加密与验证系统工作流程。其中,M指数据明文,C指数据密文,A、B分别为数据发送方和接收方,私钥A指A的私钥,公钥B指B的公钥。
图3:一种更加安全的加密与验证系统
4.总结
文中提出了一种基于两种加密技术的加密与验证系统设计,讨论了该加密与验证系统的总体框架与流程实现,得出了本系统能到达到更高的安全性与时效性的结论。
数字时代的到来给我们带来了前所未有的挑战和机遇,我们必须迎头赶上,化解挑战抓住机遇,提高自身的综合竞争力。把信息技术应用于各个行业,必将为我国社会经济的发展和人民生活水平的提高带来新的福音。
参考文献
[1]周蓉蓉. 构建公安消防信息网内外网边界接入平台[J]. 网络安全技术与应用, 2009, 12:46-48.
[2]管孟辉,吴健,湛文韬,张涛. 移动电子政务平台中安全Web服务的研究[J]. 计算机测量与控制, 2009.17(5): 967-969.
[3]程伟. 基于无线的核心WPKI安全开发平台设计[J]. 地理与地理信息科学, 2009, 9(6) : 50-52.
引言
我国目前正大力推动“互联网+”行动计划、移动互联网、云计算、大数据、物联网等新兴技术和新兴产业的发展。随着互联网的进一步普及,大数据已经真真正正的影响到了我们的生活。在大数据技术的背景下,很多分析处理的方法正悄然发生着变化,品牌视觉识别系统VIS的设计开发也面临同样的机遇与挑战。而品牌作为企业商业形态及服务形态的主要表征,在当前制造产业大升级,摒弃低端代加工,提升产品附加值的大背景下,其价值正日益凸显。
1 品牌VIS视觉识别系统的重要性
一个知名的品牌在相同条件下,可以帮助企业获得数倍的收益。当然,打造一个企业或产品的知名品牌是系统性工程,涉及到的内容很多。而品牌VIS视觉识别系统能帮助企业建立系统化的品牌视觉体验,将企业和产品的信息真实的、简约的和有意义的从视觉感受传递给市场与消费者,知名品牌的VIS是一种精神象征与价值理念,是企业品质优异的视觉体现,也是品牌有别于竞争对手,展示独特内含的无形资产。所以设计开发一套优质的品牌VIS系统的重要性是不言而喻,品牌VIS对的产品销售、定价等有着非常大的影响。
2 基于大数据技术VIS设计分析
传统的品牌VIS设计有天生缺陷。其一,品牌VIS设计方案有较大的设计师主观意识在内;其二,由于企业品牌推广是长期的、缓慢的过程,在此过程中对品牌VIS结果的反馈也会有较大的延迟,导致设计团队无法在第一时间给予提升支持。而国内较普通的现象是除了前期完成品牌VIS设计后,基本没有后期的品牌VIS分析与提升。目前著名的际调研机构新力公司就启用大数据分析技术,结合消费者U&A行为,开发出品牌针对性人群结构研究模型,让客户的品牌VIS更有针对性的来改进升级。
而将大数据技术引入到品牌VIS系统的设计开发中是必然趋势。因为大数据的结果能有效客观的指导品牌VIS设计,让开发团队准确的设计出针对性较强的品牌VIS,并对品牌VIS进行量化评测。而在后期品牌推广中依托大数据对VIS多项指标进行跟踪监测,通过多种量化的关系分析,快速得出针对性较强的修改方案并马上加以改进提升。
2.1 品牌VIS辅助设计模块
借助辅助设计子系统, 为品牌VIS设计提供全过程的信息支持和技术保证, 实现设计的数字化、信息化,提高设计效率。利用大数据建立的设计原则和设计方案资源库的指导下明确设计任务、形成设计方案。
2.2 品牌VIS辅助分析模块
针对企业特定需求,依托大数据建立市场信息资源库,提供目标市场与人群的各类信息数据模型。包括受众个体信息、群体信息、市场趋势信息等,为品牌VIS提供设计依据,辅助设计者分析已知品牌VIS相关数据。
2.3 品牌VIS辅助提升模块
依托前一分析模块所得的数据,从中抽取有价值资讯,结合大数据技术自主决策算法,对品牌VIS完成进入市场后,收集到的市场、消费者、媒体、营销者的各类信息,从目标、定位、视觉效果等方面进行综合评价,作出相应的修改或保持结论。如果确定有修改或再设计的必要,信息综合评价子系统将会把提供的信息作为修改或再设计的依据反馈给设计团队与客户。
此套基于大数据技术的品牌VIS设计、分析与提升系统,针对品牌VIS系统而设计,所以其研发方案也需围绕在VIS设计、分析和提升三个重点上分别展开。
(1)品牌VIS辅助设计模块的研究(如图2)
(2)品牌VIS辅助分析模块的研究(如图3)
(3)品牌VIS辅助提升模块的研究(如图4)
3 结束语
系统最终的技术实现路线:品牌VIS设计方案的提出(客户的基本信息与要求)――基于大数据的市场定位――基于资源库的品牌VIS辅助设计方案生成――终稿品牌VIS设计评价――基于大数据的品牌VIS精准宣传与信息反馈。
参考文献
[1]黄金平.浅议企业品牌战略[J].科技信息,2009(26):48.
[2]张建.基于大数据平台的精准广告系统研究与设计[J].电脑与信息技术,2015(04):47-50.
[3]陆艳军.大数据平台访问控制方法的设计与实现[J].信息安全研究,2016(10):926-930.
[4]张志强.基于特征学习的广告点击率预估技术研究[J].计算机学报,2016(04):780-790.
[5]马二伟.大数据时代广告产业结构优化研究[J].国际新闻界,2016(05):153-168.