登陆注册
3049900000009

第9章 数据存储与数据挖掘(1)

随着信息社会的发展,越来越多的信息被数据化,尤其是伴随着Internet的发展,数据呈爆炸式增长,存储技术将成为一个新的热点,而基于Internet的应用如电子商务、电子邮件和客户关系管理(CRM)等将成为存储服务的主要市场,因为他们都需要对大量数据的快速访问。从智慧城市的建设与存储服务的发展趋势来看,一方面,智慧城市的建设对数据存储量的需求会越来越大,另一方面,智慧城市的发展对数据的有效管理提出了更高的要求。

数据挖掘是人工智能、机器学习、数据库技术等多学科相结合的产物,是由计算机通过相关算法从储存于各种存储设备中的海量数据中发现以前未知的、具有潜在应用价值的信息或模式的技术。数据存储与数据仓库技术的发展与数据挖掘有着密切的关系,数据仓库的发展是促进数据挖掘越来越热的原因之一,但数据仓库并不是数据挖掘的先决条件,因为有很多数据挖掘可直接从操作数据源中挖掘信息。

数据挖掘技术帮助人们从储存在各种存储设备中的海量数据中获取隐含的、有价值的信息,其应用将会渗透到智慧政府、智慧交通、智慧教育、智慧社区等多个方面和领域,为智慧城市的建设和发展提供重要的技术支持。

3.1数据存储的基本方式

数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。数据以某种格式记录在计算机内部或外部存储介质上。数据存储要命名,这种命名要反映信息特征的组成含义。数据流反映了系统中流动的数据,表现出动态数据的特征;数据存储反映系统中静止的数据,表现出静态数据的特征。

信息技术的应用目前已逐渐从信息查询、数据传送走向网络环境中的海量数据存储、数据挖掘和决策信息支持,因此数据存储的高可靠性和高可管理性,正日益成为企业信息化进程中的一个关键环节。就数据存储的存储方式而言,比较常见的主要有DAS、NAS和SAN等三种。

3.1.1直接附加存储

DAS(Direct Attached Storage———直接连接存储)是指将存储设备通过SCSI接口或光纤通道直接连接到一台计算机上。当服务器在地理上比较分散、很难通过远程连接进行互联时,直接连接存储是比较好的解决方案。直接连接存储也可帮助企业继续保留已有的传输速率并不很高的网络系统。DAS这种存储方式与普通的PC存储架构一样,外部存储设备都是直接挂接在服务器内部总线上,数据存储设备是整个服务器结构的一部分。DAS存储方式主要适用以下环境:

1.小型网络。因为网络规模较小,数据存储量小,且也不是很复杂,采用这种存储方式对服务器的影响不会很大,并且这种存储方式也十分经济,适合拥有小型网络的企业用户。

2.地理位置分散的网络。虽然企业总体网络规模较大,但在地理分布上很分散,通过SAN或NAS在它们之间进行互联非常困难,此时各分支机构的服务器也可采用DAS存储方式,这样可以降低成本。

3.应用服务器。在一些特殊应用服务器上,如微软的集群服务器或某些数据库使用的原始分区,均要求存储设备直接连接到应用服务器。

3.1.2网络附加存储

网络正成为主要的信息处理模式,需要存储的数据大量增加,数据作为取得竞争优势的战略性资产其重要性也在增加,是目前发展的趋势。NAS就是网络连接存储,即将存储设备通过标准的网络拓扑结构(例如以太网),连接到一群计算机上。它的重点在于帮助工作组和部门级机构解决迅速增加存储容量的需求。这种方法从两方面改善了数据的可用性。第一,即使相应的应用服务器不再工作了,仍然可以读出数据。第二,简易服务器本身不会崩溃,因为它避免了引起服务器崩溃的首要原因,即应用软件引起的问题。另外,NAS产品是真正即插即用的产品,其设备的物理位置非常灵活。NAS方式则全面改进了以前低效的DAS存储方式。它采用独立于服务器,单独为网络数据存储而开发的一种文件服务器来连接所存储设备,自形成一个网络。这样数据存储就不再是服务器的附属,而是作为独立网络节点而存在于网络之中,可由所有的网络用户共享。

NAS的优点:

1.真正的即插即用。NAS是独立的存储节点存在于网络之中,与用户的操作系统平台无关,真正的即插即用。

2.存储部署简单。NAS不依赖通用的操作系统,而是采用一个面向用户设计的,专门用于数据存储的简化操作系统,内置了与网络连接所需要的协议,因此使整个系统的管理和设置较为简单。

3.位置非常灵活。

4.容易且成本低。

NAS数据存储方式是基于现有的企业Ethernet而设计的,按照TCP/IP协议进行通信,以文件的I/O方式进行数据传输。

NAS的缺点:

1.性能较低;

2.可靠度不高。

3.1.3存储区域网络

1991年,IBM公司在S/390服务器中推出了ESCON(Enterprise System Connection)技术,它是基于光纤介质,最大传输速率达17MB/s的服务器访问存储器的一种连接方式。在此基础上,乐后又进一步推出了功能更强的ESCON Director(FC SWitch),构建了一套最原始的SAN系统。SAN(存储区域网络)通过光纤通道连接到一群计算机上,在该网络中提供了多主机连接,但并非通过标准的网络拓扑,并且通过同一物理通道支持广泛使用的SCSI和IP协议。

它的结构允许任何服务器连接到任何存储阵列,这样不管数据置放在哪里,服务器都可直接存取所需的数据。SAN解决方案是从基本功能剥离出存储功能,所以运行备份操作就无需考虑它们对网络总体性能的影响。这个方案也使得管理及集中控制实现简化,特别是对于全部存储设备都集群在一起的时候。

1.SAN的支撑技术

SAN的支撑技术是光纤通道(FC Fibre Channel)技术,它是ANSI为网络和通道I/O接口建立的一个标准集成。FC技术支持HIPPI、IPI、SCSI、IP、ATM等多种高级协议,其最大特性是将网络和设备的通信协议与传输物理介质隔离开,这样多种协议可在同一个物理连接上同时传送。

2.SAN的硬件基础设施及其构成

SAN的硬件基础设施是光纤通道,用光纤通道构建的SAN由以下三个部分组成:

(1)存储和备份设备:包括磁带、磁盘和光盘库等。

(2)光纤通道网络连接部件:包括主机总线适配卡、驱动程序、光缆、集线器、交换机、光纤通道和SCSI间的桥接器

(3)应用和管理软件:包括备份软件、存储资源管理软件和存储设备管理软件。

3.SAN的优势

SAN存储方式创造了存储的网络化,而存储网络化顺应了计算机服务器体系结构网络化的趋势。SAN的优势主要体现在以下几个方面:

(1)网络部署容易。

(2)高速存储性能。因为SAN采用了光纤通道技术,所以它具有更高的存储带宽,存储性能明显提高。SAn的光纤通道使用全双工串行通信原理传输数据,传输速率高达1062.5Mb/s。

(3)良好的扩展能力。由于SAN采用了网络结构,扩展能力更强。光纤接口提供了10公里的连接距离,这使得实现物理上分离,不在本地机房的存储变得非常容易。

3.2数据存储的管理维护技术

确保所有数据能够得到可靠备份,及时进行灾难恢复是存储管理的核心任务。此外存储管理还须具备以下一些基本功能,如改进系统和应用I/O性能及存储管理能力,提高数据和应用系统的高可用性,减少由于各种原因中断数据存取或者应用系统宕机的时间,实现技术有分级存储管理(HSM)、ClusterServer(集群服务器)等。

3.2.1存储管理的基础工具

存储管理的基础工具主要有Volume Manager和File System,它们都工作在操作系统一级,可实现集群与故障恢复、自动管理、备份与HSM以及基于浏览器的远程管理等。两者有机结合后,利用双方特有的对磁盘和数据的管理能力,能给企业的系统提供尽可能高的性能、可用性及可管理性。

1.Volume Manager工具

Volume Manager工具可以识别和分析存储访问模式,它通过复杂的磁盘配置能均衡I/O负载,在不影响应用的同时能够优化应用数据的布局,还可将数据条形散放到多个物理盘上以提高性能,同时还具有在不中断应用的情况下,识别和消除性能瓶颈的能力,从而增强系统和应用的性能。另外,Volume Manager在减少系统中断时间、增加数据完整性等方面也有不俗表现,它允许对磁盘进行在线的管理和更改配置,减少对系统产生极大影响的停机时间,同时利用冗余技术提高数据可用性,防止数据被丢失和破坏。

2.File System

File System是一个非常重要的可快速恢复的日志式文件系统,它能在不间断数据访问的条件下,对文件作在线备份,并在系统重启或崩溃前允许访问数据并恢复文件,从而大大提高用户和管理员的生产效率。File System在系统崩溃前还能将未完成的数据记录在一个事件日志中,利用恢复程序重现,从而保持了数据的完整性。

3.2.2数据存储备份技术

存储备份技术并不仅仅指数据的简单备份,还包括内容及备份的管理等多方面,包括硬件备份和软件备份两大类,而真正意义的存储备份更强调软件的备份。从国际范围看,以美国为首的发达国家都非常重视数据存储备份技术,而且将其充分利用,服务器与备份设备的连接已经达到60%以上。在国内,只有不到15%的服务器连有备份设备,这就意味着85%以上的服务器中的数据面临着随时有可能遭到全部破坏的危险。根据3M公司的调查,对于市场营销部门来说,恢复数据至少需要19天,耗资17000美元;对于财务部门来说,这一过程至少需要21天,耗资19000美元;而对于工程部门来说,这一过程将延至42天,耗资达98000美元。这些统计数字表明,提供可靠的数据存储保证是至关重要的,而有效的手段是采取数据备份技术。一般来说,最需要备份的总是那些数据对业务十分关键的企业,如银行的数据保存账户信息、电信的数据用于计费,还有罪犯数据、军事数据等。随着网络应用的扩展和深化,数据总是越来越多,备份介质加速增长。有时为了数据的安全性,还要将备份数据送到异地保存。因此,如何自动地备份数据、管理数据备份,在进行灾难恢复时能够准确、快速地找到数据,就构成了存储管理的重要内容。

数据存储备份技术所用到的硬件技术主要是磁带机技术,软件技术主要有通用和专用备份软件技术等,本书主要从软件技术方面加以讨论。

1.备份软件技术

备份软件技术在整个数据存储备份过程中具有相当的重要性,因为它不仅关系到是否支持磁带的各种先进功能,而且在很大程度上决定着备份的效率。最好的备份软件不一定就是操作系统所提供的备份功能,很多厂商都提供了许多专业的备份软件。专业备份软件能通过优化数据传输率,即可以自动以较高的传输率进行数据传输,不仅能缩短备份时间、提高数据存储备份速度,而且对磁带机设备本身也有好处。另外,专业备份软件还支持新磁带机技术,如HP的TapeAlert技术,差不多所有主流专业备份软件均提供支持。

2.集群架构技术

集群通常用于加强应用软件的可用性与可扩展性。某些集群架构技术会加入单一系统印象的概念,可从单点以单一系统的方式来管理多台计算机。集群服务器可支持多达上百台互相连接的服务器,结合为松散结合的单位来执行作业,保护彼此的应用软件免于故障。由于集群服务器可完全整合应用软件服务架构,因此可建置高效的应用软件执行环境,即使整个系统出现故障,终端计算机都还可以使用几乎所有的应用软件。

集群服务器软件包括引擎、编译器、负载计算器、代理、指令与图形化系统管理接口等组件。集群化运算环境的最大优势是其卓越的数据处理能力。原则上任何类型的多重主机架构存储设备,包括直接连接的磁盘,都可以用来当作集群数据存储设备。为求得最大的系统可用性,最适合使用拥有多重主机存取路径的容错或高可用性存储子系统。

同类推荐
  • 中国新篇章

    中国新篇章

    本书以中国新篇章为主题,文章包括预测中国、中产阶级重塑中国消费市场、中国制造业迈入新时期、在PC+时代登上新高峰:杨元庆访谈录等。作者为麦肯锡全球各分公司的董事和顾问等。本书可供中国企业高管和相关研究人员参考、阅读。
  • 地方政府基础设施债务融资研究

    地方政府基础设施债务融资研究

    徐丽梅等编著的《地方政府基础设施债务融资研究》在总结国际经验的基础上,分析了我国现有的投融资体制和经济环境的限制以及现有融资模式的局限性。原有的地方投融资平台虽然在一定时期内有存在的必要,但也同时存在着缺陷和风险。《地方政府基础设施债务融资研究》在考虑目前法律框架的前提下,探讨了创新地方投融资平台的做法,包括改革依据、基本特性、功能定位和运行机制等内容;其次,对于债务融资模式,分析和探讨了“准市政债券一市政债券”的发展路径,并对未来资本市场的发展和市政债券融资的方向提出建议。
  • 税苑花香

    税苑花香

    在全市上下深入开展“爱我临汾、树我形象、建我家乡”活动的热潮中,在全市人民广泛学习“敢为人先、坚韧不拔、开放包容、勤劳智慧”的“临汾精神”热潮中,山西人民出版社编辑出版的《税苑花香》一书,就要与广大读者见面了。
  • 广义虚拟经济论文集1

    广义虚拟经济论文集1

    这是本观点比较标新立异的虚拟经济论文集,共收论文17篇,具体内容包括:单边主义把世界引向何方;虚拟价值的人类活动论依据;从生活价值论解读财富属性;广义虚拟经济概论十题;基于不同视角的虚拟经济观点综述等等。
  • 看经济穿越剧(吴晓波细说商业史05)

    看经济穿越剧(吴晓波细说商业史05)

    “吴晓波细说商业史”系列图书为全数字系列产品,是对《激荡三十年》《跌荡一百年》《浩荡两千年》的补充。该系列整理了吴晓波近年来所写作的文章,了解中国百年商业的风雨历程,再现那些可歌可泣的历史商人,探寻中国商业百年变迁,深入中国商人企业家精神内核。《看经济穿越剧(吴晓波细说商业史05)》:翻看历史与当下,发现历史总在不断重演。
热门推荐
  • 海贼之神枪手

    海贼之神枪手

    穿越海贼世界,重生为阿拉巴斯坦王子,获得枪神系统。拥有漫游枪手枪炮师等系列神枪转职能力,罗林要用枪械的炮火震撼这个世界。ps1:本书又名《海贼之狙击手》、《海贼之枪神》ps2:已有稳定更新半年完本作品,人品保证ps3:简介无力,请多担待,先看几张吧
  • 末世之召唤红警

    末世之召唤红警

    荒凉破败的街道中,一只丧尸正趴在地上吭食着刚刚捕获的猎物。路边的碎石块微微震颤起来,丧尸抬起头望向四周——下一秒,他的头颅像西瓜一样爆裂开来。震感愈发强烈,目力可及之处,无数的装甲车坦克如钢铁洪流般滚滚而来。“指挥官,已经到达目的地,雷达以探测到多处矿产资源。”“让谭雅带着海豹突击队清扫城市里的残余丧尸!工程师尽快测量巨炮的最佳建造点,我要将这里打造的固若金汤!”庞大的天启坦克上,王鹏双手抱胸,环顾四周。2017最劲爆末日爽文,给你不一样的末日废土体验。 q群号码:799232616。
  • 重生辣妻:傲娇总裁,惹不起!

    重生辣妻:傲娇总裁,惹不起!

    前一世,她痴心错付,被害得香消玉殒。这一世,她重生归来,誓要虐尽渣男渣女,走上人生巅峰,把上辈子欺辱她的人都踩在脚下!可谁能告诉她,这整天围着她转的霸道总裁是怎么回事?她不过是想去旅游,某个霸道总裁就买了一架私人飞机送她;她偶尔想吃一顿海鲜,某人买下一整座岛屿,专门派人抓海鲜给她吃……这样的日子简直……太可怕,安雨橙大吼一声,“我要离婚!”慕容城薄唇一勾:“安雨橙,这辈子,你休想逃离我半步!”
  • 我志凌云

    我志凌云

    生在江湖,身在江湖。年少时得知身世,成年后闯荡江湖,身负的残剑无时无刻不在提醒着少年这个江湖的血腥。随着一件又一件江湖旧事被揭开面纱,在得知更多事情的真相后,当年的那些事情却多了一些新的解释......
  • 嚣张狂妃:王爷请自重

    嚣张狂妃:王爷请自重

    她是杀手界的魁首,鬼魅般的速度令人闻风丧胆。一朝穿越,她成了南楚冷宫中被废的皇后,又辗转嫁给闲王为妃。洞房花烛夜,她看到了他面具下惊为天人的容颜;危机四伏中,她逐渐认清了自己的感情。宫斗,宅斗,谋权…看杀手横行异世。【某月新浪微博:月明九霄。欢迎调戏】
  • 凤御天下:谋取帝心

    凤御天下:谋取帝心

    祸国妖女,人人得而诛之。她为报国恨家仇,掀起满城风雨,将帝王玩弄于股掌之中。他贵为西斐太子,以统一天下为抱负,却将她收入囊中,百般宠溺。一曲上邪,她与他北齐茶谷里沉沦。世人皆斥她为祸害,他毅然替她挡去所有诽谤,护在身后。时光缱绻如画,一切如过往云烟,情谊悄然流逝。流年一纸,她披上一袭火红嫁衣,转身投入他人怀里。运筹帷幄,他终是坐拥了天下,却渐渐地遗失了自己的心。究竟是谁为了谁负了年华逆了乾坤,又是谁为了谁蹉跎了岁月抛弃了天下。
  • 嫡女权谋天下

    嫡女权谋天下

    为他七年筹谋苦心经营,换来的是他与庶姐的联手算计,君临天下之时她得到的是死牢酷刑折磨至死与满门被灭的下场。重活一世,她发誓必定让那些欠她的人血债血偿。只是……前世那个被她害死的摄政王今世怎么成了纨绔子弟,动不动就调戏她呢,果真是报应不爽么?珍爱生命,远离摄政王……--情节虚构,请勿模仿
  • 无畏帝皇系统

    无畏帝皇系统

    凡吾目光之所及,皆为吾之国土;凡吾国土之子民,皆为吾之顺民;凡吾之顺民,皆听吾之令;凡违吾命者,皆为吾之敌;凡吾之敌,皆得死!皇权至上,唯霸独宰!——刘旸
  • 千年梦中梦:只为拥你入怀

    千年梦中梦:只为拥你入怀

    音儿,若我入魔,你可还爱我?@后卿对立面的我们还会爱吗?@茗熙千年之约,只为拥你入怀。是神,是魔,不过一念之间本人学生党,不定时更新
  • 冷情少爷追悍妻

    冷情少爷追悍妻

    她是燕京大学的新生,入学前巧遇同为燕京大学的他,他们之间会有怎样的纠葛?又会擦出怎样的火花?她是龙魂的高级军官,经常在生死之间挣扎,但在她看来,这是她对祖国深沉的爱,可是,当她得知他也是龙魂的一员,心里会产生怎样的变化?她时而嘻嘻哈哈,时而冷静沉稳,时而忧郁悲戚,哪一个才是真正的她?那大大咧咧的笑容之下隐藏的又是怎样的伤痛?他清冷孤傲,高贵优雅,犹如九天之上的谪仙,却遇上了她,从此落下凡尘,为她改变,钟情于她一人,终身不悔!他加入龙魂十余年,从未怕过什么,却因为她而担心会一去不回,再无相见之日……他认识她不到一年,却愿为她付出一切,只要她能好好活下去,就算牺牲他的生命也在所不惜!几经起落,他们终于能在一起时,又有无数坎坷波折向他们席卷而来……他们,将会有怎样的结局?有情人最后能否终成眷属?敬请期待!!!文章节选:“喂,冷泉,我们今天要去买军训用的东西,你陪我们一起去吧。”另一头,冷泉面无表情地说:“不去!”“不要这样啊,你看我们几名弱女子孤身去商场,合适吗?要是遇到坏人怎么办?更何况紫幽还是你妹妹呢,你忍心让她冒这个险吗?你要是不去的话,我就跟别人说,你这个冷漠无情的家伙连自己的妹妹都抛下不管!还有啊,冷家和叶家是世交吧?你要是敢这样对我的话,我就回去跟冷伯伯说你欺负我。”叶子凝无赖的时候连无赖都自愧不如,逛商场遇到坏人,这几率……真亏她说得出口!当然,如果她的叶家小姐的身份暴露的话,的确有被人绑架勒索的可能,但现在,她们都只是普通的大学生而已,这几率,堪比火星撞地球吧?见对方还是沉默不语,叶子凝又加了把火:“你要是不答应的话,我就去你宿舍楼下哭,指控你始乱终弃!”“现在去吗?”听到了这句话,叶子凝对旁边的室友比了一个胜利的手势。“嗯嗯,现在就去。要不在校门口碰面吧?”叶子凝刚说完,冷泉就挂了电话,可以想象,他的脸已经黑得如炭了。话说,自从遇到叶子凝,他的脸色就没好过。走到宿舍楼下,叶子凝又看见了冷泉,就站在大门不远处,周围照例围了一圈女生。也是,如此高质量的男生站在女生宿舍楼下,能不招蜂引蝶么?虽然知道是这样,但叶子凝心里还是忍不住不舒服。既然自己心里不舒服,就别让其他人心里好过,叶子凝奉行着这样的原则,快速走到冷泉身边,冷冷的说:“以后不要往这跑了。”“为什么?”冷泉眸中闪过一丝受伤,虽然依旧面无表情。