期刊大全 杂志订阅 SCI期刊 投稿指导 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 云计算数据论文

云计算数据论文精品(七篇)

时间:2022-07-28 04:52:29

云计算数据论文

云计算数据论文篇(1)

1.1大数据的发展

通过对大数据的汇集、智能分析和挖掘技术,发现数据中的潜在价值信息,帮助人们做出正确决策,这就是大数据产业的利益。国外大数据的起步比较早,比较成功的大数据应用案例有:商业龙头沃尔玛公司通过对消费者的购物数据进行分析,了解顾客的行为喜好,对超市的商品结构进行搭配重置以增加销售额;亚马逊公司通过大数据构建自己的推荐系统,每年可以靠此多收益20%;奥巴马通过大数据分析系统进行数据挖掘,用科学的手段获取选票、募集资金,赢得了总统竞选的胜利。相比于国外,国内的大数据研究和应用还处于起步和发展中的阶段,比较成功的案例有:淘宝数据魔方平台,通过大数据,为买家量身打造完善的购物体验产品;新浪微博大数据产品,通过大量的社交数据,创造不同的社会经济价值等。

1.2云计算的发展

云计算可以像电力资源一样提供弹性的按需服务,事实上它是集合了一系列的服务提供给用户。云计算的核心可分为三个层次,分别为基础设施层、平台层、应用层,如图2所示。云计算将基础设施、软件运行环境、应用程序抽象成服务,具有可靠性高、可用性强、规模可伸缩等特点,满足了不同企业的发展需求,各个云服务提供商根据各自服务对象的差别分别开发了各具特色的云服务。(1)基础设施即服务层基础设施即服务(InfrastructureasaService,IaaS)层通过部署硬件基础设施对外提供服务,用户可以根据各自的需求购买虚拟或实体的计算、存储、网络等资源。用户可以在购买的空间内部署和运行软件,包括操作系统和应用程序。消费者不能管理或控制任何云计算基础设施,但能控制操作系统的选择、存储空间、部署的应用,也有可能获得有限制的网络组件(如防火墙、负载均衡器等)的控制。云服务提供商为了使硬件资源得到更有效的利用,引入了Xen、KVM、VMware等虚拟化技术,使得云服务商可以提供更个性化的IaaS服务。亚马逊弹性云计算(AmazonElasticComputeCloud,AmazonEC2)是亚马逊Web服务产品之一,AmazonEC2利用其全球性的数据中心网络,为客户提供虚拟主机服务,让使用者可以租用云服务运行所需应用的系统。(2)平台即服务层平台即服务(PlatformasaService,PaaS)层是指云计算应用程序开发和部署的平台,包括应用设计、应用开发、应用测试和应用托管,都作为一种服务提供给客户。开发者只需要上传代码和数据就可以使用云服务,而无需关注底层的具体实现方式和管理模式。鉴于PaaS平台的重要意义,国内外厂商根据各自的战略提出了相应的PaaS平台,国外的如GoogleAppEngine(GAE),通过GAE,即使在重载和数据量极大的情况下,也可以轻松构建能安全运行的应用程序。国内也有新浪的SAE(SinaAppEngine)、阿里的ACE(AliyunCloudEnginee)等。(3)软件即服务层软件即服务(SoftasaService,SaaS)层是为云计算终端用户提供基于互联网软件应用服务的平台。随着Web服务、HTML5、AJAX、Mashup等技术的成熟与标准化,SaaS应用近年来发展迅速,典型的SaaS应用包括GoogleApps、SalesforceCRM等。国外云计算平台比较成功的应用案例有:亚马逊电子商务网站根据用户的购买行为和搜索技术搭建Hadoop集群,构建推荐系统;Twitter社交网站搭建Hadoop分布式系统用于用户关联的建立。国内云计算平台的成功案例有:阿里巴巴目前整个集群达到1700个节点,数据容量达到24.3PB,并且以每天255TB的速率不断攀升;2013年,华为推出国内首个运营云平台,目前为止与该平台签订协议的ISV有3000多家。

1.3云计算相关技术

(1)分布式文件系统分布式文件系统(GoogleFileSystem,GFS)[3]是Google公司针对云计算过程处理海量数据而专门设计的。一个GFS集群由一个主节点和多个从节点组成,用户可以通过客户端访问文件系统,进行正常的文件处理工作。在云计算中,海量数据文件被分割成多个固定大小的数据块,这些数据块被自动分配到不同的从节点存储,并会在多个节点进行备份存储,以免数据丢失。主服务器管理文件系统记录文件的各种属性,包括文件名、访问控制权限、文件存储块映射、块物理信息等数据。正是通过这个表,文件系统可以准确地找到文件存储的位置,避免数据丢失,保证数据安全。图3是GFS的体系结构示意,每一个节点都是普通的Linux服务器,GFS的工作就是协调成百上千的服务器为各种应用提供服务。(2)分布式并行数据库BigTableBigTable[4]是一个为管理大规模结构化数据而设计的分布式存储系统,可以扩展到PB级数据和上千台服务器。很多Google的项目使用BigTable存储数据,这些应用对BigTable提出了不同的挑战,比如对数据规模的要求、对时延的要求。BigTable能满足这些多变的要求,为这些产品成功地提供了灵活、高性能的存储解决方案。BigTable采用的键是三维的,分别是行键(RowKey)、列键(ColumnKey)和时间戳(Timestamp)。行键和列键都是字节串,时间戳是64位整型;值是一个字节串,可以用(row:string,column:string,time:int64)string来表示一条键值对记录。(3)分布式计算框架MapReduceMapReduce[5]是Google公司提出的大数据技术计算框架,被广泛应用于数据挖掘、海量数据处理以及机器学习等领域,由于其并行化处理数据的强大能力,越来越多的厂商根据MapReduce思想开发了各自的云计算平台,其中以Apache公司的Hadoop最为典型。MapReduce由Map和Reduce两个阶段组成。用户只需要编写简单的map()和reduce()函数就可以完成复杂分布式程序设计,而不用了解计算框架的底层实现。MapReduce的数据分析流程如图4所示。分布在不同服务器节点上的海量数据首先通过split()函数被拆分成Key/Value键值对,map()函数以该键值对为输入,将该键值对进行函数处理,产生一系列的中间结果并存入磁盘。MapReduce的中间过程shuffle()将所有具有相同Key值的键值对传递给Reduce环节,Reduce会收集中间结果,并将相同的Value值合并,完成所有工作后将结果输出给用户。MapReduce是一个并行的计算框架,主要体现在不同的服务器节点同时启动相同的工作,并且在每个独立的服务器节点上又可以启动多个map()、reduce()并行计算。

2基于云计算的大数据处理

目前大数据处理的基本流程如图5所示,整个流程经过数据源的采集,用不同的方式进行处理和加工,形成标准的格式,存储下来;然后用合适的数据计算处理方式将数据推送到数据分析和挖掘平台,通过有效的数据分析和挖掘手段,找出大数据中有价值的信息;最后通过可视化技术将信息展现给人们。

2.1数据采集存储

大数据具有不同结构的数据(包括结构、半结构、非结构),针对不同类型的数据,在进行云计算的分布采集时,需要选择不同的数据采集方式收集数据,这也是大数据处理中最基础的一步。采集到的数据并不是都适合推送到后面的平台,需要对其进一步处理,例如来源不同的数据,需要对其进行加载合并;数据存在噪声或者干扰点的,需要对其进行“清洗”和“去噪”等操作,从而保障数据的有效性;数据的格式或者量纲不统一的,需要对其进行标准化等转换处理;最后处理生成的数据,通过特定的数据库,如NoSQL数据(Google的BigTable,Amazon的Dynamo)进行存储,方便进行下一步的数据读取。由于传统的数据仓库无法适应大数据的存储要求,目前基于云计算的数据仓库都是采用列式存储。列式存储的数据具有相同的数据类型,可以大大提高数据的压缩率,例如华为的云存储服务MOS(MassiveObjectService)的数据持久性高达99.9%,同时提供高效率的端到端保障。

2.2数据计算模式

这一环节需要根据处理的数据类型和既定目标,选择合适的计算模型处理数据。由于数据量的庞大,会消耗大量的计算资源,因此,传统的计算技术很难使用大数据的环境条件,取而代之的是分而治之的分布式计算模式,具有代表性的几种计算模式的特点见表1。采用批处理方式计算的Hadoop平台,例如,Facebook拥有全球最大规模的Hadoop集群,集群机器目前超过3000台,CPU核心更是超过30000个,可以存储的数据量能够达到惊人的40PB;采用流处理方式计算的Storm平台分布式计算的时延比Hadoop更小;实时处理方式计算的Spark是一种基于内存的计算模式,例如,Yahoo运用Spark技术在广告营销中实时寻找目标用户,目前在Yahoo部署的Spark集群有112台节点和9.2TB内存;交互处理方式计算的Dremel在处理PB级别的数据时耗时可以缩短至秒级,并且无需大量的并发。

2.3数据分析挖掘

数据分析挖掘环节是从海量数据中发现隐藏规律和有价值信息的过程,这个环节是大数据处理流程最为有价值和核心的部分,传统的数据分析方法有机器学习、商业智能等。传统的数据挖掘十大算法[6](其中有K-Means、Na觙veBayes、SVM、EM、Apriori等)在云计算环境下都得到了大幅度的并行优化,在大数据的背景下,计算速度得到了很大程度的提升。现在新兴的深度学习是原始机器学习的一个新领域,动机是在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,这种新的数据分析挖掘技术已经在计算机视觉、语音识别、自然语言处理等领域有了成功的应用。

2.4数据解释展现

将挖掘出来的复杂信息进行数据解释和展现是整个大数据处理流程的最后一个环节,数据分析的结果需要向客户进行恰当的展现。与传统的数据输出和文本展示等方式不同,现在绝大部分的企业都通过引进“数据可视化”技术来展示大数据分析的结果信息,这种方式以图像、动画等方式,形象地向客户展现数据处理分析的结果,也容易被客户理解和接受,更为先进的是,现在逐步形成的“交互式可视化技术”,大大地方便了数据与人之间的“亲密交流”。目前面向大数据主流应用的可视化技术见表2。

3大数据和云计算的未来挑战

大数据需要超大存储容量的计算能力,云计算作为一种新的计算模式,为大数据的应用研究提供了技术支持,大数据和云计算的完美结合,相得益彰,发挥了各自的最大优势,为社会创造了巨大的价值。虽然国内大数据和云计算的研究还是处于初步阶段,但随着研究的不断进行,所面临的问题也越来越多。在大数据向前不断迈进的阶段里,如何让我们对大数据的研究朝着有利于全人类的方向发展成为了重中之重。

3.1重要战略资源

在这个信息社会里,大数据将会成为众多企业甚至是国家层面的重要战略资源。国家层面要将大数据上升为国家战略。奥巴马在2012年3月将“大数据战略”上升为最高国策,像陆权、海权、空权一样,将数据的占有和控制作为重要的国家核心能力。大数据资源也会成为各种机构和企业的重要资产以及提升企业社会竞争力的有力武器。在大数据市场里,客户的各种数据信息都会为企业创造价值,也会在促进消费水平、提高广告效应等方面扮演重要的角色。

3.2数据隐私安全

大数据如果运用得当,可以有效地帮助相关领域做出帮助和决策,但若这些数据被泄露和窃取,随之而来的将是个人信息及财产的安全问题得不到保障。2011年索尼公司遭到黑客攻击,造成一亿份客户资料泄露,经济亏损约1.71亿美元。为了解决大数据的数据隐私安全问题,Roy等在2010年提出了一种隐私保护系统,将信息流控制和差分隐私保护技术融入到云计算平台中,防止MapReduce计算过程中的数据泄露问题。在数据更新飞速的情况下,如何维护数据的隐私安全成为大数据时代研究的重点方向。

3.3智慧城市

人口的增长给城市交通、医疗、建筑等各方面带来了不小的压力,智慧城市就是依靠大数据和云计算技术,实现城市高效的管理、便捷的民生服务、可持续的产业发展。在刚刚结束的“两会”的政府工作报告中,总理也特意强调了智慧城市发展的重要性,目前国家智慧城市试点已遍布全国各地,多达409个。智慧安防、智慧交通、智慧医疗等都是智慧城市应用领域。智慧城市的建设也趋使大数据人才的培养。据预测,到2015年,大数据将会出现约100万的人才缺口,全球将新增440万个与大数据相关的工作岗位来填补这个空缺。

3.4能源消耗

云计算数据论文篇(2)

关键词:计算机网络专业;大数据;云计算;Hadoop

中图分类号:G642.0;TP393 文献标识码:A 文章编号:2095-1302(2016)12-0-02

0 引 言

随着云计算、物联网以及“互联网+”技术的兴起,数据正以前所未有的速度在不断增长和累积,互联网大数据正在实时影响人们的工作、生活乃至社会发展。2012年 3月,美国奥巴马政府公布“大数据研发计划”,旨在提高和改进人们从海量、复杂的数据中获取知识的能力,发展收集、储存、保留、管理、分析和共享海量数据所需要的核心技术。2014年大数据高速发展,中国互联网三巨头BAT(百度、阿里、腾讯)纷纷建立大数据研究院、大数据实验室等,提供大数据专业服务,一批大数据专业分析公司应运而生。我国的开放、共享和智能的大数据时代已经来临,同时对专业人才的需求也日益增长。

大数据的发展与计算机网络密切相关,因此适时调整高职计算机网络专业方向的培养目标,可以更好的适应大数据发展要求。大数据背景下计算机网络专业学生的目标是培养具有计算机网络、大数据及云计算的专业知识,实践能力强、职业道德素养高,具备云平台的管理能力和网络软件开发能力,能够从事网络工程设计实施、网络高级管理维护、网络开发、云平台组建及管理以及大数据存储、计算及分析等岗位的高级技能型人才[1]。

1 大数据与云计算

根据维基百科的定义,大数据[2,3]是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据主要具有4V特征[2],即数据体量巨大(Volume)、数据种类繁多(Variety)、流动速度快(Velocity)、价值密度低(Value)。

从技术角度上看,大数据必然无法用单台计算机处理,必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。目前应用最为广泛的大数据分布式处理平台就是Hadoop,Hadoop是由Apache基金会所开发的分布式系统基础架构,能够对大量数据进行分布式存储、分析和处理的云计算平台,已经在网络大数据领域得到了广泛运用。例如Yahoo使用4 000个节点的Hadoop集群来支持广告系统和Web搜索的研究;Facebook使用1 000个节点的集群运行Hadoop,存储日志数据,支持其上的数据分析和机器学习;百度用Hadoop处理每周200 TB的数据,进行搜索日志分析和网页数据挖掘工作;淘宝的Hadoop系统用于存储并处理电子商务交易的相关数据。

2 课程体系改革研究

2.1 课程体系现状

目前,高职院校计算机网络专业类课程大多围绕计算机网络工程和计算机网络开发两条主线,主要课程包括网络基础、路由器及交换机配置与管理、Windows网络服务器配置与管理以及动态网站开发相关技术等。这些课程内容传统,课程内容严重同质化,教学内容已不能满足大数据时代人才培养的要求,这些将直接影响学生的理论实践能力和就业机会。

大数据、互联网+、物联网及云计算技术的发展和应用给高职计算机网络专业人才培养带来了新的要求与挑战,与市场需求存在脱节现象。计算机网络专业应紧跟大数据、云计算等先进技术的步伐,不断进行专业课程的创新性研究,重视实践类课程和教材的研发,适时调整人才培养目标和专业教学计划,以期满足工作岗位的实际要求。

2.2 研究思路

计算机网络专业经过多年的发展,其课程体系比较成熟,形成了各自的特色教学。因此,本文的研究内容是对原有课程体系的补充和完善。

2.2.1 有针对性的进一步优化传统的专业职业技能课程

传统的专业职业技能课程已经比较成熟,经过了实践的考验,也已得到了学生的认可。尽管如此,还要有针对性的进一步优化,使得课程体系的理实比达到更优,提升课程教学实施的效果。

2.2.2 采用增加模式,补充完善课程体系

基于大数据和云计算技术研发新的职业技能课程,充实现有的课程体系。大数据和云计算紧密相联,因此要增加云计算和大数据的理论和实践课程。在研发课程的过程中,以岗位需求为导向,以培养技能型人才为目标,合理安排理论教学内容和课时,着重开发实践教学案例和内容,明显区别于本科课程教学设置。

2.2.3 课程体系相互作用,相互促进

网络技术是大数据、云计算技术的基础。因此计算机网络传统课程也是新研发课程的基础。新研发课程既是传统课程的有效实践,又是对传统课程的有效扩展和提升。

2.3 具体内容

由于大数据、云计算技术是基于网络的技术,因此,计算机网络专业人才培养具有先决条件。根据以上研究思路,具体方案主要包括强化现有课程体系,增加基础理论课程、完善知识体系,增加实践课程、锻炼岗位能力三个部分。

2.3.1 强化现有课程体系

针对现阶段存在的问题,学校应强化现有课程体系,使学生具有扎实的网络管理能力和一定的网络开发能力。现有的课程体系使学生具备了相关能力。熟悉ISO/OSI互联网模型,并掌握常见的互联网协议如TCP/IP、ARP、OSPF、SSL、DNS、DHCP及HTTP等。能够配置管理Windows和Linux服务器,熟悉使用常见的网络命令,具备远程网络控制学习能力。掌握程序设计语言Java,具备Windows和Linux下的程序开发能力,包括编写shell程序。能够配置交换机和路由器,具备组建局域网的能力。熟悉信息安全、系统安全及网络安全攻防技术。

2.3.2 增加基础理论课程,完善知识体系

针对人才需求,增加大数据、云计算等基础理论课程,完善知识体系。虽然大数据、云计算等课程教学的最终目的是培养实践技能,但基础理论仍非常重要,主要包括熟悉大数据的基础概念和常见技术架构;熟悉云计算原理和架构,并了解虚拟化技术如KVM;熟悉分布式系统和分布式计算原理;了解大数据、云计算的最新应用。

2.3.3 增加实践课程,锻炼岗位能力

在课程体系设置中,实践课程比例应超过理论课程。增加大数据、云计算等实践课程,锻炼学生的岗位能力。主要包括主流云平台管理软件的使用,如华为FusionSphere、VMWARE等;分布式系统管理、分布式并行计算以及Map/Reduce编程;Hadoop集群、HBase分布式数据库的构建与管理;Hadoop、HBase等案例实践与应用。

通过以上方法,使得计算机网络专业学生在原有专业基础上,掌握大数据和云计算的原理,具备云平台的管理能力,并能基于Hadoop等云计算平台实现大数据程序,对大数据进行计算分析。

2.4 Hadoop课程实施

通过以上分析可知,增加的课程内容主要是大数据、云计算相关课程,最终采用Hadoop云计算平台相关技术实现大数据的存储、计算与分析。通过理论教学,使得学生深入了解掌握大数据技术、云计算原理及Hadoop架构。通过实践教学,使得学生能够掌握Hadoop集群的配置与管理,并且能够基于Hadoop实现大数据程序设计,使得学生具备基本的大数据处理能力。因此Hadoop课程是核心课程。

2.4.1 Hadoop原理

Hadoop是把大数据集分发到计算集群中各个节点上共同处理以实现大数据的快速处理。用户无需了解分布式底层细节就可开发分布式程序,充分利用集群的威力进行高速运算和存储。Hadoop最核心的设计是HDFS文件系统和MapReduce编程模型。HDFS为海量数据提供存储,而MapReduce则为海量数据提供了计算。如图1所示,Hadoop运行的基本过程如下[4,5]:

(1)客户端可以将文件上传至HDFS文件系统,NameNode则会根据文件大小和Block大小配置将文件的物理属性分成若干个Block文件块,并分布式存储至DataNode数据节点,同时将块存储信息保存至NameNode节点,以方便文件进行资源管理。

(2)文件上传完成后,客户端提交具体Job任务至Hadoop集群,各DataNode节点根据任务要求可以读取相应的文件Split,并完成Map和Reduce计算任务,将结果作为输出文件传输至HDFS文件系统。

(3)在任务执行过程中,可以通过JobTracker、TaskTracker及ResourceManager监控任务的执行情况和资源消耗信息等。

2.4.2 Hadoop教学平台配置与部署

Hadoop教学平台需配置、部署一些部件。基于现有实验室的计算机和网络环境,网络服务器系统采用Linux Ubuntu,构建Hadoop集群网络。基于Cloudera Hadoop开源框架实现Hadoop教学平台。

2.4.3 Hadoop分布式文件存储及大数据处理实现

Hadoop分布式文件存储及大数据处理实现包括:HDFS文件系统的使用;HBase的使用;MapReducer程序实现;大数据案例分析与实现。

3 结 语

本文分析了大数据背景下高职计算机网络专业的培养目标和课程体系的改革思路,在优化计算机网络专业传统课程的基础上,增加大数据、云计算等相关课程,并以Hadoop课程的具体教学实施来培养学生的实践能力,使得学生能够紧跟大数据、云计算的技术步伐,满足工作岗位的要求。

参考文献

[1]赵伟艇,夏栋梁.基于岗位能力培养的云计算课程群知识体系构建研究[J].电脑知识与技术,2016,12(2):167-169.

[2]陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013(S1):142-146.

[3]孟小峰,慈祥.大数据管理概念技术与挑战[J].计算机研究与发展,2013,50(1):146-169.

[4]王铮.基于Hadoop的分布式系统研究与应用[D].长春:吉林大学,2014.

[5]陈吉荣,乐嘉锦.基于Hadoop生态系统的大数据解决方案综述[J].计算机工程与科学,2013,35(10):25-35.

[6]曾文英,吴积军,曾文权,等.基于云计算的IT课程体系改革[J].计算机教育,2014(17):40-44.

[7]鲍爱华,陈卫卫,刘鹏,等.云计算课程内容体系的建设与实践[J].计算机工程与科学,2014,36(A02):42-45.

云计算数据论文篇(3)

【 关键词 】 云计算;计算机安全;安全问题及对策

1 引言

随着计算机技术的不断发展,计算机网络安全问题一直是计算机行业一个重要的问题,本文就主要针对于云计算在计算机安全领域的影响和应用做分析,提出相应的一些解决措施。

2 云计算的概况

云是互联网和网络的一种比喻的说法,以前在图中经常用云来表示电信网,后来随之也用其来表示互联网和基础设施的抽象形态。云计算(Cloud Computing)是基于互联网的条件下,提供相关服务的增加、使用以及交互的模式,一般情况下会涉及通过互联网来提供动态、易扩展的并且经常是虚拟化的资源。狭义云计算一般是指以IT为基础设施的交付和使用的模式,通过网络以按需以及易扩展的方式来获得所需的资源;广义云计算指的是服务的交付和使用的模式,通过网络以按需以及易扩展的方式来获得所需的服务。这种服务可以是和软件、互联网、IT有关,也可以是其他形式的服务,其意味着计算能力也可以作为一种商品通过互联网来进行流通。云计算当前主要的构架是基于一个新一代的数据中心,以此来提供虚拟的计算以及存贮资源的功能,其中这些资源的使用以及消费,就可以按照先前的规定标准进行适当的收费,用户可以随时地通过互联网进行资源的消费,为用户提供方便。

3 基于云计算背景下计算机安全问题分析

云安全问题一直是一个研究的重点和难点,云计算的安全性、可靠性以及其可控性的缺失,会给其使用者带来极大的损失。许多计算机安全的技术虽然也得到了大家的认可,并且也取得了不错的效果,但是其依然不能避免病毒的侵害、安全漏洞、信息的泄露以及恶意的攻击等安全问题。当前,基于X.509标准的PMI和PKI体系进行的数字加密技术、动态密码技术、SSL/TLS技术,以及各种防病毒、防DOS、防火墙等安全技术都被应用到云计算当中。

当前云计算的安全和集成问题还没得到彻底解决,其存在着一定的安全风险,主要的有七种:特权用户的访问、法规的遵守、数据位置的不确定、共享储存数据、数据的恢复、调查支持以及长期的发展等问题。

另外,云计算作为一个虚拟的网络平台,其安全问题也具有一些独特的性质,主要的体现在几个方面:首先,其所有用户的都是储存在外部的数据中心,需要针对其数据信息来进行加密的处理,以此来保障其安全性,同时还需要设置一定的控制访问和认证系统,以便于内部工作人员进行访问;其次,为了要保障其数据的安全,在受到攻击之后可以快速地使其数据得到恢复,需要对其进行储存,云计算数据一般来说都比较的繁杂并且数据量比较大,所以,要保证其完整性和一致性,在其储存的时候就需要采取冗余储存的方式,并且还要采用特定的方法对其进行其审计;第三,要想使云计算的计算机安全问题得到实时有效的保障,就需要对其进行加密处理和密匙管理,并且要将密匙是指成为实时改变的状态,以此来保障其不易被破解;第四,云计算的三个参考模型的基本理论基础是虚拟化,这是其不可或缺的一部分,但是虚拟化也同时为其带来了安全问题、管理方面的问题以及其虚拟机安全的问题。

4 基于云计算下计算机安全的保障措施

4.1 明确云计算业务的定位

云计算所包含的业务的种类是复杂并且多变的,要加深对其发展的深入研究,看是否可以将其归类成为某一类的电信业务,看其是否可以归纳入或者是调整《电信分类目录》,并且要建立健全相应的市场的准入以及其监管的力度,规范云服务的良好的发展。

4.2 制定相应的法律法规

要根据云计算技术的发展以及其业务的模式,尽快地制定出相符合的法律法规以及其技术规范,例如出台数据保护法、明确云计算服务提供商信息安全管理责任、制定用户使用的日志留存规范等。以此来规范云计算市场,加强其监督力度,保障其在一个良好的环境中发展。

4.3 建立有针对性的技术监控手段

要针对云计算技术以及其业务的特点,建设有针对性的技术监控手段。云计算在计算机行业的应用,进一步地降低了互联网业务的开发以及其应用的门槛,并且使信息的传播渠道更加的便捷、低廉,所以要建设相对应配套的技术管控手段,比如业务开发审计系统、违法网站应用定位和处置系统等,以此来对其进行有效监控。

4.4 建立云计算服务分级分类的安全管理制度

要根据云计算的特点,将云计算按照其使用的范围、对象以及其业务模式的规划分为不同的安全等级要求,比如,根据其使用范围可以划分成公有云、私有云以及混合云等;根据其使用的对象灰分成为面向政府、企业和普通用户进行云服务;根据其业务模式划分为提供基础设施资源、信息以及软件的云服务,并且要根据不同的安全等级制定出相应的安全防护标准以及等级保护制度。同时还要建立诚实可信的第三方公共服务平台,比如,政府创建的公共云服务平台,分级进行安全管理,保障其使用的安全性。

4.5 提升其自主创新的能力

要加大力度培养国内云服务市场,加强对云计算核心硬件的研究开发力度,减少核心设施以及关键领域技术产品对于国外产品的依赖,国家要自主开发软、硬件,提升自主创新能力,积极地参与到云计算国际标准的制定,提升自身科技含量,加快该行业的发展。

5 结束语

云计算技术在计算机行业的应用,很大程度上推动了计算机行业的发展,想要其更加实用,就要对其存在的安全风险有一定的认识,并且要采取相应的措施,以此来保障计算机安全,促使计算机行业健康快速地发展。

参考文献

[1] 梁宏.云计算与计算机安全[A].全国计算机安全学术交流会论文集(第二十三卷)[C],2008(10):19-24.

[2] 石红.基于云计算概念的企业信息化模式研究[A].第九届全国会计信息化年会论文集(上)[C],2010:17-23.

[3] 潘松柏,张云勇,陈清金,魏进武.云计算安全需求和策略[A].2010年全国通信安全学术会议论文集[C], 2010:46-54.

[4] 张勇.云计算环境下软件工程模式初探[A].第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C],2009:91-97.

[5] 涂艳丽.云计算及在IT支撑系统中的应用[A].中国通信学会第六届学术年会论文集(上)[C],2009:41-48.

[6] 黄华军,钱亮,王耀钧.基于异常特征的钓鱼网站URL检测技术[J].信息网络安全,2012,(01):23-25.

[7] 黄世中.GF(2m)域SM2算法的实现与优化[J].信息网络安全,2012,(01):36-39.

基金项目:

国家自然科学基金资助项目(60963007)、福建省教育厅科技项目(JB11251)。

云计算数据论文篇(4)

关键词:GIS软件工程 云计算 工程模式 虚拟化

中图分类号:TP393 文献标识码:A 文章编号:1672-3791(2014)10(c)-0040-01

伴随着互联网在人们工作和生活中的普及,云计算技术的发展日臻成熟,传统的以因特尔和以Windows为平台的网络商业运营模式已经不能满足现代人的发展要求。反之,云计算技术正以其强大的数据处理能力获得了巨大的发展空间。

1 云计算的基本概念

云计算技术是在互联网发展的基础上诞生的一项数据管理技术,它将复杂的数据处理过程分割成为若干个子程序,由云计算下的多个服务器进行分析再反馈给用户的数据处理系统。其强大的数据分析处理能力可以为用户提供更为方便快捷的服务,有效节约时间和精力。从狭义的角度看,云计算就是指在IT行业发展的基础之上的模式与交付,它通过网络资源获得所需要数据资源。

2 云计算技术的特点

2.1 虚拟化程度高

云计算通过互联网实现了功能的全部虚拟化,用户无论在什么地方均可以通过网络终端享受服务。全部的服务信息资源均来自“云”,而并非实物操作,用户仅仅使用笔记本电脑或是智能手机就可以在任何地点通过网络获取应用服务。

2.2 规模庞大

随着互联网技术的迅速发展,云计算的服务器已经发展形成了庞大的规模,据统计Google公司的云计算服务器已达100多万台,而像搜狐这样规模的公司,云计算服务器也已经超过40万台。

2.3 可靠性好

云计算的可靠性是多种保护措施实现的,比如数据的多副本容错功能、计算节点的互换等。并且配备有专门的技术人员对数据库进行实时维护,保证存储信息的安全、稳定性,确保用户不受影响。

2.4 通用性好

云计算的推广范围很广,能够满足各类用户的服务要求,甚至同一云能够在同时为多个用户提供服务,并且可以构造出很多不同形式的应用,这为用户享受云计算服务提供了很大的便利性。

2.5 成本低廉

云计算采用的是集中自动化的管理形式,容错措施使用低廉的接点构成模式,这就在很大程度上降低了管理运营成本,减少了分摊到用户身上的管理维护费用。其良好的通用,可以为用户提供更加方便、廉价的服务,用户无需投入大量精力和财力就可以获得想要的资源。

3 GIS工程的基本概念和主要特征

3.1 GIS工程的基本概念

GIS软件工程指的是软件从概念定位、原理应用、技术落实到软件的开发与维护的整个活动过程。它涵盖GIS的规划设计、组织落实和功能评价等多项工作,还包含质量监管、需求控制、风险控制等多项技术,在此基础上形成GIS的数据信息管理和质量监管体系,实现数据处理功能的最优化。

3.2 GIS工程的主要特征

3.2.1 系统的复杂程度高

文档的数量和质量要求较高。GIS工程需要交付的文档涵盖工程系统的设计手册、用户指南、软件说明书、功能检测报告、空间分析报告等等,这些文档内容庞杂而且质量要求较高,对于管理人员工作要求很高。软件在微观上的复杂程度高。由于GIS工程涉及的信息量非常大、内部功能结构复杂,因此工程本身的长度及内部结构管理都是非常复杂的工作。理论研究的难度大。GIS工程是基于虚拟化的云计算技术发展的,在空间理论方面极为复杂,不易理解。

3.2.2 对于数据的处理要求特殊

数据质量要求严格。GIS工程对于输入数据的质量要求是很高的,如果数据存在问题则容易引起系统功能的故障或是运行崩溃。数据的时效性。GIS软件工程内部的数据信息更新换代非常快,这样才能满足网络时代海量信息资源的发展要求,如果数据陈旧就无法满足工作需要,因此时时的信息采集工作是建设GIS软件工程所必须要做的。

4 基于云计算的GIS软件工程模式

4.1 GIS软件工程的结构模式

云计算技术的发展为GIS软件工程的发展提供了极大便利,上面已经提到云计算技术具备庞大的数据存储量、可靠性高、通用性好等优势。这些技术优势使得GIS软件工程的结构模式得以进一步优化,具体的来说,云技术下的GIS软件工程会充分的运用云端所提供的构件进行革新,而传统的GIS构件是不能与之相提并论的。由云端提供的庞大数据信息量以及地图检索服务可以为GIS软件更新服务工程,满足不同读者需要提供可能。

4.2 GIS软件工程的组织模式

传统的GIS软件生命周期呈串行模式,可是在云计算技术的推动之下,GIS软件工程的生命周期也将发生大的变化,逐渐呈现为多重的螺旋模型发展趋势。GIS软件工程的研发具有开放性和阶段性的特点,在软件开发的各个阶段需要大量工作来打基础,为了克服研发弊端,对于GIS构架的设计可以吸收借鉴其他的成功经验,选择较为完善的构件和代码,这样对于推进组织模式更新具有重要作用。

4.3 GIS软件工程的管理与维护

在云计算技术下构件的GIS软件工程具备很大的灵活性和便捷性。在产品的研发过程中软件的管理和维护也在同时进行,改变了传统的先开发后维护的工作方式。一般在软件的初期研发阶段仅能完成少量的部署工作,可是随着云计算技术的介入和发展,可以有效的减少各个软件工程的耦合系数,确保各种构件均能实现联动或单独的自由管理模式,像客户端、服务端和管理端等等部分均可实现管理方式的优化。

5 云计算条件下的GIS软件工程应用

云计算技术自身具备很强的数据管理能力,可以有效的降低管理成本,这为GIS软件工程的研发单位节省了很大一笔研发资金。但是在进行GIS软件工程研发的初期,服务商需要投入大量的硬件和软件设施,同样是一笔较大的投入,所以假如能够改进原有的设备用于研发则可节约很大一部分投入。在软件开发过程中应注意选择品质有保证的应用软件,并成立云计算技术的专业管理部门,负责管理现代云计算技术和GIS行业在开发中存在的矛盾。这就能更加有效地实现云计算条件下的GIS软件工程发展。

6 结语

综上所述云计算技术发展下的GIS软件工程技术具备良好的发展条件,在工程体系建设、组织模式和管理与维护等方面,较之以往的技术有了很大改进。为了加快GIS软件工程的发展,我们应积极的利用云端庞大的数据信息资源获得自身发展所必须的资源。

参考文献

[1] 周鹏,尹菲.基于云计算技术的GIS软件工程模式[J].测绘通报,2010(11):22-24.

云计算数据论文篇(5)

关键词:云计算;混沌理论;Hadoop平台;DES算法;RSA算法

中图分类号: TP391.9 文献标识码:A

Abstract: This paper introduces the characteristics of cloud computing and the Hadoop distributed computing framework, and studies the hybrid encryption algorithm which introduces chaos theory into the cloud computing. Firstly, the traditional encryption algorithm DES and RSA are analyzed, and the defects of the two in the cloud computing are described. A chaotic hybrid encryption algorithm (CDR) is proposed by introducing the chaos theory. The algorithm generates random chaotic sequences by Tent mapping, and converts it to the initial key, and then mixed with DES and RSA algorithm to encrypt and decrypt the data, which effectively improves the efficiency and security of the algorithm. Finally, experiments are conducted on the Hadoop platform, in which a cluster simulation cloud environment is built, through horizontal comparison of the experimental results with DES and RSA algorithm, the CDR algorithm is proved to be more suitable for data encryption in the cloud computing environment.

Key words:Cloud Computing;Chaos Theory;Hadoop;DES;RSA

1 引言

云算作为一种应用于互联网的新兴的计算模式,将基础资源设施、应用系统、软件平台等作为服务提供给用户[1]。云计算也是一种以虚拟化为基础的架构方式,能够将资源虚拟化并构建规模较大的资源池,对外以服务方式进行管理。

随着云计算的发展,海量的用户数据和大型数据被放入云计算系统中,由于云计算分布式及虚拟化的特点,用户不能直观的确定数据的存储位置和划分情况等,所以数据的安全问题就变得非常重要。对传输数据进行加密处理是目前最直观最可行的保障数据安全的方法。目前有很多成熟的加密算法基本能够保证加密密文不被轻易破解,例如本文讨论的RSA算法。但是,由于云计算提供的服务主要面向互联网用户,在目前带宽成本和配套设施的限制下,要保证云计算的服务速度,对加密算法的效率就提出了较高的要求,RSA算法密钥生成较为复杂,对云计算中的大型数据加密时间较长,不适合应用在云计算中。

DES算法提出较早,是一种典型的对称加密算法,DES最大的优势在于软硬件上实现起来较为简单,执行速度较快,从效率角度出发适合应用在云计算中。但是较RSA算法而言,仅64位的密钥长度,在目前计算机硬件发展水平下,存在被暴力破解的可

能,从安全性上不适合应用在云计算中。

本文从改进RSA和DES算法在云计算中的缺点出发,提出一种适合云计算的混沌混合加密算法(CDR)。该算法引入混沌理论,通过混沌映射变量的随机性和遍历性对初始密码优化,同时对RSA和DES两种算法进行混合。提出算法对明文通过效率较高的DES算法进行加密以保证云计算下的效率,对通过混沌映射得到的密钥进行RSA算法加密传输,以保证云计算中的安全性。

最后通过搭建Hadoop云平台,创建集群模拟云计算环境。通过MapReduce执行CDR算法进行数据加密解密实验,通过对明文数据不同大小的划分,测试了提出算法在云环境下的表现,并且横向对比了RSA和DES在相同实验环境下的数据,从执行效率及安全性角度证明CDR算法更适合于云计算的要求。

2 Hadoop框架分析

Hadoop是Apache基金会所开发的一种分布式计算框架,非常适用于云计算环境,可以对海量的数据提供存储和计算[2]。Hadoop框架最核心的设计就是分布式文件系统(HDFS)和并行计算框架(MapReduce)。HFDS负责对数据进行分配和提供存储,MapReduce负责对数据提供计算。

2.1 HDFS系统

HDFS本质是一种分布式文件系统,它可以将一个大的数据进行划分,形成若干小的数据集,并对其进行备份,分布存储于云环境中的不同节点上。但对于单个用户来说,HDFS就好像一个传统的分级文件系统,在使用时可以像操作单个文件一样对大数据进行操作[3]。

HDFS框架是基于一组特定节点构建的,这些节点包括唯一的一个NameNode,用来提供元数据服务,指导计算节点和数据节点处理所分配的任务;多个DataNode,主要为HDFS提供存储块,并进行分布式文件的读写操作。Hadoop平台中数据冗余为三,每一块数据对应存储在三个DataNode之中。

在云计算环境中,HDFS通过以下措施保证海量数据的可靠存储。DataNode定期给NameNode发送“心跳”报文,并发送数据块列表信息,判断该节点是否正常;提供安全模式,在该模式下只提供只读视图,不允许进行增删改操作;记录详细的日志文件;对用户所取数据进行完整性检测[4][5]。

2.2 MapReduce框架

MapReduce 是一种并行处理大数据集的软件框架。MapReduce是基于函数性编程中的 map() 和 reduce() 函数,对应计算过程中的映射和规约。Map过程中接受一组数据并将其转换为键/值对列表,然后对其进行传输和重新排序。Reduce过程对Map过程产生的中间结果进行处理整合和排序,进而形成最终结果。

3 DES及RSA算法分析

云计算中数据量非常大,并且往往分散在不同的计算节点上,安全性的保障显得至关重要,通过加密算法对数据进行加密和解密是保证数据安全的最有效方法之一。对称加密算法DES和公钥加密算法RAS都是成熟并且被广泛应用的加密算法,这里对这两种算法进行分析,并指出其二者在云计算中应用的优缺点。

3.1 DES算法

DES算法执行过程中,对明文以64比特进行分组,最后一组不满64比特的按照特定方法进行补齐,密钥长度为8个字节,但有8个比特位为校验位。在加密阶段,首先通过初始置换将明文分为32位的两部分,用左半部分和右半部分代表。然后进行16轮运算,对数据和密钥进行结合。在每一轮运算中对密钥进行移位,在选取密钥56位中的48位,将右半部分的原始32位通过扩展置换为48位,然后进行异或操作和48位密钥结合,再通过S盒将此48位转换为32位,然后再与左半部分原始32位进行异或操作。最后通过逆初始置换,得到最终的密文。算法流程图如图1所示:

作为对标准DES算法的改进,Tuchman提出使用两个密钥的三重DES加密方法,该方法使用两个密钥,执行三次DES算法。加密的过程是加密―解密―加密,解密的过程是解密―加密―解密。两个密钥组合有效长度有112比特,有效的提升了DES算法安全性。以 表示明文,以 代表密钥,以 代表密文,设EK()和DK()代表加密和解密的方法,则3DES算法的过加密解密过程如下所示:

加密:

解密:

3.2 RSA算法

RSA算法通^大数难以分解的数学问题保证其安全性,密钥长度也远高于DES算法,达到1024位。RSA是一种能够抵御目前绝大多数密码攻击的公钥加密算法,其密钥产生及加密解密流程如下:

(1) 产生两个大素数 和 , ;

(2) 计算 ,根据欧拉公式 ;

(3) 随机选择满足 的 作为公钥;

(4) 计算 ,以 作为私钥;

(5) 对明文按式 进行加密;

(6) 对密文按式 进行解密;

3.3 云计算中DES和RSA算法的不足

随着云计算能力不断提高以及计算机硬件的快速发展,对于DES加密算法而言,加密速度快是它的优势,比较适合处理云计算中的海量数据。但是DES最大短板就是密钥太短。密钥长度64位去除8位校验位,实际有效位数仅56位,若采用穷举法进行破解的话,只需要计算 种可能,特别是采用云平台的计算能力,在短时间完成破解密钥已成为可能[6]。3DES算法虽然通过多次解密解密进行了改进,但是由于其基本算法仍然沿用DES算法,所以在安全性上也不能完成保证被破解的可能。

对于RSA算法而言,其密钥长度最高达到1024位,并且公钥算法安全性本身要强于对称加密算法。采用穷举法进行强行破解的可能性很小,可以说是目前较为安全的加密算法。但是RSA算法缺点是加密过程每次要产生大素数,密钥产生异常复杂耗时,导致算法执行时间远高于DES算法,不适合在云计算中对大型数据进行加密。

4 混沌混合加密算法(CDR)研究

混沌是一种典型的非线性现象,能够按照自己规律,在一定范围内无重复遍历全部状态[6]。典型混沌特征包括:随机性、规律性、遍历性和对初值敏感性等。混沌通常指由确定性方程得到的随机运动状态,常见的混沌系统有Logistic映射、Tent映射、Chen系统、Lorenz系统等[7][8]。本文综合DES和RSA算法的优缺点,引入混沌理论,通过Tent映射生成密钥,提出一种混沌混合加密算法(CDR),该算法综合了DES和RSA算法的优点,并且进一步提高了算法执行效率和安全性。

4.1 Tent映射

Tent映射也称帐篷映射,它和Logistic映射目前被广泛使用,较Logistic映射而言Tent映射产生的混沌序列对初值较不敏感,分布较均匀[9],本文采用Tent映射作为混沌信号发生器。其表达式为:

(1)

4.2 算法原理

CDR混合算法原理为:首先通过Tent映射产生随机混沌信号,然后通过数学转换生成DES算法密钥,此举利用混沌系统的随机特性可以提高密钥的安全性和加密速度;然后通过此密钥利用3DES算法对明文进行加密;再通过RSA算法对混沌系统产生的密钥进行加密,将加密密钥和密文发送接收方;接收方通过RSA解密得到3DES密钥,由于3DES为对称加密算法,接收方通过此密钥可对密文进行解密。算法流程示意图如图2所示:

4.3 混沌密钥生成策略

通过Tent映射生成混沌密钥过程如下:

(1) 随机产生0到1之间的随机数 ,根据DES算法密钥长度确定迭代次数n=64;

(2) 将 和n代入式1,通过Tent映射产生长度为64的混沌序列 ;

(3) 对序列 按 进行重写,得到整数序列I;

(4) 对I表示为对应64位二进制形式K,即为DES算法密钥;

4.4 CDR算法分析

混沌混合加密算法(CDR)综合了DES算法和RSA算法的优点并加入混沌理论进一步改进,针对云计算特点算法优势从以下几个方面分析:

(1)引入混沌系统的优势。利用混沌运动的非线性、随机性和有界性对初始密钥进行生成。使密钥也具有了混沌的随机特征,同时使该算法在获得等价安全强度下节省了密钥长度,提高了密钥传输的安全性,增强了密钥敏感性。

(2)算法效率优势。DES算法实现过程较为简单,能够快速通过软件或硬件实现,比较适合处理云计算中的大型数据。而RSA由于每次加密过程要至少产生512比特的大素数,密钥生成策略既复杂又耗时,很难做到一次一密。所以RSA算法在云计算环境中对大型数据加密速度是远高于DES算法的。CDR算法主体加密过程遵循DES算法,仅对混沌产生的密钥通过RSA进行加密传输。所以CDR算法的加密解密效率靠近与DES算法,要优于RSA算法。

(3)安全性优势。DES算法实现上虽然较为简单高效,但是由于密钥位数较短,存在被暴力破解的可能。所以在密钥的传输和管理上会消耗较多的系统开销。一般的做法为在通信前对密钥进行秘密分配,不定期进行密钥的更换,对不同数据也需要更换密钥。但是在CDR算法中,通过RSA算法对64位的密钥进行加密传输,根据前文分析,RSA算法目前可被认为是绝对安全的一种加密算法,所以很难破解RSA算法进而获得初始DES算法密钥,也省去对普通DES算法密钥的管理过程。

5 Hadoop平台实验

5.1 实验平台配置和搭建

本次实验在Java环境中配置SSH框架,实现Hadoop平台搭建集群模拟云环境,集群由6台计算机组成,其中一台配置为“CPU I7-4790,8G内存,主频3.2GHZ,1T硬盘”作为NameNode,扮演Master和JobTracker的角色。为了更好模拟云环境,其余五台计算机选取实验室中配置各不相同的五台机器,作为Slave和DataNode,即云计算中的计算节点。

因为云计算中最大的优势就是处理大型数据的存储和计算,所以本次实验选取了大小为1116.92MB的文本文件作为实验数据,在Hadoop平台下进行加密解密实验。测试CDR算法的性能,并横向对比DES和RSA算法。

实验执行加密过程步骤为:

(1) 首先将需加密明文文件放至HDFS分布式存储系统。

(2) 对整体明文文件根据不同的数据块大小进行切分,以作业形式分发至集群中的计算节点。

(3) 重写map()函数,调用算法实现代码,实现对明文的加密过程。

(4) 通过reduce()过程对所有作业结果进行整合得到最终密文。

实验解密流程和加密流程类似,此处不再重复阐述。

5.2 实验结果

MapReduce对数据进行计算默认以64MB为单位划分数据块,为了更直观的表现算法性能,试验中分别设置了64MB、32MB、16MB、8MB、4MB和2MB的文件分块大小。分别测试CDR、DES和RSA算法。进行10组加密实验和10组解密试验,取算法的平均执行时间,实验结果如图3和图4所示。

由图3和图4可分析得出,在Hadoop平台中,原始数据的分块大小对三种算法的执行效率都存在类似的影,从64MB分块值变化至32MB或16MB分块值时三种算法执行效率最高,若继续减小分块值特别是当分块值为2MB时,三种算法执行时间都急剧上升,这是因为当数据块单位过小,分块数量就会激增,在MapReduce计算中,Reduce过程对Map过程产生的结果进行整合排序的时间就越长。所以在云计算中,对大型数据的划分应取适当的单位,否则会影响计算时间。

为进一步横向比较三种算法执行效率之间的量级关系,取执行效率最高的32MB数据块划分,算法执行一次对比三种算法加密时间和解密时间。如图5所示:

由以上实验分析得,通过RSA算法进行数据加密解密时间远高于其他两种算法,实验加密文本数据大小为1G左右,实际云计算中数据量要远大于此,RSA算法执行效率较低不适合应用在云计算中。CDR和DES算法比较,CDR算法执行时间略高于DES算法,但是实验环境为6台计算机搭建集群,实际云环境中计算能力会大幅度提高,而且随着加密数据量的增大,根据本文上节的分析,其二者的执行效率差距会进一步缩小。从安全性角度上考虑,CDR算法结合了RSA算法和混沌随机性的优点,安全性要远高于DES算法。综上所述,CDR算法是一种兼顾效率和安全性的算法,更加适合于云计算。

6 结论

云计算作为一种有广泛前途的商业计算模式,建立在将大量资源虚拟化的基础上,可以对大型海量数据进行计算和管理,根据用户对作业量的需求提供服务。本文讨论了云计算环境下的加密算法问题,分析了DES和RSA算法在云计算环境下的不足,结合混沌理论提出了一种混沌混合加密算法,通过搭建Hadoop实验平台,结合实验结果分析证明该算法从效率和安全性上都进行了改进,更加适合于云计算环境。

参考文献:

[1] 孟湘来.基于云计算的数据中心构建探析[J].中国企业教育,2012(22):240-241.

[2] 刘正伟,文中领,张海涛.云计算和云数据管理技术[J].计算机研究与发展,2012,49(z1):56-27.

[3] 崔杰,兰红星,李陶深.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49:12-18.

[4] 王鹏,董静宜.一种云计算架构的实现方法研究[J].计算机工程与科学,2009(S1):11-13

[5] 王意洁,孙伟东,周松,裴晓强,李小勇.云计算环境下的分布存储关键技术[J].软件学报, 2012,23(4),962-986..

[6] 张京华,陈谊.一种混沌加密算法的设计与实现[J].北京工商大学学报,2004,4(22):33-35.

[7] 陈全,邓倩妮.云计算及其关键技术[J].计算机应用,2009(9):2563-2564.

[8] 侯佩,寇雅楠,黄利斌.混合加密体制在数字签名中的应用[J].计算机工程与计,2011,32(6):1942-1945.

[9] 陈树平,侯贤良.计算机网络中DES 数据加密与解密技术[J].现代电子技术,2005,200(9):114-115.

[10] Li Jingwei,Jia Chunfu,Li Jin,Chen Xiaofeng,Outsourcing encryption of attribute-based encryption with MapReduce[C].Information and Communications Security-14th International Conference, ICICS.2012:191-201.

[11] G.Sudha Sadasivam,G.Baktavachalam.A novel approach to mutiple sequence alignment using hadoop data grids[C].Proceedings of the 2010 Workshop on Massive Data Analytics on the Cloud,2010:472-483.

[12] Bilu Y,Hanrot G,Voutier P M.Existence of primitive divisors of Lucas and Lehmer numbers[J].Journal fur die Reine und Angewandte Mathematik,2001,539:75-122.

[13] Choi J, Reaz A, Mukheijee B. A survey of user behavior in VoD service andbandwidth-saving multicast streaming schemes. Communications Surveys &Tutorials, IEEE, 2012,14(1): 156-169.

[14] Agrawal M,Kayal N,Saxena N.PRIMES is in P[J].Annals of mathematics, 2004:781-793.

基金目

国家自然科学基金项目:基于GIS的高校学生结核病防治管理体系及信息系统构建与应用研究,编号:71373203,项目负责人张少茹

作者简介:

第一作者:战非(1981.11),男,汉族,陕西西安,计算机软件工程专业硕士,西安航空学院计算机学院教师、讲师。研究方向:软件工程、通信工程、软件开发、移动互联网应用。

第二作者:张少茹,女,汉族,陕西韩城,博士,西安交通大学教授,博士生导师。研究方向:慢性病、传染性疾病防治管理。

联系方式:

云计算数据论文篇(6)

关键词:云计算;图书馆;电子资源

基金项目:河北省教育厅青年基金“云计算环境下华北地区高校图书馆电子资源存储及服务模式研究”研究成果之一(课题编号:sq124012)

中图分类号:tp 文献标识码:a

原标题:云计算环境下的高校图书馆电子资源建设

收录日期:2013年4月1日

一、云计算的涵义

云计算从2007年被提出以后,就一直是国内外网络技术与服务研究的热点。云计算的研究具有多面性,国内外关注的视角也有差别。国外的研究主要有信息技术、信息行为和综合研究等几种视角,国内主要是从信息技术理论探讨和技术实现视角研究云计算,相对来说,云计算技术的基础理论研究备受关注。

云计算,是指基于互联网的超级计算模式。即把存储于个人电脑、移动电话和其他设备上的大量信息和处理器资源集中在一起,协同工作。云计算的基本原理是,通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,图书馆数据中心的运行将与互联网更加相似。这使得图书馆能够将资源切换到需要的应用上,根据需求访问计算机存储系统。

从技术层面上讲,云计算基本功能的实现取决于两个关键因素,一个是数据的存储能力,另一个是分布式的计算能力。因此,云计算中的“云”可以再细分为“存储云”和“计算云”,也即“云计算=存储云+计算云”。“存储云”是一个大规模的分布式存储系统。“存储云”对第三方用户公开存储接口,用户可以根据自己的需要来购买相应的容量和带宽。“计算云”包括并行计算和资源虚拟化。虚拟化最主要的意义是用更少的资源做更多的事。在计算云中引入虚拟化技术,就是力求能够在较少的服务器上运行更多的并行计算,对云计算中所应用到的资源进行快速而优化的配置等。

二、电子资源

电子资源是电子信息资源的简称,与数字资源基本同义,是指所有以电子数据的形式把文字、图像、声音、动画等多种形式的信息存贮在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源,需要借助连接在计算机上的外围设备阅读的文献。包括光盘数据库(网络版和单机版)、网络数据库或联机数据库、电子图书、电子期刊以及internet信息资源,包括web站点、电子讨论组、邮递表、新闻组、公告栏等。

电子资源包含以下基本要素:以数字化形式存在;代表了数字对象的集合;需通过一定的设备才能获取;经过人类的开发组织。电子资源具有内容丰富、形式多样、出版更新快、查找使用方便等特点,作为一种新型的信息资源,它日益受到人们的青睐,已经成为图书馆馆藏资源建设的重要组成部分。

高校图书馆馆藏电子资源的形式主要包括以下几种:(1)购买或租赁的电子资源,主要指由出版商或数据库商生产发行的、商业化的正式出版物,包括数据库、电子期刊和电子图书等,其中数据库又包括参考数据库(书目、文摘、索引)、全文数据库和事实数据库;(2)自行开发的特色数据库,如河北联合大学图书馆建设开发的煤矿创伤文献数据库;(3)学科导航,即围绕某个学科(专业)对互联网上的资源进行整序和重新组织,并向馆内外读者提供信息服务,提供重要学术网站和免费学术资源的导航。

三、云计算在高校图书馆电子资源建设中的应用

(一)云计算为高校图书馆电子资源建设带来了更为方便、快捷、安全的服务。云计算给高校图书馆电子资源建设提供了最可靠、最安全的数据存储中心。我们不用再担心数据丢失、病毒入侵等麻烦。很多人觉得数据只有保存在自己看得见、摸得着的电脑里才最安全,其实不然,你的电脑可能会因为自己不小心而被损坏,或者被病毒攻击,导致硬盘上的数据无法恢复,进而让有机会接触你的电脑的不法之徒则可能利用各种机会窃取你的数据。然而,云计算严格的权限管理策略可以帮助你放心地与你指定的人共享数据。这样,你不用花钱就可以享受到最好、最安全的服务,甚至比在银行里存钱还方便。

(二)云计算可以轻松实现电子资源在不同设备间的数据与应用共享,可以轻松实现馆与馆的数据共享。目前,高校图书馆的设备具有多样化和复杂化等特点,云计算考虑到不同设备的数据同步方法种类繁多,操作复杂,要在这

多不同的设备之间保存和维护最新的一份联系人信息,各馆需要为此付出难以计数的时间和精力。这时,我们就应用云计算来让一切都变得更简单,在云计算的网络应用模式中,数据只有一份,保存在“云”的另一端,你的所有电子设备只需要连接互联网,就可以同时访问和使用同一份数据。这样可以达到各馆数据更深一层次的共建共享。

(三)电子资源建设馆之间开展云计算服务,可以共享软、硬件资源,节省存储空间。随着图书馆馆藏资源数量和种类的增加,各级各地图书馆都不同程度地面临着资源存储空间不足、网络传输速度缓慢、数据库更新及设备维护工作成本高等困境。云计算技术的推广和应用为图书馆解决困境提供了良好的技术和办法。高校图书馆电子资源建设可以开展云服务,购买自动化集成系统、数据库建设软件,部署在数据中心或硬件条件较好的图书馆,通过租用的方式为成员馆提供服务,充分利用电子资源建设内的软硬件资源,中小图书馆以较小的成本就可以使用自动化集成系统进行管理或者建设自己的特色数据库。

云计算模式的出现,给高校图书馆电子资源带来了机遇,同时也使我们对未来云计算在图书馆电子资源建设中的应用产生无尽的遐想,把云计算运用到高校图书馆中,不但可以提高资源的利用率,节约各成员图书馆的资源,也可以给云计算带来一个新的应用领域。目前,虽然云计算的应用还处于探索阶段,相信随着云计算在其他领域的成熟应用,必定在图书馆中也有一番作为。

主要参考文献:

云计算数据论文篇(7)

关键词 云计算过程;个人数字图书馆;动态资源供应

中图分类号G271 文献标识码A 文章编号 1674-6708(2011)48-0038-02

在信息化时代,计算机技术得到长足的发展,各类信息管理技术与数据检索系统的发展非常迅速。随着时间的推移,包含海量应用数据的数据库系统在现代社会中发挥着越来越重要的作用。动辄数十万的数据量使得数据库检索速度与查询结果的可靠性越来越难以得到有效的保证,数据库的优化逐步成为数据库系统管理的一个主要方面。针对优化数据库搜索查询功能的瓶颈,云计算被大多数数据库运用到系统个人数据的管理中,本文将对此做一个深入的探讨。

1 当前我国互联网数据管理发展现状及云计算的基本概况

众所周知,数据库系统的核心是信息管理,基本工作包括联机的分析处理、联机的事务处理、突发事件的应对等,是计算机技术在具体的社会活动中得到运用的一个重要表现。大型的数据库管理系统在对企事业单位、金融机构、政府工作部门等进行高速信息化管理的同时,高速的增长信息量影响数据库系统的检索速度和响应效率,要提高系统的终端信息处理的管理性能与效率,云计算应运而生。数据量处理要求与五年前的相比呈现出几何级数的增长趋势,这就对终端电脑提出非常高的要求,“云计算”对个人终端的处理能力有着划时代的改革意义。云计算是一种分布式的处理、并行处理和网络计算的综合发展,当你把个人信息上传到互联网相册、在优酷等视频网站上看电影、将大量的数据保存在网络邮箱时,就都是云计算的使用,可以说云计算正在不知不觉中影响着我们的生活。根据可靠数据显示,五年之内,中国的互联网用户在数量上应该会实现翻倍增长。规模如此大的用户群,我们网络的工作面临的是一个以视频流和电子商务等做处理的知识经济时代。

很明显,在实际的数据应用环境下,具体的个人数据应用情况是我们选择系统的设计与优化方案最基本的根据。而且,考虑到很多优化策略的实施有着非常大的制约作用,实际的应用过程中还必须综合地考虑到问题的不同方面。传统的网络数据管理系统的运用,大多是装在个人用户端,进行独立运行的。但是,我们今天则一般通过互联网服务于大规模数据的集中来实现这个功能,而且不在再是只有大的企业才有条件使用数据中心,广大的中小企业和个人消费者也开始应用。

所谓的云计算就是一种利用规模较大的数据中心或者超级计算机的集群,再通过互联网络将计算资源以免费或者按需租用的方式为使用者提供方便的方式。云计算的应用就是一种将网络内的力量集中起来,为网络中的每一位成员来使用。从最基本的意义上来说,“云计算”就是应用互联网上已有的软件与数据为个人用户所用。可以说,我们要缩短个人数据管理所投入的时间、提高其管理效率、进行数据库的优化,最重要的就是对系统的内部资源进行合理的优化和分配,要取得数据库执行性能实质性的提升和系统管理有效的简化,关键在云计算的运用。只有这样才能更加充分地利用到管理系统为我们提供的科学高效服务。

2 基于云计算的个人数字图书馆建设的优势和不足分析

个人数字图书馆信息系统的数据量极大,运行一段时间后会就会出现诸如系统速度太慢、管理系统死锁等一系列问题。海量的个人数据集中导致网络数据容量的不断增大,但是运用云计算就可以实现个人数字档案的在线文件夹和文件存储的功能。云计算不仅可以为用户提供安全可靠而又经济方便的数据存储中心,而且云计算因为其对用户端的设备没有很高的要求,可以很好地避免数据丢失、系统病毒入侵等不必要的麻烦。

同时,云计算还可以在不同的设备间实现数据与应用的共享,从而基本上将信息的孤岛现象消除了,可以让人们使用更加方便的网络服务。云计算可以很好地弥补个人电子设备无法无限量地提供存储空间与计算能力这个缺陷,它可以在另一端结集数千上万台服务器,组成一个庞大的集群为个人提供潜力无限量的存储空间与计算能力。

然而,我们也应该看到现阶段的云计算还存在一定的不足。云计算设立的根本用意在于建构一个供用户来共享的资源池,以减少用户的成本,提升使用的灵活性,但是在云计算的应用中也会随之伴随着一定的安全风险。这种风险在当前没有出台体系的安全模式构架与统一标准时是不可避免的。而且云计算系统内的用户无法明确知道其私密数据在云上的存储位置,其私密性与安全性有待加强,在个人的个性化服务方面也还难以尽如人意。

3 运用云计算建设个人数字图书馆

3.1 个人数字图书馆建设的基本概况

个人知识数据的管理包括5个基本的环节:个人知识的创造与整合、个人的知识加工和编码、个人知识转移和扩散、个人知识共享和交流、个人组织知识的创新。不同的个人数据就会有其不尽相同的优化过程,个人数字图书馆过程中差异性的把握往往依靠具体程序终端的操作经验,个人知识的增长过程就是在其长时间的记忆系统中存贮一定的信息内容的增长过程,它是对社会个体在实践中积累的一些具备个体的记忆价值与创新价值的信息资源进行的管理。这就导致个人数字图书馆的建设在极大程度上取决于实际的操作。

3.2 基于云计算的个人数字图书馆的建立构想

运用云计算在网络中建立个人数字图书馆,对于我们建立民生档案、集体档案、平民档案、集体档案等个人者集体档案有着至关重要的意义。我们可以针对网络上个人形成的信息化档案,配合使用传统档案组建起个人档案系统。这类信息档案的存储信息与对象都是原始性的,其创建与维护的信息是具备多样性、积极性和自觉性的。

4 结论

随着现代信息技术的迅猛发展,信息在表现形式上越来越丰富,我们构建个人数字图书馆已经离不开图像、文档、音频、视频以及软件等诸多多媒体的信息新形式。我们在个人数字图书馆应用系统的优化过程中,必须对云计算――一种全新型服务计算模式的积极运用做一个充分的分析,这些形式各异的信息可以对个人数字档案实现安全而有效的利用与管理,建立起一个使用起来方便、内容形式丰富、信息能共享的个人数字电子档案。

参考文献

[1]刘湘明,董大晖.云计算技术的分析与研究[M].北京:计算机知识与技术出版社,2006:146-250.

友情链接