您现在的位置是:首页电子技术论文

中文核心类期刊基础数据结构对大数据时代的价值与意义

发布时间:2015-11-12 10:32:50更新时间:2015-11-12 10:37:07 1

  现在的社会是个信息化社会,大数据科技的发展也是非常迅速的,随着智慧城市建设项目的开展,作为智慧城市建设的重要基础就是围绕大型基础数据平台的建设,在业界定义为大数据时代的来临。本文是一篇中文核心类期刊投稿的论文范文,主要论述了基础数据结构对大数据时代的价值与意义。
  摘 要:在大数据时代中,大数据的应用效能、应用方便度、应用当地覆盖面是未来大数据应用所关注的重点,而目前在大数据应用方面存在许多的问题,这些问题的存在影响了未来大数据的应用,如何解决这些问题,重现在开始从最基础方面开始,解决这些问题是大数据未来应用的重要工作。本文首先列举了目前大数据应用中存在的问题,分析了产生这些问题的原因,针对这种情况提出了基于基础数据结构体系建立的解决方案设想,为未来大数据应用发挥更大效益的解决方法。

  【关键词】大数据,基础数据结构,软件工程,数据标准

  围绕大数据的概念,在全国范围内的各领域各行业都在大数据的如何组织、如何应用、如何共享、如何关联召开了各类研讨会。大数据应用的云计算技术、数据仓库技术等成为业内讨论的重要话题。本人认为,在做了这些工作后,应回过头来看一看,无论数据量有多大,都离不开基础数据结构与体系的建设,在此要阐明的一个基本观点就是在大数据时代更应该重视基础数据结果的研究与应用。

  1 大数据的概念

  什么是大数据, IBM 最早的定义是:将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。

  在大数据概念中的第一条是数据量大,这是大数据的特点,而却随着信息系统应用的深入,数量的数量级也在不断的提高,这是毋容置疑的。我们在此要讨论的是第二条数据类型繁多的问题。

  2 目前大数据应用存在的主要问题

  随着信息化系统应用的深入,在社会、自然界、生活中所涉及的数据面越来越广,由此使得数据类型也越来越多,数据类型的数量在不断增加,这些数据类型之间的关系和相互关联性也越来越复杂,大数据量下的数据应用造成了困难。数据结构类型繁多造成问题主要表现在以下几个方面。

  2.1 数据类型是有限量的认识不清楚

  未来大数据情况下,数据类型是有限量的还是无限量的概念模糊,为此首先要么明确一个基本的概念,那就是,数据类型在繁多,但是数据类型的数量是有限量的,只是这个限量的数量级大一些而已。在数据类型是有限量的情况下,对于解决数据类型繁多的方法是完全不同的。

  如果数据类型的量是无限量的,那么解决问题的方法是要研究解决数据类型问题的方式是研究规律,拿出解决问题的方式与方法,对于具体数据类型时,按照方式方法理论与技术去解决问题。如果数据类型是有限量的话,那么解决问题的方式就不只是从理论上的解决问题方法,而应该更加切合实际的去针对每一种数据类型直接进行研究,形成数据标准,指导各个系统对每一个具体数据类型的应用。

  2.2 相同数据在不同系统中的表现类型繁多

  由于系统开发方各自的开发经验、所开发系统的规模不同,系统应用方对系统要求不同,系统应用行业的不同,使得在开发过程中,对于数据类型的定义只遵循本系统使用需要进行定义,没有完整的标准,即是有相应的国家或国际标准,也不能完全遵循。

  2.3 各个行业制定的标准相互矛盾

  各个行业在制定相应的标准时,是以满足自身需要为主导,造成了数据类型在其数据定义时不但长度不同,就是数据类型都不相同。这也就造成了各个系统在未来大数据应用中出现了严重的数据应用障碍。

  2.4 大数据应用的实现效率低

  由于不同系统技术数据结构的不统一,使得对于大数据的应用上要对不同系统的数据结构进行分析,构建关联,而后才能进行数据的应用,这项工作的工作量大,技术含量高,降低数据的应用效率。这些都是事后分析数据存在的问题。

  2.5 数据浪费巨大

  由于数据各个系统间数据结构的不同,加上分析手段的局限性,使许多的数据无法进行使用,由此也降低了数据的使用率。并造成数据的大量浪费。

  3 造成目前对大数据应用存在问题原因

  由于以上几方面的问题存在,为了做好大数据的应用,许多相应的技术应运而生,数据仓库技术、网格技术、云计算的数据处理技术等等。这些技术促进了数据应用的发展,提高了数据应用效率,为大数据应用发挥了巨大作用。但是这种做法只能针对具体的大数据应用项目起到作用,不能从根本上解决问题。那么造成这种问题根本是什么呢?

  3.1 理论基础有偏差

  目前所有这些高精尖技术的发展,为大数据应用的发展起到了不可替代的作用,但是这些技术在理论出发点上存在偏差,那就是,这些技术的理论出发点设定的是,数据类型是无限量的,是无穷尽的,所以所有的技术研究都不面对具体的数据项,这样做的结果是促进技术的发展,弊端是不能面对具体的应用,所有的技术应用都要在这就技术下进行二次应用研究。也就是,这些理论是治标不治本的做法。

  有限量数据类型与无限量数据类型是两个根本不同的概念,对于技术的发展影响也是完全不同的。为此,目前在无限量数据类型概念下的大数据应用技术与体系将会存在极大的局限性,对未来的大数据应用造成影响。

  3.2 对大数据认识有偏差

  目前在各个系统对大数据的应用中,对大数据的认识是,只要有足够量的数据,就是大数据,而对于数据之间的关系,整体的数据结构体系没有很深的认识,甚至将原有的多个分散的系统中的数据库,做一个小的关联数据库,就认为是数据云计算,就是综合数据平台了,而在这种情况下,对于大数据的应用,因为系统的独立,数据库的独立、数据结构的不统一造成了大数据应用的瓶颈和障碍,在系统应用到一定程度后,数据量是很大,但是无法进行大数据应用,或者说是要进行大数据的应用,需要另外投入很高的成本进行数据整理、数据管理和数据分析。所以应该明确的是,在数据结构混乱的情况下,在大的数据量也不能称为大数据,这个观念上的偏差,是造成目前数据应用困难的原因之一。   3.3 数据结构不规范

  这些情况的出现,归结的一起,就是数据结构不规范,不统一。在三方面主要原因造成这个局面,一是目前的应用系统的开发,由不同的公司进行,每个开发单位对数据结构的定义有各自的标准,基本都是按照多年开发经验总结出来的,因此各个公司开发的系统在数据结构上相差很远。二是对于同一个公司不同时期开发的系统所涉及的数据结构不统一,到后期,开发单位不愿意在投入成本对前期开发的系统进行重新开发,这就造成了前期开的的系统中的数据结构与后期开发的数据结构不统一。三是对于应用开发单位在开发每一个具体应用项目时,由于是不同的开发小组在进行,为此,在进行数据结构设定时,只为了满足本系统开发的需要,而没有考虑系统未来的发展和系统的整体架构,这也造成了不同应用系统中对相同字段的设定不相同,数据结构不统一。以上这些都是在应用系统开发过程中遗留的问题,而这些问题严重影响了大数据的使用。

  3.4 有统一的标准不用

  在系统开发过程中涉及的数据结构,许多都有相应的标准,主要有以下几个方面,一是国家法律层面的,对于一些重要的数据要求以立法方式进行规范。二是国家标准,制定和规范了国家层面的有关方面的数据要求和限定。三是部颁标准,由各个部委办局制定的相应标准,这些标准有一大部分直接针对信息化系统建设的应用和数据标准。四是行业标准,作为每一个行业内进行行为约束的标准,这种标准虽然不具备强制性,但是在行业内是一个自觉遵守的标准。四是国际相关标准,虽然国际标准没有任何的法律约束性,但是为了走出去,各行各业都在遵循这个标准。

  这些标准都是在系统建立时的数据结构依据,但是目前许多系统在进行数据结构设定时,都没有按照这些标准执行,而是根据自己系统的需要进行设定的。这使得许多的系统中的数据不能相互交换使用,由此而影响了大数据的应用。

  3.5 不同行业对标准的设定不统一

  在国家标准体系中,由于标准制定的年代不同,同是一个部门颁布的标准对相同的数据要求也不同,各个部门由于独立制定标准,同样出现相同数据在不同部门制定的标准中规定的不同,这几方面原因也就造成了即使遵照标准,也存在着相同数据在不同应用系统中的数据结构不同的现象。

  以上是大数据应用问题出现的主要原因,作为大数据应用的刚刚起步阶段,应针对这些问题进行研究给出相应的解决方案,为未来大数据应用的发展打下一个良好的基础,避免今后的大数据应用走弯路。

  4 解决大数据应用问题的对策

  解决大数据应用存在的问题,应从最基础的数据结构建立开始,从根本上去解决问题,也为未来大数据应用的发展打下一个良好的基本数据结构基础,对此提出以下几方面的对策。

  4.1 开展和加强对基础数据结构建立的理论研究

  从软件工程学的角度出发,以数据结构类型是有限量的概念为依托,围绕具体的数据类型开展数据结构体系的理论研究。依托一个数据结构分类的理论体系来支撑整个数据结构体系的划分,其中包括划分方法、划分层次、划分的软件工程学理论支撑等内容,制定大数据底层数据结构划分的理论体系,形成在大数据下的数据结构构建的理论体系。

  4.2 开展对具体数据结构的研究

  按照建立的数据结构理论体系要求,对每一个具体数据结构进行研究,针对数据项的名称、类型、含义、层次、结构、与其他数据的关系、涉及内容规定等方面制定出具体数据的标准。这项工作可以在有组织的情况下由全社会共同参与,按照指导理论的要求进行研究,这样,随着应用系统的不断深入,所涉及的数据类型项将逐步扩展,最终实现数据的全覆盖,而完成整个架构体系的建立。

  4.3 制定相应的数据结构标准
中文核心类期刊投稿

  对于由各个方面制定的数据结构进行分类、筛选、审核,而后想这些结构形成一个统一的架构体系,制定相应的技术标准,通过这个标准来规范应用系统的开发,形成完整的、规范的、统一的数据结构体系,为大数据应用打下坚实的基础。

  4.4 成立相应的机构来负责这项工作的完成

  对于这项工作的开展,应在软件工程相应的有关组织下,建立一个专门的机构,负责指导这项工作的完成。由这个机构成立专门的实验室,负责整体架构的制定,数据类型项的搜集、分类、筛选,并形成统一的数据库体系,为所有的应用系统的开发提供数据库基础支撑和服务。

  综上所述,通过对基础数结构的研究与体系的建立,从根本上解决大数据应用的效率,充分发挥未来大数据的作用,简化大数据应用的方式与过程。

  参考文献

  [1]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013(04).

  [2]李学龙,龚海刚.大数据系统综述[J].中国科学:信息科学,2015(01).

  [3]方璐.大数据时代的科学研究方法[J].浙江工业大学,2014.
  电子科技类中文核心期刊推荐《电子科技》创刊于1987年,月刊,每月15日出版。主要刊登高等院校、科研院所、电子行业企事业单位等科研机构在电子技术应用、通信工程、计算机科学技术与应用、网络安全及信息、光电子材料等领域最新的学术、技术论文、工程技术应用研究、教学实践总结、行业综述等稿件。该刊秉承严谨办刊的态度以保证期刊的严肃性、学术性。依托西安电子科技大学在信息与通信工程、电子科学与技术、计算机科学等领域的优势。


转载请注明来自:http://www.yueqikan.com/dianzijishulw/55219.html