For investors
股价:
5.36 美元 %For investors
股价:
5.36 美元 %认真做教育 专心促就业
大数据来自不同组织,它的跨域、分布、异构性以及海量的特点给传统的数据库管理系统带来巨大挑战,目前,管理着世界上最大数据的谷歌、雅虎和微软等公司,都不使用传统的数据管理系统,而是另辟蹊径去寻找可以满足大数据管理需要的技术。
M.Franklin等人提出了数据空间的概念。数据空间是M.Franklin等人为应对信息量不断增长以及数据信息管理需求而引入的一种信息管理新概念。
目前关于数据空间技术的研究主要集中在个人数据空间方面,并取得了一定成果。国外的研究工作主要以iMeMex和SEMEx两个个人数据管理系统为代表。iMeMex由瑞士联邦理工学院开发,它推动了信息抽取和查询技术的进步,但缺点是不支持语义查询;SEMEx由华盛顿大学开发,成功把语义关联应用到实例中来高效提取信息。
同时,麻省理工学院计算机科学系的David R.Karger等人研发了个人数据管理系统Haystaek,该系统采用了URF(Uniform Resource Identifier)半结构化数据模型统一表示用户数据,体现了数据空间“pay as you go”的数据集成思想。美国华盛顿大学数据库研究组的sharedviews项目实现了名为Homeview的原型系统,该系统能够支持个人动态数据的共享,但数据的类型和共享方式有限。
在国内,数据空间技术已经开始受到广泛关注。中国人民大学孟小峰教授等人对数据空间的概念、实现数据空间支撑平台所需的关键技术进行了详细的阐述与分析,并带领中国人民大学网络与移动数据管理实验室研究团队研发了具代表性的个人数据空间原型系统orientsPac。
在综合考虑数据的模型、组织形式和分类方法基础上,提出了与数据相关的eorespaee模型和与任务相关的TaskSPace模型,但该系统的不足之处是用户不能自己定义关联。
综上所述,以物联网、云计算技术作为数据收集、数据管理手段,用数据空间技术来组织大数据,实现多层次、多粒度的大数据挖掘,是处理大规模数据行之有效的途径,也符合大数据管理和服务的需求。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请添加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。