加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 金华站长网 (https://www.0579zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

盘点:开源社区的大数据分析

发布时间:2021-08-19 11:49:16 所属栏目:大数据 来源:互联网
导读:副标题#e# 2014年7月13日,由北京大学信息化与信息管理研究中心、北京大学CIO班教务办公室和中国新一代IT产业推进联盟主办,北达软协办,CIO时代网承办的第三届中国大数据应用论坛在北京大学隆重举行,来自业界的相关专家学者、CIO、媒体朋友等150多人参与

    上面我讲到两个例子,一个针对个体项目进行研究例子,一个针对整个开源世界进行研究的例子,大家也已经看到了我们已经获得的一些研究结果。从我们领域来讲,我们目前所面临主要挑战是什么?首先是数据收集。比如收集数据,他们系统管理员对数据有严格规定,我们考虑不要影响到正常客户对他们服务器的访问,这些事情非常困难。第二数据规整化,在座各位应该理解这个问题。第三个从数据中寻找规律,去回答我想要回答的问题,这个挑战体现在每个领域最有价值的地方,重点是理解数据法则。

 

 

    最后这个,当前公司做得非常多,我想这么大数据又想在线分析,性能上如何做到实时分析这么多数据,实时显示这些数据?最后分享一点关于大数据思考,前面讲本领域一些研究,问题的研究结果。

 

 

    中国的创新机遇,大家应该比我理解更深刻,大家也讲了非常乐观的企业的应用,我只想说,我只想从我所看到的知识积累的角度来讲,我们已经错过了软件兴盛,开源兴盛的时期,我们的技术积累远不如人家。今天全世界讲大数据,我们已经看到,公司个体数据以及用户营销一些数据都已经给我们提供了很好机会去研究数据驱动的决策支持等等,所以从我的角度来讲,在座各位有什么更好手段抓住这些机遇,首先贡献数据。我们现在现有基础上,对数据贡献好像比较缺乏,建立共享平台开放数据访问,这是我等下讲到我努力做的事情。最后希望数据是永远在那的,重点是指我们能够采用怎样方法,从数据里面获得信息获得知识,最后真正帮助我们进行决策支持。

 

 

    最后讲什么是大,这个问题我经常被问到,说是大数据,为什么称为大?我讲我的观点。只要在我任何一个领域内超出你处理能力,超出忍受能力可以说大。这是我推荐定义。在我们领域来讲,我们目前做的尝试,讲到开源世界,包括跟我们有建立关系和合作项目企业,我们努力收集所有数据,希望能够规整化并且开源出来,现在北京交通这么拥挤,如果政府能够把汽车交通数据能够开源出来,我相信有无数非常有智慧网友给我们规划无数条道路出来,这个数据如果能够开放出来让大家访问,是吸引群众创新的最好渠道。在我们项目希望做这样的事情,首先是在这些开源项目,因为是软件项目,会提供一些基本的信息,最后以这些数据为基础抓住核心价值,从数据里面挖掘出来回答本领域最有价值问题的一些量度,最后能够真正实现。谢谢。

盘点:开源社区的大数据分析

(编辑:PHP编程网 - 金华站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!