找回密码
 立即注册
搜索

数博会开幕:你真的了解大数据吗?

来源:新华社

2021中国国际大数据产业博览会昔日于贵阳开幕。自2015年5月第一届数博会举行以来,每年这个时分各路豪杰几千人都会聚集贵阳,出席者多为政商分量级的嘉宾,彰显了会议的高规格。

聚焦2021数博会|数博会欢迎你(一)(视频来源于数博会组委会)

自从2011年大数据在中国遭到关注以来,每年与此相关的会议和讲座接连不断,大家也都事事必谈大数据。2015年11月,党的十八届五中全会公报提出要实施“国家大数据战略”,开启了我国大数据建设的新篇章。可是怎样有效运用数据,如何让数据产生价值,如何在数据范畴获得投入产出,这些虽事关国运,却是很多人都讲不明白的事。



2021数博会围绕年度主题“数智变物致新”,组织“一会、一展、一发布、大赛及系列活动”。图为2021数博会工业APP交融创新大赛总决赛在贵阳开赛。(图片来源于2021数博会官网)

上个世纪80年代出现了个人计算机,软件开发变得抢手;90年代互联网末尾兴起,数据库在企业中被广泛运用,办公完成自动化。新世纪CRM,ERP盛行,互联网运用得到了爆炸式的增长,电子商务、社交媒体和移动互联网也随之出现,一切这些技术提高、业务发展都带来一个异样的结果,就是数据无法控制地大量添加。如古人们的一切行为几乎都会留下数据痕迹,比如运用手机软件消费、出行等等,我们生活在了一个大数据时代。

数据记录了很多事情发生的过程和形状。而一件事情的发生会遭到很多要素的影响,这些要素的内在联络是什么,如何影响到了事情的发展,都可以用数据记录上去。人们就是希望经过对数据的分析,找到事情发生的来龙去脉,以便预测将来的发展。为此,人们找到了很多的方法研讨数据,像统计分析的方法、计量经济学和工夫序列、运筹学、概率论和机器学习的方法、可视化技术,还有各种辅助的计算机技术和算法。数据分析可以在各行各业得到详细的运用,还可以作为一种次要方法停止迷信研讨,也能开拓新的运用建立新的行业。



数字化是企业晋级换代的基础,对数据的应用是完成智能化的前提。(图片由本文作者提供)

大数据和计算机技术、互联网一样,具有普适性和通用性,各行各业都需求,不但传统行业需求,而且是新兴行业的依托。大数据技术的出现,使得物联网、云计算、人工智能得以落地变成理想。所以,大数据是真正自计算机时代、互联网时代后,可以撑得起一个时代的技术。

大数据技术的确是给各行各业带来了实真实在的利益。但是,是不是每个人都可以了解大数据的一些本质性的成绩呢?

举这样一个例子:一年中,当人们游泳的次数添加的时分,吃冰棍的数量也会添加;游泳次数减少的时分,吃冰棍的数量也会减少。那么,这两件事情能否有关系,谁惹起了谁的变化?其实游泳与吃冰棍没有任何因果关系,它们之间是相关性关系。它们同时变化的缘由是天气的变化,这是人们的常识。大数据中,很多变量之间的关系都是这种相关关系(不知道是什么缘由惹起的),而不是因果关系,因此,不能简单下结论谁惹起了谁的变化。这是大数据对人们思想方式的影响。



计算机和互联网世界将我们带到了数据世界,数据世界的将来就是智能化世界。(图片由本文作者提供)

英国统计学家辛普森在1951年提出了一个悖论,即在某个条件下的两组数据,各自研判时,都具有某种倾向性,而合并研判,却能够得出相反的结论。比如,两个院系都有女生录取比例高的成绩,但是把两个院系的一切先生合并当前,再计算却是男生的录取比例高。假如是比较两个产品的销售状况,就不能仅仅看单一地区的销售比例,而是要看总体的比例。要片面思索成绩,不可随便下结论。

1936年美国民主党总统富兰克林-罗斯福任满一届,参加下一届的总统大选,当时共和党的候选人是阿尔佛雷德-兰登。著名的《文学文摘》经过对240万人的民意测验,预测共和党的候选人兰登将当选。而一家由乔治-盖洛普新成立的言论研讨所,只对5000人停止了问卷调查,却准确地预测了民主党的罗斯福会胜出。为什么大的数据没有得出正确的判别?由于这240万都是富人,他们的意见不具有普遍性,而5000个数据却是来自社会各个阶层,具有普遍性。《文学文摘》运用了错误的数据。

谷歌流感趋向GFT是谷歌从2008年推出预测流感的项目。谷歌的根据是特定关键词的相对搜索量和特定事情之间存在相关性。GFT应用这些搜索数据可以近乎实时地对全球当前的流感疫情停止估测。大数据为研讨人类行为和人与人之间大规模的互动提供了新的方式。但是,由于大数据的搜集做不到像经过严谨迷信实验得到的“小数据”那样准确,因此分析解读大数据是一件非常复杂的事。

2013年2月,《自然》杂志发文指出,GFT预测的流感样病例门诊数超过了美国疾病预防控制中心CDC根据全美各实验室监测报告得出的预测结果的两倍,偏向太大。因此,用户的搜索行为并不只仅受外部事情影响,它还遭到很多其它要素的影响。做数据分析不是数据量越大越好,模型迷信地选择变量很重要。

大数据应用好了,是收益;应用错了,就会做出错误的判别。除了要具有对大数据本身的认知,也要走出大数据项目建设的一些误区。

一种是以为投资大数据来钱慢,不挣钱,安于现状,不思进取;另外一种是做大数据急功近利,不尊重迷信,搞方式主义、政绩工程。

有人看不到大数据投资带来的利益,缺乏长远的目光,因此,迟迟不在这个范畴下功夫,不投资基础设置,不投资人才,不做规划。企业数字化是大数据的基础,企业数字化可以提高自动化效率,积累数据,为智能化做预备。

2017年,华为接受数字化转型的建议,构建了与消费者和渠道互通的数字化平台,使得华为可以应对外部环境的变化,经受住了各种打击。日本上个世纪八、九十年代的辉煌是制造业的辉煌,当时日本的GDP最高可以达到美国GDP的69.6%多。后来,除了美国的打压外,日本对互联网产业关注不够,使得日本错过了互联网时代,也使得中国这个后来者明天达到了日本GDP的3倍多。这是一个深入的教训,中国是万万不可错过大数据时代的。

大数据是通往智能化的必由之路。没有大数据,就没有人工智能,就没有物联网,就没有智能制造,就没有传统行业的晋级换代,没有古代生物制药、基因工程的研讨等等,也就没有中国古代化的将来。因此,我们一定要经过各种方式普及大数据知识,推进大数据的建设。

作者:刘政

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

rayboss 2021-6-16 07:15:49 显示全部楼层
顶顶更健康
回复

使用道具 举报

346322405 2021-6-16 22:37:37 显示全部楼层
介是神马?!!
回复

使用道具 举报

曾勇明 2021-6-17 18:53:05 显示全部楼层
秀起来~
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies