找回密码
 立即注册
搜索

浅谈大数据在抗疫中的运用和启示


编辑导读:新冠疫情发生以来,大数据、云计算、人工智能等新一代信息技术加速与交通、医疗、教育、金融等范畴深度交融,让疫情防控的组织和执行愈加高效,成为战“疫”的强有力武器。本文作者分析了大数据在抗疫中的运用,以及给我们带来的启示,希望对你有协助。



一、概述

手机扫描健康码,社区、乡村工作人员精准排查交往人员;在机场、码头、车站,用大数据完成旅客行迹可追溯;实时疫情地图将疫情数据的空间特征、工夫特征和数量特征停止可视化表达……

新冠肺炎疫情发生以来,大数据、云计算、人工智能等新一代信息技术加速与交通、医疗、教育、金融等范畴深度交融,让疫情防控的组织和执行愈加高效,成为战“疫”的强有力武器。

从疫情信息统计分析,到活动人员健康监测、确诊病例追踪,再到疫神态势研判、预测,大数据技术助力筑牢疫情防控网,为迷信防控、复工复产、民生保障等提供了有力支撑。



图1:科技公司积极参与到抗疫举动中

材料来源:IDC中国,2020

二、大数据在抗疫中的运用

1. 构建知识图谱,追踪传播途径


大数据技术可以梳理感染者的移动轨迹,追踪人群接触史,建立知识图谱,为精准定位疫情传播途径,防控疫情分散等方面提供重要信息。

追踪移动轨迹、建立知识图谱,曾经是大数据范畴比较成熟的技术。地位数据方面,除了航空、铁路、公路、轮渡等交通部门统计的出行数据外,在用户授权的前提下,电信运营商可以基于手机信令等包含地理地位和工夫戳信息的数据有效定位用户的手机地位。互联网企业也可以经过APP授权调用用户手机地位数据。

此外,地图、打车、旅游等APP提供的移动出行服务,电商、外卖平台等APP内的送货地址数据,以及银行移动支付的IP、经纬度数据等都可以作为地位数据的有效补充。知识图谱则可经过各类社交平台、通讯网络、通话记录、转账记录等数据构建。



图2:疫情传播知识图谱

材料来源:杜娟.新冠肺炎疫情防控中,大数据在发挥什么作用?[J].大数据时代,2020(02):6-11.

将手机用户不同工夫段的授权地位数据停止纵向串联,可以有效绘制出移动轨迹。这类个体数据,可以追踪被感染者的疾病传播途径、定位感染源,配合知识图谱可以锁定被感染者曾经接触过的人群,以便及时采取隔离、治疗等防控措施,避免疫情更大范围分散。

将同一时点不同个体的地位数据停止横向整合,就能构成群体数据。应用数据分析、数据发掘等技术可以准确描写跨地域漫入、漫出的不同类别人员的活动方向、动态及规模。

假如在百度迁移地图中输入“武汉”这个城市,从1月10日春运大幕拉开,到1月22日春运第一阶段高潮将要落下的工夫点,从武汉(起始地)流向全国各地的城市客流量排名,与各地新型肺炎病例被发现的数量与工夫早晚,有着一定的正相关关系。



图3:1月15日从武汉流向全国各城市人员分布

材料来源:百度地图慧眼

应用群体地位数据制造疫情时期的人口迁移地图,可据此观察各城市的人口流入、流出状况,尤其是重点疫区人口流出方向。这些数据有利于定位疫情输入的次要区域、预测地区疫情发展态势、预测地区潜在染病人群,为疾病防控部门及地区政府有针对性地出台交通管制措施提供迷信支持。

2. 大数据构建疫情发展模型


疫情时期,大众亲密关注疫情的传播态势。疫情还会传播多久?感染者还会大幅添加吗?哪里感染风险高?何时可以进入安全期?要处理这些成绩,需求找出关键影响要素、分析疫情传播特征、搭建疫情发展模型,这其中大数据可以发挥关键作用。

除了医疗数据外,疫情传播往往还遭到气候、温度、湿度、地质、交通、社会行为、城市卫生等多维度要素影响。大数据技术的发展使得这些影响要素均能以数据形状展现,同时使得多维度、大规模的数据处理成为能够。应用大数据完成上万量级的影响因子建模,极大地丰富了疫情发展模型的分析维度。

SIR模型是传染病模型中经典的模型,其中S表示易感者(Susceptible),I表示感染者(Infective),R表示移除者(Removal)。

传播过程大致如下:最后一切的节点都处于易感染形状,然后部分节点接触到信息后,变成感染形状,这些感染形状的节点试着去感染其他易感染形状的节点,或者进入移除形状。移除形状,即免疫,处于移除形状的节点不再参与信息的传播。



图4:SIR模型传播过程

假设易感染者,感染者,移出者之和是个恒量即 。病人康复后具有免疫力,人与人之间有相反的接触率:

其中α,β都是以工夫为变量的参数,α(t)为日感染率,β(t)为日移出率。参考多方材料后,假设α=0.0000003,β=0.0077266,I(0)=1,S(0)=1000000(其中感染率a和移出率β都是根据官方所提供的数据估算出,武汉市人口共有一千万,假设非常之一遭到此次疫情的影响)。



图5:湖北省疫情状况统计表

材料来源:湖北省卫健委

仿真结果可以看到,21天到25天的数据,也就是截止到1月26日24时,预测的数据都是符合实践状况的。但是随着疫情的扩张,感染率势必降低,移出率势必提高。因此,感染率α和移出率β不会是一个常数。另外该模型过于精简,将真实状况过度理想化,还有很多需求改进的地方。



图6:湖北省疫情仿真预测状况

假如应用采集到的出行轨迹活动信息、社交信息、消费数据、暴露接触史等海量数据,借助传播动力学模型、动态感染模型、回归模型等大数据分析技术,就可以更为准确的预测疫情的发展状况,并对疫情的峰值拐点等大态势停止判别。另外还可以根据病患确诊顺序和亲密接触人员等信息定位时空碰撞点,进而推算出疾病传播途径,为传染病溯源分析提供实际根据。

3. 大数据发掘疫情言论


疫情面前,疏解民众的焦虑心思至关重要。由于信息获取方式、生活方式的改变,搜索大数据已成为疫情之下了解民意的重要载体,每一条信息背后的点击、每一次搜索,都精准揭示了民众的需求与成绩。

疫情迸发的初始阶段,“口罩”、“酒精”等搜索增多,而疫区“心思引导”、“咽喉痛”搜索量激增74倍。随着武汉封城,生鲜果蔬、防护物资、食品粮油、药品等方面成为武汉及湖北人民搜索的热点,这也提示当地政府需求保证相关物资的供应。



图7:“心思引导”成为百度搜索热点

数据来源:百度、CCTV



图8:2月11日-2月26日武汉市民部分搜索关键词

随着疫情防控情势好转,”樱花”相关内容搜索热度超过”口罩”,反映出人们心思需求的变化:曾经刻不容缓地期盼走出家门拥抱春天。



图9:“樱花”成为百度搜索热点

数据来源:百度、CCTV

当下,复工复产的步伐正在加速。如何应用大数据,为各行各业和政府部门的决策提供参考,也至关重要。搜索大数据反映了国内企业恢复消费的全体状况,给各行业有序筹备复工提供了可供参考的数据样本。



图10:复工复产新焦点

数据来源:百度、CCTV

在庞杂纷繁的信息环境中,越是全社会聚焦的严重突发事情,自动搜索的形式对于民众获取知识与信息也就显得越发重要。这一点在此次疫情中表现得也非常分明。搜索大数据样本体量不只足够大,还愈加多元。海量用户产生的真实搜索央求,潜藏着极具发掘价值的数据金矿。因此,无论是疫情走势判别、居民的日常生活以及企业的复工状况,某种程度上都离不开搜索的支撑。

众多互联网平台都在关注疫情,为何只要搜索能探测民意与言论走向?当然,这其中最次要的缘由还在于搜索大数据能搜集到海量的、具有分析价值的真适用户的志愿与行为。

关于真适用户需求,有句话是“客户不是要买电钻,而是要买墙上的那个洞。”我们从啤酒与尿布的搭配销售故事到口红效应(因经济萧条而导致口红大卖),都能看到大数据的威力。

2009年甲型H1N1流感在美国迸发的时分,谷歌经过观察人们在网上的搜索记录完成了冬季流感预测,它所测算出数据也成为美国公共卫活力构所能获取到的非常有价值的信息,并且成为流感防控的一个更有效、更及时的指示标。

谷歌的行为本质上是平台经过用户行为精准发掘探测到了其真实需求。对应到疫情下的旧事资讯平台,短视频平台以及社交媒体,网民“众声喧哗”的背后,鱼龙混杂,大量无用的社交信息充斥,聒噪中夹杂着水军与机器的操纵,信息过载成为常态,它并不能真实的反运用户需求与获得真实民意反馈。而相对社交媒体等平台的聒噪,搜索的背后是大量的用户自动求证行为,用户此时在搜什么,反应了用户在想什么,这些数据反映了人们的关切点,能更准确、及时地反运用户真实志愿。

搜索像一面镜子,能映照出民众最迫切的需求,应用大数据处理和分析手腕将有价值的信息从不断增长的海量数据中提取出来。经过对民意的洞察,可以提供一定的数据决策价值,输入给地方政府与机构、民众所用,做到“取之于民,用之于民”。

三、启示

1. 大数据可用于业务场景分析与决策


疫情时期大数据在建立知识图谱、疫情地图、预测模型等方面起到了关键作用。大数据异样可以运用到银行业务中,从而更好的表达、分析金融业务场景的买卖全貌,协助银行停止分析与决策。
    信贷范畴的重点是获客、身份验证、以及授信环节。获客需求建立用户画像,追踪用户的残缺生命周期;身份验证即经过活体辨认、OCR等技术停止央求人的验证的成绩,义务关联分析需求图关联技术,找出义务知识图谱;授信环节更要汇聚多方数据源,经过多维度历史数据停止建模并获得风险定价,输入信誉分给金融机构。理财范畴的重点是营销获客和智能投顾。营销与信贷相似,需求建立片面残缺的用户画像,覆盖残缺的用户生命周期,才能做到真正的智能营销、获客;智能投顾需求KYC和投借婚配,重点分析用户风险等级及偏好,并停止KYC与KYP结合,停止智能婚配。支付范畴的核心是买卖反欺诈,需求经过各种技术建立买卖反欺诈引擎,并根据买卖数据停止反欺诈引擎模型优化。


2. 大数据可用于服务优化

    舆情分析:银行可以经过爬虫技术,抓取社区、论坛等外部媒体上关于银行以及银行产品和服务的相关信息,并对信息停止正负面判别,尤其是掌握银行以及银行产品和服务的负面信息,及时发现和处理成绩;对于正面信息,可以加以总结并继续强化。同时,银行也可以抓取同行业的银行正负面信息,及时了解同行做的好的方面,以作为本身业务优化的自创。市场和渠道分析优化。经过大数据,银行可以监控不同市场推行渠道尤其是网络渠道推行的质量,从而停止合作渠道的调整和优化。同时,也可以分析哪些渠道更合适推行哪类银行产品或者服务,从而停止渠道推行策略的优化。产品和服务优化:银行可以将客户行为转化为信息流,并从中分析客户的个性特征和风险偏好,更深层次地了解客户的习气,智能化分析和预测客户需求,从而停止产品创新和服务优化。比如经过对还款数据发掘比较区分优质客户,根据客户还款数额的差别,提供差异化的金融产品和服务方式。


3. 数据才能是运用大数据的基础


良好和丰富的数据是展开疫情防控运用的基础。传统卫生数据的采集终点通常是基层的社区卫生中心,经过社区人员手工填报,阅历区卫健委、市卫健委,最终汇集至省卫健委和国家卫健委。这种采集方式在大数据量面前暴显露了一些弊端。一方面添加了基层数据采集工作人员的负担,降低了数据汇集的效率,另一方面难以在数据源头疾速核验数据的正确性,添加了后期数据质量管理的成本。

在疫情防控中也存在数据分散割裂、流通不足的成绩。例如运营商各省级公司之间相对独立,数据各自保管存储,对数据的认知角度也截然不同,最终导致数据之间难以互通,构成孤岛。这样形成的后果就是每一个城市都有本人的健康码,假如去其他城市就要面临无法健康码互认的成绩。不打通这些数据,大数据的价值将非常难发掘,只要不同数据的关联和整合才能更好的发挥大数据的优势。

本文由 @汪仔6497 原创发布于人人都是产品经理。未经答应,制止转载

题图来自Unsplash,基于CC0协议

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评5

几回悠世 2021-6-17 12:46:29 显示全部楼层
分享了
回复

使用道具 举报

新丰江边 2021-6-17 12:54:32 显示全部楼层
分享了
回复

使用道具 举报

茻匸 2021-6-18 07:23:19 来自手机 显示全部楼层
撸过
回复

使用道具 举报

绿水儿 2021-6-19 11:18:34 来自手机 显示全部楼层
当我看到你的帖子时,我只有赞!狂赞!超赞!力赞!强赞!无敌赞!必须赞!史上最赞!赞了又赞!一赞到底了!
回复

使用道具 举报

昊乐23 2021-6-20 07:06:56 来自手机 显示全部楼层
哈哈哈,楼主求带
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies