欢迎登陆亚搏手机版app网!
亚搏手机版app-安卓版下载

亚搏版手机app下载_疫情防控不行松懈,重点区域人群密度的预测可以用数据挖掘

本文摘要:疫情防控不行松懈,重点区域人群密度的预测可以用数据挖掘 01配景描述及业务需求 2021年春节将至,去年受到新冠肺炎的影响,大家都只能宅在家里不能走访亲戚,与挚友聚会。在全国人民众志成城的积极下,疫情在我国获得了有效的节制,大家都渴望着本年能回家过个好年,但近几天来各地又零散呈现了新冠肺炎病例,跟着过年的时间一每天快要,人们也越来越担心疫情会不会跟着春运及走访亲戚呈现反弹。 而人口的流动堆积,客观上加大了疫情流传的风险和防控的难度。

亚搏手机版app

疫情防控不行松懈,重点区域人群密度的预测可以用数据挖掘 01配景描述及业务需求 2021年春节将至,去年受到新冠肺炎的影响,大家都只能宅在家里不能走访亲戚,与挚友聚会。在全国人民众志成城的积极下,疫情在我国获得了有效的节制,大家都渴望着本年能回家过个好年,但近几天来各地又零散呈现了新冠肺炎病例,跟着过年的时间一每天快要,人们也越来越担心疫情会不会跟着春运及走访亲戚呈现反弹。

而人口的流动堆积,客观上加大了疫情流传的风险和防控的难度。为了进一步把握人员流动堆积动向,做好紧迫疫情的防控事情,针对疫情相关的重点区域开展人群堆积密度预测就显得尤为重要。

本案例基于思迈特软件的数据挖掘平台Smartbi Mining举行建模,使用逻辑回归分类算法对重点区域的人群密度举行预测,其方针如下: (1)借助重点区域汗青的人群密度,统计人流量指数和迁徙指数特征; (2)成立模型预测重点区域将来的人群密度,把握人员流动堆积的动向; (3)针对人群密度较大的区域,做好紧迫疫情防控事情。本案例重点区域人群密度预测的总体流程如图1-1所示。图1-1 (1)获取数据,数据来历于赛题重点区域人群密度预测数据; (2)对获取的数据举行根基的处置惩罚操作,分组统计人流量指数和迁徙指数,作为模型的输入特征; (3)按照统计特征数据成立重点区域人群密度预测模型; (4)对模型成果举行评估。

02实施历程 本案例共有3个数据集,为去年疫情期间20200117-20200215人流相关的数据为例,以下是每个数据集的字段说明。表2-1 重点区域人流量环境表 表2-2 重点区域信息表 表2-3 北京市迁徙指数表 数据说明: ●重点区域人流量环境表中,人流量指数指与某天某小时内该区域内呈现的人数成正比。

A区域的人流量指数越大,暗示A区域呈现的人越多,反之越少。●北京市迁徙指数表中,迁徙指数指与某天北京市与其他都会之间的人群流动量成正比。A都会到B都会的迁徙指数越大,暗示从A都会迁徙到B都会的人数越多,反之越少。2.1.数据接入 在尝试中添加数据源节点,将上述3张表的数据读取进来,部门数据如图2-1所示。

图2-1 为了便于理解字段寄义,让字段看起来越发直观,使用元数据编辑节点,添加中文字段别名,更改后的输出如图2-2所示,流程图如图2-3所示。图2-2 图2-3 2.2.数据摸索 本案例的摸索阐发是对数据举行缺失值阐发与数据漫衍阐发,阐发出数据的缺失和漫衍环境。

亚搏版手机app下载

通过对数据调查发明重点区域人流量环境表和北京市迁徙指数表中日期时间字段格局纷歧致(如图2-4和图2-5),会对表归并有影响,因此需统一两张表的日期时间格局。图2-4 重点区域人流量环境表 图2-5 北京市迁徙指数表 为了检察整个数据集数值型数据的环境,接入一个全表统计节点,选中所有数值型字段如图2-6,输出成果如图2-7所示,可以看到所有数据均不存在缺失值。图2-6 选取所有数值型字段 图2-7 数据缺失环境 2.3.数据预处置惩罚 本案例主要接纳特征衍生和数据变换的预处置惩罚方法。

2.3.1. 特征衍生 通过数据摸索阐发,发明2张数据表中字段格局不统一无法归并,因此需统一字段格局。详细处置惩罚方法:对两张表均接入一个派生列节点,截取出日期时间字段的年代日信息,统一字段格局。接入一个派生列节点,派生列设置如图2-8所示。

图2-8 派生列设置 派生列后成果如图2-9 图2-9 转换后的日期时间格局 按照转换后的日期时间格局可以衍生字段“weekday”,暗示当天属于一周中的第几天,接入一个派生列节点,派生列设置如图2-10所示。图2-10 派生列设置 “weekday”字段衍生后成果如图2-11。

图2-11 weekday字段 2.3.2. 数据变化 由于原始的重点区域人群密度表只提供了汗青20200117-20200215的天天分小时人流量,要做回归预测,需给该方针值构造特征,详细构造特征方法为:操纵日期、小时、weekday、区域和区域类型的人流量指数和迁徙指数统计值聚合特征,如最小值、最大值、均值、总和等; 接入聚合节点,对日期、小时、weekday、区域、区域类型别离作Group操作,人流量指数、迁徙指数作Min、Max、Avg、Sum操作,如图2-12、2-13、2-14、2-15、2-16。图2-12 按照区域聚合人流量指数 图2-13 按照区域类型聚合人流量指数 图2-14 按照小时聚合人流量指数 图2-15 按照weekday聚合人流量指数 图2-16 按照日期聚合迁徙指数 对聚合后的特征使用JOIN节点举行归并,归并后可接入全表统计节点检察所有特征字段的漫衍环境,如图2-17所示。图2-17 指标数值漫衍环境 2.3.3. 预处置惩罚流程图 整个预处置惩罚流程图如图2-18所示。

图2-18 2.4.成立模型 我们使用一个回归算法,这里选用梯度晋升回归树算法。整体的尝试流程如图2-19所示。图2-19 人群密度回归预测模型 特征选择节点,特征列选择数据变换步骤输出的聚合特征,如图2-20。

图2-20 特征选择特征列 特征选择的方针列选择人流量指数,如图2-21。图2-21 选择方针列 拆分节点使用默认参数设置,训练集与测试集的占比为7:3; 梯度晋升回归树的参数设置如图2-21所示。图2-21 梯度晋升回归树的参数设置 评估节点的输出成果如图2-22所示,R2或许为0.96。

图2-22 模型评估成果 03总结 本案例联合疫情期间重点区域人流量密度预测案例,重点先容了回归预测阐发在实际案例中的应用。本案例借助重点区域汗青的人群密度,统计人流量指数和迁徙指数特征;成立模型预测重点区域将来的人群密度,把握人员流动堆积的动向;针对人群密度较大的区域,做好紧迫疫情防控事情。/p>返回,检察更多。


本文关键词:亚搏版,手机,亚搏手机版app,app,下载,疫情,防控,不行,松懈

本文来源:亚搏手机版app-www.gltjx.cn

餐饮项目推荐

苍井寿司加盟
苍井寿司加盟
投资额:3万
热度:
我要加盟
新麻蒲烤肉加盟
新麻蒲烤肉加盟
投资额:1-3万
热度:
我要加盟
酸小七酸菜鱼加盟
酸小七酸菜鱼加盟
投资额:1-3万
热度:
我要加盟
鲁二哥卤肉饭加盟
鲁二哥卤肉饭加盟
投资额:1-3万
热度:
我要加盟
优粮生活快餐加盟
优粮生活快餐加盟
投资额:10-20万
热度:
我要加盟
餐饮行情排行榜
  • 1小趣茶茶饮加盟200
    小趣茶茶饮加盟
    投资额:2-5万
    热度:
    查看详情>>
  • 2顶膳牛排加盟195
    顶膳牛排加盟
    投资额:1-3万
    热度:
    查看详情>>
  • 30夏7度奶茶店加盟194
    0夏7度奶茶店加盟
    投资额:3万
    热度:
    查看详情>>
  • 4乐速速奶茶加盟192
    乐速速奶茶加盟
    投资额:1-2万
    热度:
    查看详情>>
  • 5中卫披萨加盟192
    中卫披萨加盟
    投资额:1-3万
    热度:
    查看详情>>
  • 6小蛮螺网红螺蛳粉加盟192
    小蛮螺网红螺蛳粉加盟
    投资额:1-2万
    热度:
    查看详情>>
  • 7夏日沫沫茶加盟185
    夏日沫沫茶加盟
    投资额:1-2万
    热度:
    查看详情>>
    • 加盟指南
    • 经营技巧
    • 餐饮营销
    首页 |公司简介|法律声明|正在咨询|公司动态|联系我们