大数据对外服务专题分析标准化案例——泉州领show天地

    #前言
    大数据对外服务是支撑中心大数据中心的一项业务,也是大数据变现的一项重要手段。虽然我们掌握了许多数据资源,熟悉多种分析手段,但由于各类行业都有其独特性,每次大数据对外服务需求都应该充分调研,了解行业客户真正的需求,必要的时候还要到实地去考察,与客户面对面沟通,以达到最好的分析效果。

    #交付成果
    大数据对外服务一般提供给客户一份专题分析报告PPT,PPT中仅提供脱敏的统计级数据,或者趋势分析数据。不可包含任何用户清单级的敏感数据。

    #分析流程
    大数据对外服务流程为152流程,是由县市公司政企部客户经理发起,经过直属领导、法务部、信息安全等部门审批,通过后方可进行。客户经理应尽可能详细地写清楚客户需求,并告知客户最终的可交付成果。商务部分也需要提供,例如是否通过其他项目来置换大数据对外服务费用等。

    ##需求调研
    为了满足客户需求,避免分析结果出现问题,第一次接到大数据对外服务流程时,可与项目发起人一同前往客户所在地,当面沟通,进一步明确客户的具体需求。

    ##可行性分析
    与客户沟通完毕并明确了客户需求之后,应对该需求进行可行性分析,考虑客户需求是否为当前系统中可提取的数据。此外,考虑交付成果是否为脱敏的统计级数据。

    ##数据提取
    数据提取过程一般通过客户标签库、客户轨迹表、常用基站表等维度进行提取。

    ###1.区域确认
    根据商铺的位置,在地图上进行坐标拾取,通常情况下,我们先选取商铺所在位置多边形的四个点,分别提取这四个点的GPS坐标(注意:只有谷歌地球的坐标才是真实的GPS坐标,其他坐标都是经过转换的“火星坐标”)
    6666.jpg
    通过获取这4个坐标的最大值和最小值,得出实际的坐标取值范围如下图绿色方框所示。
    777.jpg
    从数据库中取得落在该区域内的基站清单。

    select * from cfg_area_sector_info
    where site_lon>=118.6005039 and site_lon <=118.6046579
    and site_lat>=24.88613823 and site_lat<=24.88905523
    and change_inure_date<=sysdate
    and change_expire_date>sysdate;
    

    ###2.基站确认
    获得这个矩形区域中的基站,如下图所示,可见,所得基站均处于商铺范围内。
    base.jpg

    ###3.用户分布热力图
    根据基站所覆盖的用户数绘制出用户分布密度热力图。
    rlt.jpg

    ###4.用户提取
    根据基站清单,提取用户信息,并剔除在该区域7天及7天以上的常驻用户。如下图所示,根据每天的访客情况可见,该区域的日均访客数为23301.9人,最大值为29008人,最小值为14818人。
    444.jpg
    根据用户清单,进一步挖掘用户的详细信息。

    ##数据挖掘
    对于已获取的用户清单,可直接进行用户标签的关联,对于潜在目标客户的分析,可让客户提供有效的真实会员资料,通过该清单进行建模,以得到潜在目标客户模型。

    ###1.基本信息
    (1)用户年龄分布
    如下图所示,该区域的用户年龄集中分布在20-35之间,其中年龄为26岁的用户数最多,达到1.8万,随着年龄的增长呈递减趋势。
    5555.jpg
    (2)用户性别比例
    如下图所示,该区域的用户为男性居多,占比高达63%。
    666666.jpg
    (3)用户归属地
    如下图所示,在一个月的监控样本中,用户归属来自丰泽的最多,达到13万人,高出第二名两倍以上,晋江归属的用户达5.78万,鲤城归属的用户达5.35万,惠安归属的用户达4.2万。
    77777.jpg
    (4)用户来源街道
    下图所示,该区域中,用户来源最多的街道是东海,达3.5万人,其次是丰泽街道,超过2.5万人,泉秀街道和东湖街道来源均超过了1.5万人。
    1121.jpg
    (5)用户来源分布热力图
    根据用户来源信息,分析用户的常驻基站,得出用户来源分布热力图,更进一步确认用户来为主要为:丰泽、晋江、鲤城、惠安、南安。
    ly3.jpg
    (6)用户职业特征
    如下图所示,该区域近一个月来访的用户分布情况如下,其中商旅人士最多,占比达62%,学生占比21%,公务人员占比7%。
    zyzy.jpg
    (7)用户星座分布
    该区域用户的星座分布如下图所示,其中天秤座用户占比最高,达到10.54%,其次为天蝎座用户,占比9.95%,处女座用户占比第三,达到8.92%。
    star.jpg

    ###2.消费能力
    (1)月均ARPU值
    该区域用户平均ARPU值分布情况如下图所示,可见,绝大多数用户的ARPU值集中在100-200之间。
    ARPU.jpg
    (2)用户余额分布
    该区域用户余额分布情况如下图所示,可见余额小于50元的用户数最多。
    余额.jpg
    (3)月均流量使用
    该区域的用户流量使用情况如下图所示,其中,月均流量处于500MB-1GB的用户数最多,达到8.7万户。
    ll.jpg
    (4)终端品牌分布
    下图所示为该区域用户所使用终端品牌的占比情况,其中苹果终端占比最高达到42.92%,华为、欧珀、小米并列占比11%,步步高、三星品牌占比分别为8%和6%。
    zdzb.jpg
    (5)拥有汽车的用户占比
    如下图所示,该区域中,拥有汽车的用户占比为26%。
    iscar.jpg
    (6)汽车品牌占比情况
    该区域用户的汽车品牌占比情况如下图所示,其中本田汽车占比最高,达到29.76%,丰田汽车占比仅次于本田,达27.60%,大众汽车占比23.73%,标致汽车占比3.38%,同时也存在宾利、保时捷、宝马、奔驰、雷克萨斯等高端汽车品牌。
    carband.jpg

    ###3.偏好特征
    (1)上网内容偏好
    该区域用户上网行为偏好如下图所示,其中搜索类偏好最高,达到2.86万次,IT类偏好达1.92万次,游戏和购物类偏好分别为1.39和1.33万次,社交生活类偏好为1.06万次。
    swxw.jpg
    (2)APP使用偏好
    该区域中,社交通信类APP使用的频次最高,其次为IT类APP和系统工具类APP。
    appuse.jpg

    ###4.通信特征
    (1)用户通话次数分布
    下图为该区域用户的月通话次数,其中月通话在100-200次的用户最多,达到91925户,通话500次以上的为75168户。
    thcs1.jpg
    (2)用户影响力
    根据用户通话特征评估模型对该区域的用户进行分析,得出该区域用户有45%的用户具有较高的社会影响力。该模型主要根据用户的交往圈的联系人数量、联系频度、消费能力等维度进行综合评定。
    yxl.png

    ##分析报告制作
    分析报告一般提供PPT或WORD形式,尽量避免使用专业术语,应使用可供客户阅读的简单描述或举例。

    ##数据审核
    数据审核一般由B角、信息安全部门、法务部、财务部依次进行,仅当审核完成之后才可将最终的分析报告提交给客户。

    ##分析报告提交
    分析报告通过流程进行流转,最终由需求发起人将该报告直接发送给客户。

    validate