淘宝平台广告点击数据分析报告

如题所述

第1个回答  2022-07-12

本篇数据分析报告全文约3900字,阅读大约需要10分钟

数据源: Ad Display/Click Data on Taobao.com
这是一份淘宝平台的广告展示/点击数据,本次分析需要从这些数据中发现某些规律或者异常,进而给运营团队提出建议
评价一个广告效果的指标就是广告的点击人数,可以反映一个广告有多少人愿意点击查看广告的内容,只有广告被点击,后续转化为购买行为才会发生。
把广告的点击人数指标拆分:
广告点击人数=广告展示数 x 点击率
而广告展示数又由广告商品的价格、类别影响;不同人群对不同类别商品有着不同的喜好,从而影响广告的点击率。
在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。
因此本次分析就针对 【点击率】 这一因素进行分析

从“广告”和“用户”两个角度进行分析:

原始的数据集中包括三类数据,具体数据对应属性如下:

为了方便分析,抽取其中的部分字段作为分析。
从raw_sample数据集中抽取:用户ID、广告ID、是否点击
从ad_feature数据集中抽取:广告ID、类目ID、广告商品价格
从user_profile数据集中抽取:用户ID、年龄层、性别、购物层次

将三张数据表,组合到一张表中

得到一张记录了用户-广告信息表

1、源数据中还有许多的缺失值,将性别和年龄层字段中为空值的记录删去

2、查看数据中的异常值,并将异常值删去
查看广告商品价格字段的属性值范围:

还是存在数据值过大的异常值
为了方便分析对价格字段进行切分,选取更贴近日常生活的价格在1000元以内的广告记录进行分析
切片之后仍保留了751570条记录

对于广告商品价格字段,每个广告的商品都有各自的价格,根据价格字段不便于进行统计。新增一个字段“price_class”代表价格的区间。

(0-价格在0-100元、1-100-200元、2-200-300元...)

将广告按价格分为100元以下、200元以下、300元以下等10类,并计算不同价格区间中广告的点击率情况。

从图中发现,所有价格区间商品的点击率都在5%左右,其中广告商品价格在100元以下的广告点击率最高,为5.92%;
看到价格较低的广告商品点击率更高,我们一般认为是对价格敏感的浅层用户(免费用户)在这方面的点击率更高,而拥有一定消费行为和消费意识的中层、深层用户(付费用户)则更在意购物时的体验以及商品的质量。
为了验证以上说法,我们先假设100元以内的广告商品主要的点击对象是浅层用户,再通过数据验证。

查看点击了100元以内的广告商品的用户的用户组成

从用户分布可以看出,在点击了100元以内广告商品的用户中,深度用户的比例更高,占比81.6%,而浅层用户的占比则相对少很多。这推翻了我们原来的假设。

由于广告的类别数量众多,大部分类别的广告只有1-2次的展示,数据样本太小,因此选取展示数量最多的7个类别进行分析。

可以看出类别6261广告的展示数、点击数、点击率均为最高,而类别4385广告的展示数虽然有10000+,但是点击数、点击率却是最低的。

计算没有被点击的类别4385广告的商品的平均价格

而点击了类别4385广告的商品的平均价格为:

两者平均价格都在200-300区间、差异不大。结合分析(1),价格区间在200-300的广告商品点击率平均是在5.29%,而类别4385则只有3.61%。
这说明:广告商品价格不是影响类别4385广告点击率的因素

先来看看类别4385被哪些用户看到了

可以看出,类别4385的广告,主要是被推荐给了男性用户,而男性用户对这类商品的兴趣大于女性。
并且女性对这类商品的广告兴趣不高,点击率只有2.75%,是造成类别4385广告点击率低的主要原因。

来看看不同年龄段、不同性别的用户点击率有什么差异

(年龄字段含义:0:10岁以下、1:10-20岁、2:20-30岁、3:30-40岁、4:40-50岁、5:50-60岁、6:60岁以上)

从统计的数据可以看出,类别4385广告的商品主要点击群体是30岁以上男性用户,尤其是60岁以上男性兴趣最高,而女性用户对这类广告商品兴趣低。
结合a、b的分析,受30岁以上男性欢迎、价格在200-300的商品,推测是西装、皮鞋类或者烟酒类又或者是家用电器类商品

男女比例约为:1:1.6

男女广告点击数的比例约为:1:1.7
因此,总体上女性的点击数要多于男性,但两者的点击率基本一致。

可以看出,大部分类别中,女性的广告点击数都要明显大于男性的点击人数。
只有类别4385、类别4505,这两个类别的广告,男性的点击人数要超过女性的点击人数。
男女之间的主要差异是由类型6261的广告造成的,女性的点击数大约是男性的4倍。

不同的用户群体之间用户价值与消费习惯具有一定的差异,对于不同用户群体的广告投放的策略也不同。通过分析不同用户群体对广告点击率有什么关系,来制定不同的投放策略。

这里的分析通过K-Means算法来对用户进行聚类,并基于RFM模型来对用户价值进行划分。

这里选取用户的购物层次、广告点击率、浏览广告的商品平均价格,这3个指标来作为判断用户价值的标准

这里将所有用户分成5类,来代表用户价值的高低。

注:三个特征在聚类时都进行了特征的标准化

因此,我们可以出:群体5对广告的接受程度最高,非常愿意点击广告。群体2更喜好高价格的商品,对购买高价商品抱有极大兴趣。

根据用户在购物深度、点击率、观看广告商品的平均价格3个维度的表现,将用户划分为5类客户。
(1)重要保持用户

(2)重要发展用户

(3)重要挽留用户

(4)一般用户

(5)低价值用户

根据聚类结果,对应上述五类客户类型,进行匹配,得到客户群体的价值排名:

根据结果,我们可以发现5类用户的分布如图所示:

把上述的分析过程中的小结正例出来,得到分析结论,并综合所有的结论提出建议: