商品销售数据分析报告

数据分析报告结论: 1.从用户整体销售的角度分析,市场销售部门应保证销量TOP3的…

数据分析报告结论:

1.从用户整体销售的角度分析,市场销售部门应保证销量TOP3的28、50014815、50008168的商品的货源充足,对于销量方面表现不佳的38、122650008、50022520类商品应该进行具体优化处理。为提高销量,需要加强营销提高购买人数,同时不断改进商品促进人均购买量的提升,对于需求量大的商品要去结合婴儿用户的年龄对应的需求点、婴儿的性别特征以及商品本身类型的特质等因素进行考量。

2.从商品销售趋势分析,不同类型的商品具有季节性的趋势,类型为28以及50014815的商品在第四季度销量较高第一季度较低,类型为50008168的商品在第三季度相对较高第一季度较低,由此销售部门可以根据该规律对相关类型的商品进行季节性调整,满足市场需求。建议运营部门结合当时宝妈们的关注点和市场营销情况,可将50008168类的商品作为2015年双十一的主推产品。

3.从用户群体分析,建议运营部门对于男婴可以主推50008168类商品,女婴主推50014815类型商品,28类的爆款可以放到第二梯队进行营销。市场销售部门对于男女婴都偏好的50014815、50008168以及28类型商品保证充足的货源。

4.从用户年龄层分布情况分析,运营部门应多倾向于对 0~1岁婴儿用户营销50014815类型的商品,对于2~3岁婴儿用户营销50008168类型的商品。推广渠道按照年龄划分,若0~1岁婴儿的需求量比较大,线下可以考虑产科医院,月子中心进行推广。线上推广可以结合母婴类APP在不同模块和功能点处进行针对性推广。同时根据以上结论定点精准推送,针对需求的多少去针对性推送广告以此来减免广告费用,提高广告效率。

说明:本次分析主要时使用Excel进行数据分析并可视化展示。

本文的组织结构如下:

一、分析背景

二、分析目的

三、理解数据

四、明确问题

五、分析思路

六、清洗数据

七、数据分析

八、总结和建议

一、分析背景

阿里母婴(Ali_Mum_Baby)产品数据是一个数据集,数据集由 Taobao.com 和 Tmall.com 提供,它包含淘宝或天猫提供的超过 900 万儿童的生日和性别等信息,共享信息以获得更好的销售建议或搜索结果。

二、理解数据

2.1 数据来源

本数据集来自于阿里云天池,由 Taobao.com 和 Tmall.com 提供的母婴商品的用户行为数据。

数据集-阿里云天池 (aliyun.com)https://tianchi.aliyun.com/dataset/dataDetail?dataId=45

2.2 字段理解

表一:婴儿信息

字段 含义 数据类型
user_id 用户ID 数值型
birthday 婴儿出生日期 数值型
gender 性别:"0"表示女性,"1"表示男性,"2"表示未知 文本型

>> 经查表一“婴儿信息”总共有953个数据;

表二:购物信息

字段 含义 数据类型
user_id 用户ID 数值型
auction_id 商品ID 数值型
cat_id 商品类别 数值型
cat1 商品根类别 数值型
property 商品属性 文本型
buy_mount 购买数量 数值型
day 购买时间

数值型

>> 经查表二“购物信息”总共有29971个数据。

三、分析目的

数据分析的最终目标是得出结论并指导业务运营,数据分析是从业务出发且服务于业务的。当拿到业务部门提出的问题或者我们自己有什么疑问需要通过数据分析来解答时,首先将这些业务问题转换成数据问题,同时结合业务知识全面理解数据集中数据的含义,明确问题,统一指标口径,通过数据分析手段找出有效的数据指标、发现业务规律,得出理性客观的事实结论来指导业务经营。下面通过分析实际案例来完成Excel的数据分析过程。

本文将基于电商母婴用户的行为数据进行数据分析,探索用户消费行为概况和特点,寻找高价值客户,为精准营销与精细化运营提供数据支撑,从而帮助平台和商家实现营收增长。

四、明确问题

1. 哪种商品的销量最好?用户对哪些商品的需求高?如何提高商品销量?

2. 商品销量趋势是怎样的?销量趋势具有时间规律吗?

3. 销量高的商品是否存在用户年龄及性别差异?

五、分析思路

采用假设分析方法,多维度分析方法,对比分析方法对商品的销量情况,商品销量趋势,用户偏好行为进行分析。

1.商品销售维度分析,用户的潜在兴趣点需求点;

2.时间维度分析:商品销量随时间的变化趋势;

3.用户群体维度分析:用户的性别及年龄差异;

六、数据清洗

注意:在开始清洗数据之前,最好先备份好原始数据集,以防后面有需要查询原始数据的需求。

清洗数据按以下流程进行:

6.1 选择子集

将从收集到的数据集中筛选出跟业务分析有关的列(字段),将不相关的列进行隐藏。在本数据集中不需要使用到表二“购物信息”中的商品属性字段,所以暂时将其隐藏。在这里我们需要注意的是对于不需要的字段进行隐藏即可,最好不要直接删除数据以保证数据的完整性。

6.2 列名重命名

为方便后续理解数据真正的业务含义,将表述不清晰的列名进行重新命名。在这里将两表中所有列的英文列名进行重命名为中文列名

6.3 删除重复值

重复值会干扰数据的准确性,删除重复值确保数据是唯一的;

对表一“婴儿信息”的用户ID字段进行删除重复值操作,未发现重复值;对表二“购物信息”的所有列同时都重复的进行删除操作,仍未发现重复值,说明两表均无重复值。

注意:用户是有可能在同一个时间点进行重复购物的,所以重复购买数据不需要进行删除。

6.4 缺失值处理

缺失值:缺失值影响数据的准确性

对表一和表二的各列进行缺失值查找,有三种方法查看缺失值:

1.直接看各列的计数值是否相同;

2.对各列筛选操作查看各列有没有空值;

3.采用定位条件进行空值定位;经查均未发现有缺失值,所以暂时不需要进行缺失值处理。

6.5 一致化处理

一致化处理:对每个数据列里没有统一格式的值进行处理,便于后续的数据分析工作;

对表一“婴儿信息”的出生日期及表二“购物信息”的购买时间进行一致化处理,这里采用分列的方法将时间从数值型转化为日期型,以便于后续进行的与时间相关的分析工作;

将表一“婴儿信息”的性别字段通过IF函数从数字替换成文字;

IF函数公式:=IF(C2=0,"女",IF(C2=1,"男","未知"))

6.6 数据排序

将表一“婴儿信息”的出生日期进行排序,可以发现出生日期最大的是1984年,但是下一个就直接跳到2002年,随后每一年都有婴儿出生,其中出生日期最小的是2015年,所以初步判定1984年出生的用户数据应该是异常值,留给后面的具体分析时进行处理;

将表二“购物信息”中的销售数量进行降序排序,如下图所示,可以发现在2014年11月13日购买数量最多的用户购买了10000数量商品,也是唯一的用户,可能某个商家进行大批量购买,那将是很有价值的用户;但也有可能是异常值,在业务中可与销售部门的同事进行确认该数值的准确性。

6.7 异常值处理

表一“婴儿信息”中在总共953个人里面有26个人性别未知,属于异常值且因性别未知的人数占比2.7%,故进行删除处理同时也不会对整体数据产生影响;

对表二“购物信息”的每一列进行筛选操作,由于购买数量最大10000的数据干扰性比较大,所以在这里对于该数据值按异常值进行删除处理;

将两表关联组合成新表:利用Vlookup函数通过“用户ID”字段将表一“婴儿信息”和表二“购物信息”关联并新建一个新表为表三,命名为“婴儿商品信息”表,因表一表二的数据量差别较大,所以组合表三必然产生了空值,重新对表三进行缺失值处理,将表三的“出生日期”和“性别”为空值的数据进行删除,根据“购买日期”和“出生日期”字段新添加一个新的“年龄”字段,利用DATEDIF函数或者YEAR函数直接计算,注意DATEDIF函数由于无法显示负值所以得单独对负值进行处理。按年进行计算,得出年龄,由于存在负值年龄,应该是婴儿出生前就购买了商品,所以对负值年龄进行保留。再对年龄进行降序排序操作,排序后数据如下图,发现年龄最大的唯一用户已经28岁了,可以确认是异常值,所以对该数据进行删除处理。也有显示-1和-2岁的数据,可以认为是为婴儿的出生做准备的而提前购买或者是给亲戚小孩购买的产品的数据,所以对这些数据进行保留 。

经过以上数据清洗步骤,数据集都已经全部清洗完毕,现在三个表的数据都是比较干净的数据,为后续的数据分析工作打下基础。

七、分析数据

7.1商品整体销售分析

通过以上处理,三个表均已获得比较干净的数据,那么就可以对这些处理过的数据根据业务或者需分析的问题基于三表的数据进行数据分析,这里采用Excel数据透视表及其可视化的形式进行展示,采用多维度分析方法、对比分析方法,假设检验等分析方法进行分析,并得出结论。

哪种商品的销量最好?用户对哪些商品的需求高?如何提高商品销量?

首先从商品的整体销量情况分析,查看不同类别商品的整体销量情况;

>>可以看出前三商品根类别编号分别为28、50014815、50008168的商品销量都比较高,不同根类别对比比较发现,不同根类别的销量对比相当悬殊。

将商品根类别继续展开,展示出各根类别商品里面销量前三类别的商品,同步对比看看各类商品里面的具体销量情况:

>>从上表可以看出各根类商品销量TOP3的商品类别,用户需求较高销量较大,市场对该根类产品反响较好,属于重点主推对象,所以这些商品的货源要保证充足,在2015年可以继续保持原有的营销策略,着重把关商品品质服务质量等环节,将其打造成“畅销产品”。在销量的角度,同理,对于销量方面表现不佳的38、122650008、50022520类商品应该进行具体优化。

结合商品销售量那么该如何提高商品的销量?

指标拆解:销售总量=购买人数*人均购买量

>>从不同类别商品的购买人数上看,销量TOP3类型的商品同样也是购买人数的TOP3。

>>商品总销量第一的28类商品的人均购买量4.1件商品最大,购买人数却不是最大,50008168的人均购买量1.5,购买人数最多,销量第二,注意到38类商品的购买人数最少,人均销量却有第二,销售总量也不多。结合购买人数和人均销售量,可以知道若想提高商品销量则需要加强营销提高购买人数,同时改进商品促进人均购买量的提升。

7.2商品销售趋势分析

商品销量趋势是怎样的?销量趋势具有时间规律吗?

7.2.1商品销量整体趋势分析

将商品按时间维度进行展开分析,首先将时间按年份展开看看商品的销售变化趋势情况。

>> 商品销量趋势在2014年前是不断增长的,2014年的销量达到顶峰,2015年的销量直线下降,那么为何2015年却下降了呢?为查找趋势直线下降的原因再将商品销量趋势按季度时间进行展开。

>>展开后发现2015年销量下降是因为2015年仅有1-2月份的销售数据,2015年的数据不全。并且发现销售趋势有季节性地变化,从2013年和2014年的季度趋势来看,从第一季度开始销量上升然后在第四季度达到顶峰后商品销量降低。

为何销量在第四季度达到一年中的销量顶峰呢?

提出假设:第四季度较高是因为有双十一促销的影响,第一季度是因为春节过年时期。

为验证假设,将商品销量趋势按月份展开,看看具体是哪个月份的商品销量最好。

>>可以看出十一月份销量最高,春节期间一二月份的销量最低,五月份和七月份九月份偶有销量小高峰。

由于2012年和2015年只有局部数据而2013年和2014年数据比较完整,所以对这两年1-2月份及11月份的的商品销量数据进行展开分析,验证假设是否正确。

>>经查2013年2月10日和2014年1月31日是春节,由图表可知过年期间的销量较低,这段时间应该是商家放假,而且客户的购买需求也母婴那么大,而且按大家的过年的习惯,需要购买的商品早就在年前提前购买好,而且这还是母婴商品,更会提前备好以防不时之需。

>>11月份的销量在双十一确实突然上涨,2014年的11月13日销量突然猛涨,在数据清洗的数据排序中就已经发现该异常值,当天是唯一的一个用户,由于数据较大,直接掩盖了11月份的其他时间的销量变化,11月份销量可视化图表的表达不够清晰,所以将该异常值暂时剔除看看其他时间的数据情况。

>>经以上分析得出结论假设成立。 双十一期间的购买量暴涨,跟双十一促销有很大的关系,以及在 11月19日及11月29日的销量也相对较高,特别是2014年的11月份的销量变化隔几天偶有销量小高峰,说明在十一月份的营销做得较好。

7.2.2不同类型商品销量趋势

将不同类别的商品按年份及季度的时间趋势进行展开,查看不同商品的不同时间段的销量变化。

>>商品销量TOP3类型的商品在每年都稳点在TOP3且每年都在稳定增长,由于2015年数据只有前两个月份的数据,所以整体在2014年达到顶峰。从季度的趋势看,不同类型的商品具有季节性的趋势,类型为28以及50014815的商品在第四季度销量较高第一季度较低,类型为50008168的商品在第三季度相对较高第一季度较低,由此销售部门可以根据该规律对相关类型的商品进行季节性调整,满足市场需求。

7.3用户群体分析

销量高的商品是否存在用户年龄及性别差异?

1.用户群体的性别占比

女婴占比53%,男婴占比47%,男女比例相对接近,女婴相对比男婴受众多,营销时可倾向于对女婴进行宣传。

2.用户不同性别的购买人数对比

女婴用户的购买量占比63%,男婴的占比例仅仅37%,女婴比男婴购买量占比达1.7倍,结合男女婴儿占比,可以看出女婴的人均购买量比男婴多,从性别角度来看,女婴用户是的高价值客户,市场运营部门可提升对于女婴用户的营销策略。

3.不同年龄层人数分布

4.不同年龄层的销量分布

5.不同年龄层的用户占比情况

>>结合不同年龄层分析的整体来看,主要的消费群体是0、1、2、3岁的婴儿,该年龄层的用户群体也是高价值客户。特别是0~1岁婴儿的数量占比已达51%,0~2岁占比达66%,所以应当重点关注刚出生不久0~1岁的婴儿用户群体。

3.用户群体偏好分析

由于婴儿用户数据上的年龄跨度较大,5岁的儿童原则上已经不属于婴儿了,所以这里结合婴儿的年龄层分布筛选小于0~3岁的高价值婴儿用户的数据进行用户的偏好分析,分析不同性别不同年龄层婴儿用户群体的商品偏好。

>>从购买量上看,同销量分布一样,男女婴都偏好50014815、50008168以及28类型的商品。男婴特别偏好50008168类商品,女婴更偏好50014815类商品,根据28法则百分之八十的利润都是由百分之二十的商品创造的。建议运营部门对于男婴可以主推50008168类商品,女婴主推50014815类型商品,28类的爆款可以放到第二梯队进行营销。

从不同年龄层的购买量上看, 0~1岁婴儿用户偏好50014815类型的商品,2~3岁婴儿用户偏好50008168类型的商品。

>>结合以上,运营部门应多倾向于对 0~1岁婴儿用户营销50014815类型的商品,对于2~3岁婴儿用户营销50008168类型的商品,市场销售部门对于男女婴都偏好的50014815、50008168以及28类型商品保证充足的货源。

八、总结和建议

1.从用户整体销售的角度分析,用户对于28、50014815、50008168的类型的商品比较感兴趣,购买量较大,市场销售部门应保证销量TOP3的28、50014815、50008168的商品的货源充足,对于销量方面表现不佳的38、122650008、50022520类商品应该进行具体优化处理。为提高销量,需要加强营销提高购买人数,同时不断改进商品促进人均购买量的提升,对于需求量大的商品要去结合婴儿用户的年龄对应的需求点、婴儿的性别特征以及商品本身类型的特质等因素进行考量。

2.从商品销售趋势分析,不同类型的商品具有季节性的趋势,类型为28以及50014815的商品在第四季度销量较高第一季度较低,类型为50008168的商品在第三季度相对较高第一季度较低,由此销售部门可以根据该规律对相关类型的商品进行季节性调整,满足市场需求。建议运营部门结合当时宝妈们的关注点和市场营销情况,可将50008168类的商品作为2015年双十一的主推产品。

3.从用户群体分析,结合用户整体销售情况一样,男女婴都偏好50014815、50008168以及28类型的商品。男婴特别偏好50008168类商品,女婴更偏好50014815类商品。建议运营部门对于男婴可以主推50008168类商品,女婴主推50014815类型商品,28类的爆款可以放到第二梯队进行营销。市场销售部门对于男女婴都偏好的50014815、50008168以及28类型商品保证充足的货源。

4.从用户年龄层分布情况分析,运营部门应多倾向于对 0~1岁婴儿用户营销50014815类型的商品,对于2~3岁婴儿用户营销50008168类型的商品。推广渠道按照年龄划分,若0~1岁婴儿的需求量比较大,线下可以考虑产科医院,月子中心进行推广。线上推广可以结合母婴类APP在不同模块和功能点处进行针对性推广。同时根据以上结论定点精准推送,针对需求的多少去针对性推送广告以此来减免广告费用,提高广告效率。

本文来自网络,不代表软粉网立场,转载请注明出处:https://www.rfff.net/p/1252.html

作者: HUI

发表评论

您的电子邮箱地址不会被公开。

返回顶部