课程分类

课程介绍
课程目录
用户评论
课程介绍
课程目录
用户评论

你将获得

  • 掌握某些知识点
  • 学会某些技巧(或思路)

教学服务

  • icon

    1v1专属答疑服务

  • icon

    BAT专家面试辅导

讲师介绍

  • 商业智能数据分析师,花随花心(专注研究:电商图表、电商软件、电商算法)

  • 课程详情

    序言 | 传道授业
     
    商业智能数据分析师,花随花心。
     
    说实话,这段时间真的是憋死我了。我的社交软件一直有同学在问,什么时候开课?哈,我自己也算不准,因为我在做一款软件。初代版本已经成形,我放到自己的群里头,今天的这堂课也是要拿软件当中的其中一个功能来进行讲解。
     
    题目大家都已经看到了,叫做评论区产品卖点。顾名思义,我指的就是通过买家评论的地方来获取数据,然后通过数据算法来进行解析,最终尽可能看到我们自己想要的那部分数据即可。
     
    可是,苦逼的是这些数据,平台并没有直接给我们提供。哦,不对,应该说,即使提供了,也很鸡肋,数据处理超麻烦的。并且,也不是所有人都对浏览器的操作很熟练,复制粘贴这种苦活,希望从今天开始,我能帮助大家减少一点工作量。
     
    话又说回来了,虽然我这段时间花了不少时间在研究,但是鉴于工作上的关系,软件目前只提供3个功能,分别是平台的PC端综合排序搜索,以及买家详情页评论区的数据,还有供货商上面联系方式等等,这些统统都已经实现。
     
    当然,我这里强调一句,毕竟是初代版本,以后会慢慢更新迭代,所以其他功能,随着我的灵活时间的增加,会陆续增加到里头,这点大家放心。另外,软件收费吗?
     
    嗯…...嗯……嗯…. 只能这么说,目前提供的功能是免费对外开放的,当然后续也会增加一些付费功能,但是并不妨碍大家的正常使用,这一点我先说好。
     
    OK,说了这么多,我们接下来就正式开始进行学习。
     
    正文 | 产品卖点
     

     
    有人说,花老师能不能讲点别的类目?其实我也想。那么,我们今天就来研究遥控飞机吧。正如上面这张图,大家看到的是各种各样的遥控飞机,并且,价格也不尽相同。虽然,我们现在看到的是PC端的数据,但是其实无所谓。因为我已经点了人气排序,不管是PC端还是无线端,我关心的是我要找什么竞争对手来研究,这个才是重点。
     
    其实,平台上的商品浩如烟海,与其广撒网钓大鱼去研究,何不如就冲着一家店铺去搞,就一个字,抄。其实很简单,你能不能拿着A店的店铺风格,换上B店的产品?当然,这个不是今天的重点。我们直接点击类目第一的产品进去看看,如图所示
     

     
    简单的产品介绍,大家自己看吧,我们接下来来看看评论区的数据,如图所示
     

     
    累计评价是649个,然后就是描述分4.9,当然最重要的是后面这几个标签,分布是质量不错,适合人群,还有服务好之类的,当然,这边看到的标签不一定齐全,有部分标签浏览器没有显示出来,不过工具箱已经能够抓取到,如图所示

     

     
    简单的操作,三两下就把数据抓取到了,打开文件之后,我们来看看结果如何,如图所示
     

     
    上面是一部分截图,实际上的数据远不止如此,我们先来重点看看刚刚讲到的区域,如图所示
     

     
    自己可以对比看看,数据是刚好对的上的,我们通过这里,是不是发现多了4个标签,分别是功能不错,外观不错,好玩,以及操作不错等等。这里,其实有个小技巧,如果标签出现问题,只要能够让其他隐藏的标签顶上去,那么自然就把不好的标签给隐藏起来了。
     

     
    接下来,我们来对比一下,上面的数据和下面的数据是否一致,如图所示
     

     
    如果有些买家进行了追评的话,这部分数据都被我过滤掉了,工具箱提供的都是第一次留言的数据,这点大家留意一下。其实,我们可以看到,原先很多时候,比如这里头的颜色分类,或者尺码,或者买家留言评论的时间,都被我们忽略掉了。
     

     
    就好比如这里头的时间段,获取下来之后,简单做个时间分布图,其实就可以看出买家基本什么时候有时间了。通过分析SKU的数量占比,很快就可以知道这款产品,究竟是哪个SKU好卖,这个也帮助我们减少了很多不必要的款式的备货。并且,评论里头的内容,如果能提取一些关键词出来,然后进行总结评价,是不是就可以快速判断出,买家到底在想什么,对什么最满意。而这部分也是我们需要重点关注的。选款其实就可以这么来,因为人家已经明明白白告诉你了。
     
    获取数据是第一步,怎么处理就是第二步了。第二步,有2个专业名词,分别叫做数据清洗和数据预处理,使用起来的时候,往往是混着来的,没有随先随后的区别。至于什么是数据清洗,什么是数据预处理,这个我在视频和音频里头再详细讲。
     
    简单来说,就是把重点的数据处理成我们需要的格式,就这么简单,如图所示。
     

     
    很多人以为这里的买家名字没什么用,因为已经被处理过了,其实即使没处理过,请问你又能拿来干嘛呢?灰色手段我就不说了,正常来说,不管是什么样的,我们都可以拿来当频数统计,也就是人数。
     
    比如,上面的这些时段,经过处理后,可以明确知道年月日,以及时分,然后缺的恰好人数统计,通过组合之后,我们很容易看出来,基本上在最近的6月份里头,买家大部分有时间的是什么时候。因为时间关系,我只爬取了5页数据,因此数量有限,大家凑合着看吧,大致意思能明白即可。
     

     
    通过散点图,快速知道这款产品复购率如何,很明显,大部分人都只买1次,有少数是2次购买,甚至3次购买的也有,当然,随着数据量的增加,这个图会越来越接近真相。稍微处理一下,结果就出来了,真的,这些数据都是从刚刚的数据里头处理后得到的,你再看看现在是什么情况先,如图所示
     

     
    剩下的,就是买家评论里头的数据了,如图所示
     

     
    随着数据量的增加,你会越来越觉得这堆文字很难看,密密麻麻的都不知道在说什么。但是,如果我把TA处理成这个样子,你再来看看,如图所示
     

     
    越是在上面的气泡,说明频数越大,也就是买家最在乎的点,是不是很神奇,其实很简单,学数据分析,连这个都不会,其实会让人笑掉大牙的。
     
    希望通过一个简单的功能,能让你节省点时间,多研究重点数据,才是王道!
     
    OK,今天的内容我们就讲到这里,如果你想学习本文背后所蕴含的技术的话,请查看视频(免费)、音频(免费)同步版本,花老师与你不见不散,如图所示,再会!!!