课程分类

课程介绍
课程目录
用户评论
课程介绍
课程目录
用户评论

你将获得

  • 掌握某些知识点
  • 学会某些技巧(或思路)

教学服务

  • icon

    1v1专属答疑服务

  • icon

    BAT专家面试辅导

讲师介绍

  • 商业智能数据分析师,花随花心(专注研究:电商图表、电商软件、电商算法)

  • 课程详情

    序言 | 传道授业
     
    商业智能数据分析师,花随花心。大家好,我是花老师。今天的主题是关于评论区文本探索,本质就是文本挖掘领域的范畴。
     
    所谓的文本挖掘,通俗来讲就是如何将一连串文本里头的内容按关键词的不同进行区分。如果是英文状态的文本,那还好,大部分可以根据空格(space)进行区分;假若是中文状态的文本,则需要借助中文分词算法才行得通。
     
    说到这里,有点偏向学术的味道了,哈哈。
     
    其实今天的分享内容,是电商平台买家评论区里头的内容,通过评论分词之后,我们可以从中了解到买家的真实需求。
     
    狭隘的想法是,我自己店里头的买家都没几个,这么高大上的技术我还是用不到的。。。
    聪明的想法是,我能不能拿来分析竞争对手的买家都需要什么?
     
    没错,这个文本挖掘,就是拿来分析竞品的。你不是一直说不懂买家想要什么吗?你不是说搞不懂为什么产品卖不出去吗?其实这些答案,统统在评论区里头,毕竟这里才是买家真正发言的地方,也是我们最能直接看出产品的好坏的判断。
     
    OK,在正式开始分享之前,我先跟大家简单介绍一下这个系列的内容,目前一共更新了4篇,分别是:
     
    《Excel高阶报表系列+全店铺维度运算》花随花心著 第一弹
    《Excel高阶报表系列+关键词词根提取》花随花心著 第二弹
    《Excel高阶报表系列+店流量来源剖析》花随花心著 第三弹
    《Excel高阶报表系列+老顾客订单读取》花随花心著 第四弹
     
    持续更新…
     
    《Excel高阶报表系列》是我的电商数据分析的最新系列,针对电商领域的多方面的数据分析需求,特此开发出来帮助广大数据分析师更好的研究电商领域。
     
    正文 | 文本探索
     

     
    假设这款产品就是我的竞争对手的爆款,现在我想知道,除了TA的这些月销量、累计评价和产品标题的信息之外,这款产品背后到底蕴藏着什么样的买家需求呢?
     

     
    很明显,在累计评价691条信息里头,系统早就给出了我们答案。只不过这些信息,目前都是一连串的文本而已,并且由于浏览器的界面原因,我们只能分页查看。而今天的主题,就是针对这个区域进行分析。
     
    我们先来看最上方的标签信息,一共显示了6个,分别包括整体不错、衣服很舒服、穿着效果好、版型漂亮、布料好、做工很赞等等,每个标签背后还带着具体数量,代表着哪些标签才是最重要的意思。
     

     
    比方说这段话,包含着买家对产品的评价信息。其中,虽然我们可以很容易看出来内容很假,但是也不可否认这些都是产品的卖点。
     
    那么,假如我们能够把这些数据都下载下来,然后通过一些数据上的算法进行解析,之后根据解析出来的数据进行词频分析的话,是不是就可以很快知道这段内容里头真正想表达的词语到底是哪些?比如这样子的,如图所示
     


     
    每个标签下都会有若干个评价内容,这些内容一旦整合到一块,就会形成一段内容丰富的文本。而我们可以从上面的几个表格看的出来,不同评价标签,里头的关键词词频是不同的,也就是出现的次数是不同的。分析到这一步,其实基本上已经可以知道这款产品的重点到底在什么地方,但是如果只是局限在这里就显得有点鸡肋。
     

     
    换种视觉效果,也许能更好的帮助我们进行分析。现在,我将重点分析【默认】这个部分里头的数据。所谓【默认】,就是我们不点击任何评价标签的情况下,系统推荐出来的买家评价内容。
     

     
    事先说明,以上的数据只局限在前五页,后面的数据我没有下载下来。我们通过TOP10关键词,可以看出默认状态下,买家反复提到的重点内容,分别是【面料34,衣服34,裙子31,舒服29,质量26,真丝24,漂亮20,满意16,款式15,做工15】。数字代表出现的频数,我们从中就可以看出来,大多数买家的想法是什么。
     
    其中,有些词语对我们来说是没有意义的,我们可以剔除,比如衣服、裙子、满意等等,也就是说剩下的词语才是我们的重点分析对象。
     
    而针对其中的面料部分,我们可以到产品详情页里头去进行查询,如图所示
     


    关于面料,我们从上图可以看出,叫做防起球真丝面料。这种面料的特性在于细腻舒适,透气性良好,悬垂性佳,手感顺滑,呈现良好的穿着体验。
     

     
    而我们从TOP10关键词当中看出的真丝一词,则再次验证了以上产品的卖点,就是真丝。那么,拿到真丝一词,对我们来说有什么用呢?
     
    首先,我们通过这个词,可以帮助我们快速识别产品详情页里头真正能引起买家的关注的要点。那么,如果这款产品是我们自己来操作的话,你觉得应该要把面料介绍这块放置在哪里呢?
     
    肯定是首屏啦、主图啦,并且在详情页中要出现多次关于面料这块的介绍,但是每次介绍的文案和图片要有所不同,不然人家就会很烦。并且,既然是真丝,那么这款产品的关联推荐的产品群,是不是也应该是真丝比较好?
     

     
    而实际情况却是,在产品推荐中,第一款也就是我们刚刚分析的这款,跟第二款都是同种面料,第三款则不是,如果是我的话,产品足够的情况下会把第三款都替换成同种面料的。
     
    那么,继续针对真丝这个词,我们来看看,如果让我来重新选择产品,应该如何选出一款跟这款产品的面料一致,但是明显风格不同的产品。很简单,就是靠关键词组合。
     
    产品标题:
    真丝连衣裙2018春新款女装名媛温柔超仙两件套长裙夏季碎花裙子女
     
    通过这个标题,我们也可以看出来【真丝连衣裙】是放置在标题首位的,因此我们可以直接拿着这个关键词进行分析。
     

     
    通过搜索框,输入【真丝连衣裙】,快速看出整个平台的买家对真丝连衣裙的需求点究竟在哪里?词就是心。首先,我们来看看刚刚那款标题里头,都包含了这个搜索框里头的哪些词,通过分析得出,最接近的一个词,其实就是【真丝连衣裙女夏新款 女士】,那么这个时候我们就可以通过数据分析工具【生意*谋】来查看流量走势如何,如图所示
     

     
    很明显,这个词不能用,没有搜索流量。
     


    而本尊的搜索人气都很稳定,并且支付转化率在3.02%左右,说明这个词的稳定性很高。
     

     
    很神奇吧,最上面的衍生词居然比本尊的搜索人气还高,我们需要看一下真假,如图所示
     

     
    很容易看出来这个词,是真实可用的,目前有15432的产品在争夺,我们还需要上平台去查一下这个词目前销量最高的是多少,如图所示
     

     
    这个词背后真正热销的产品里头,折后价在345-640这个区间的销量最高,有61%的买家喜欢。
     

     
    最高销量,基本上一个月都是接近600人收货,并且清一色都是分销店铺。基本上,这个就是如何通过分析竞品买家评论数据来挖掘产品卖点,进而寻找蓝海市场的分析方法。
     
    当然,月收货接近600人(日收货20人)你觉得难的话,就换个词,方法是一样的。OK,关于文本挖掘这块的内容,我们就讲到这里,如果你想学习本文背后所蕴含的技术的话,请查看视频、音频同步版本,花老师与你不见不散,如图所示,再会!!!
    温馨提示
    • 请勿私下交易
      请勿在平台外交易。与机构和老师私下交易造成的任何损失及纠纷,腾讯课堂不承担任何责任
    • 听课说明

      1、电脑:访问腾讯课堂官网 ke.qq.com 查看我的课表或下载win/mac客户端听课

      2、手机/平板:下载腾讯课堂APP, 进入学习页面听课