亚马逊A9算法很神秘,围观机器学习怎么测试它

作者:洪敏斯 原创: 亿恩网

4天前

简介:亚马逊A9算法变了,但是亚马逊一直都没有披露影响算法的因素。

亚马逊A9算法变了,但是亚马逊一直都没有披露影响算法的因素。


10月开始,卖家受算法的影响越来越大,除了中国卖家感受到这一变化之外,外国卖家也切身体会到,因此,有外国测试者专门使用机器学习来预测影响搜索排位的因素。


据数据情报公司Jumpshot的报告发现,亚马逊上的消费者在亚马逊上进行产品搜索比在谷歌的更多。此外,亚马逊90%的产品浏览量来自该公司的有机网站搜索,而不是广告或外部渠道。


亚马逊搜索引擎的目标是根据销售潜力对产品进行排名。许多因素可以影响销售,如价格、评论和产品页面的复制。想必在这些领域表现出色的产品会获得更好的排名。


但是,很难确定这些因素的相对重要性,尤其是在亚马逊没有披露这些因素的情况下。


预测产品的销售潜力


在浏览亚马逊的各种产品畅销榜时,测试者注意到在许多关键类别中,比如“电子产品”和“汽车”,最畅销的产品通常拥有最多的评论。


消费者在写评论之前购买了产品,令人产生疑问的是,评论的数量是否可以代表产品的销售和排名?于是,测试者使用了机器学习进行测试。机器学习不仅仅能产生预测,机器学习的一个鲜为人知的用途是创建一个模型,然后测试哪些特征对预测最为重要。


测试者根据了以下操作进行测试:

1、准备一个机器学习源文件,包括评论;

2、使用谷歌的自然语言API通过审查情感分析来扩充这个源文件;  

3、将此文件上传到BigML,BigML是一个易于使用的机器学习工具;  

4、生成深度神经网络模型(即,模拟人脑识别模式)来预测数据集中评论的数量;

5、回顾对模型预测影响最大的特性。这些是获得更多评论和代理销售最重要的因素。

 

源文件

测试者在亚马逊智能工具JungleScout上找到了2017年第四季度的畅销产品的名单。这份名单包括了大约10000种不同类别的产品,测试者关注的是“Automotive”。

数据集包含15列,比如Amazon标准标识号(ASIN)、产品子类别和产品名称,以下是完整列表:


gl_product_group_desc  

Subcategory  

asin  

upc1   

item_name   

merchant_brand_name

customer_average_review_rating   

customer_review_count   

has_fba_offer   

has_retail_offer

otal_offers   

min_price   

max_price   

min_3p_price   

max_3p_price

 

测试者还想提取产品评论文本,并使用它来计算评论的情绪,以防它们具有预测性。有相关的计算机专业人士编写了亚马逊评论文本。测试者从他的网站上下载了汽车评论以供测试。


该数据集有9列:

asin

helpful

overall

reviewText

reviewTime

reviewerID

reviewerName

summary

unixReviewTime

 

测试者合并了这两个数据集,它们提供了许多潜在的预测因素,如下所示:

 

eviewerID

asin

reviewerName

helpful

reviewText

overall

summary

unixReviewTime

reviewTime

gl_product_group_desc

Subcategory

upc1

item_name

merchant_brand_name

customer_average_review_rating

customer_review_count

has_fba_offer

has_retail_offer

total_offers

min_price

max_price

min_3p_price

max_3p_price


接下来,测试者想捕捉评论的情绪。


评论的情绪


谷歌的自然语言处理API可以为捕捉评论的情绪提供帮助,处理了评论文本后,捕获了四个额外的字段:明显积极的、明显消极的、中性的和混合的情绪。每个字段都包含一个“文档得分”、“每个文档的大小”和“得分最高的句子”。

使用BigML进行机器学习


测试者选择将customer_reviews_count作为预测目标,选择深度神经网络作为要构建的机器学习模型类型。


BigML搜索了128个模型组合,以找到最佳性能。

以下是按顺序排列的结果——销售的首要预测指标。


1、Subcategory(子类别)——86.73%  

2、Field1 (产品编码)——9.6%  

3、Item_name(产品名称)——3.49%

4、Total_offers(总价格)——0.06%

5、Upc1——0.04%

6、Customer_average_review_rating(客户评级)——0.03%

7、Max_price(最高价格)——0.02%

8、Min_price(最低价格)——0.01%


令测试者惊讶的是,评论的情绪没有任何影响,客户评级(Customer_average_review_rating)和价格(Max-price和Min-price)几乎没有预测效果。

现在可以看到,产品类别和产品名称的选择可能会产生重大影响,因为一些产品和类别本来就很受欢迎,有很强的需求。同样,产品的数量也预示着整体的销售。


最后,从这位测试者所测试的结果可见,搜索排名竟然和评论的好坏没有太大的影响,不知道各位卖家对这测试结果有啥看法呢?

更多精彩内容,请关注亿恩网微信:(ENECNEWS)每天为您推送最新,最热干货!

声明:亿恩网原创稿件,未经授权不得以任何方式转发 。转载请联系:yujie@enec.net

(0)

您的点赞就是我们的动力!
评论: (0)
收藏: (0)
分享到:
×

回复评论

返回顶部

公众号二维码

© Copyright 2016 -2019 跨境电商新媒体-亿恩网 All Right Reserved( 粤ICP备16107804号-1)