【数据分析案例】2020年亚马逊商品评论数据分析

亚马逊商品评论数据分析

《2020年美国数学建模竞赛C题:亚马逊商品评论数据分析》的解题思路与代码。

题目介绍

亚马逊网上商城为客户提供了对交易进行评分和评价的机会。客户可以提供三种评价内容:

  1. 星级。客户可以用1-5的等级来评价他们对商品的满意度,1的满意度最低,5的满意度最高。
  2. 评论。客户可以提交评价的标题和正文文本,提供对产品的更多评价和意见。
  3. 帮助评分。客户还可以对其他客户提交的评论进行评价(是否有帮助),以辅助他们自己做出产品购买决策。

赛题提供吹风机、婴儿奶嘴、微波炉三种商品的三个评价数据集,公司使用这些数据来了解商品的市场,借助这些信息来改进产品设计。

项目步骤

1. 数据清洗

首先观察数据集,初步描绘数据集的特征。
以婴儿奶嘴为例,下面是婴儿奶嘴各等级评分的数量折线图、婴儿奶嘴各等级评分数量随时间变化规律折线图。

、

去除与数据分析无关的字段,如商品品类、商品大类等。
去掉数据集中的无关商品评价,如在婴儿奶嘴商品评价数据集中的枕头、显示器的商品评价。
去除没有认证购买的商品评价;
将数据标记“n”、“y”转换为“0”、“1”,将字符串数据转换成浮点数,便于下一步的统计分析和预测。
将评价标题与正文拼接起来&#

刘润森! CSDN认证博客专家 Python Java 前端
17年就读于东莞XX学院化工系,喜欢的微信搜索:「Python之王」。个人微信号:RunsenLiu。
相关推荐
©️2020 CSDN 皮肤主题: 猿与汪的秘密 设计师:白松林 返回首页
实付 19.90元
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值