Utilisation de l’apprentissage automatique pour prédire les classements de recherche Amazon

0
61
Utilisation de l'apprentissage automatique pour prédire les classements de recherche Amazon


Encore un autre rapport, celui de Jumpshot, une société de renseignement sur les données, a révélé que plus de recherches de produits de consommation se produisent sur Amazon que sur Google. De plus, 90% des vues de produits d’Amazon proviennent de la recherche organique sur le site de l’entreprise et non de la publicité ou de canaux externes, selon Jumpshot.

Ainsi, étant donné l’importance pour les commerçants d’optimiser le moteur de recherche d’Amazon, A9, il vaut la peine de comprendre les facteurs de classement.

Il est largement rapporté que l’objectif du moteur de recherche d’Amazon est de classer les produits en fonction de leur potentiel de vente. De nombreux facteurs peuvent influencer les ventes, tels que les prix, les avis et la copie de la page produit. Vraisemblablement, les produits qui excellent dans ces domaines sont récompensés par un meilleur classement.

… Étant donné l’importance pour les commerçants d’optimiser le moteur de recherche d’Amazon, A9, il vaut la peine de comprendre les facteurs de classement.

Il est difficile d’identifier l’importance relative de ces facteurs, d’autant plus qu’Amazon ne les divulgue pas. Alors j’ai essayé de le découvrir.

Je vais vous expliquer mon processus dans cet article.

Prédire le potentiel de vente

En parcourant les sections «Meilleures ventes» d’Amazon pour divers produits, j’ai remarqué que dans de nombreuses catégories clés, telles que «Électronique» et «Automobile», les meilleurs vendeurs ont généralement le plus d’avis, ou presque le plus.

Le nombre d’avis sur les produits pourrait-il être une approximation des ventes d’un produit et donc des classements? Vraisemblablement, les critiques achètent le produit avant d’écrire sur leur expérience.

Pour tester, j’ai utilisé l’apprentissage automatique. L’apprentissage automatique peut faire plus que générer des prédictions. Une utilisation peu connue de l’apprentissage automatique consiste à créer un modèle, puis à apprendre (dans certains cas) quelles fonctionnalités sont les plus importantes pour effectuer la prédiction. J’utiliserai cette approche ici, avec ces étapes.

  1. Préparez un fichier source d’apprentissage automatique avec des informations sur les meilleures ventes d’Amazon, y compris des critiques.
  1. Augmentez ce fichier source avec une analyse des sentiments d’avis à l’aide de l’API Natural Language de Google.
  1. Téléchargez ce fichier sur BigML, un outil d’apprentissage automatique facile à utiliser.
  1. Générez un modèle de réseau neuronal profond (c.-à-d. Simulez le cerveau humain pour reconnaître des modèles) pour prédire le nombre de critiques dans l’ensemble de données.
  1. Passez en revue les fonctionnalités qui influencent le plus les prédictions du modèle. Ce sont les facteurs les plus importants pour obtenir plus d’avis et, par procuration, pour les ventes.

Fichier source

J’ai trouvé une liste des meilleures ventes du quatrième trimestre 2017 sur un JungleScout, un outil de renseignement Amazon. La liste comprend environ 10 000 produits uniques par catégorie, dans différentes catégories. Je me suis concentré sur «l’automobile».

Le site de JungleScout contenait une liste des meilleures ventes du quatrième trimestre 2017 sur Amazon.

Le site de JungleScout contenait une liste des meilleures ventes du quatrième trimestre 2017 sur Amazon.

L’ensemble de données contient 15 colonnes, telles que le numéro d’identification standard d’Amazon (ASIN), la sous-catégorie de produit et le nom du produit. Voici la liste complète des colonnes.

  • gl_product_group_desc
  • Sous-catégorie
  • un péché
  • upc1
  • nom de l’article
  • merchant_brand_name
  • customer_average_review_rating
  • customer_review_count
  • has_fba_offer
  • has_retail_offer
  • total_offers
  • prix_min
  • prix_max
  • min_3p_price
  • max_3p_price

Je voulais également extraire le texte de l’avis du produit et l’utiliser pour calculer le sentiment des avis au cas où ils seraient prédictifs. Un professeur adjoint d’informatique à l’Université de Californie à San Diego, Julian McAuley, a rassemblé le texte des critiques d’Amazon. J’ai téléchargé des critiques automobiles depuis son site pour mon test.

Cet ensemble de données comporte neuf colonnes. Voici la liste.

  • un péché
  • utile
  • global
  • reviewText
  • reviewTime
  • reviewerID
  • reviewerName
  • sommaire
  • unixReviewTime

J’ai combiné les deux ensembles de données, qui ont fourni de nombreux facteurs prédictifs potentiels, comme suit.

  • reviewerID
  • un péché
  • reviewerName
  • utile
  • reviewText
  • global
  • sommaire
  • unixReviewTime
  • reviewTime
  • gl_product_group_desc
  • Sous-catégorie
  • upc1
  • nom de l’article
  • merchant_brand_name
  • customer_average_review_rating
  • customer_review_count
  • has_fba_offer
  • has_retail_offer
  • total_offers
  • prix_min
  • prix_max
  • min_3p_price
  • max_3p_price

Ensuite, je voulais capturer le sentiment des critiques.

Sentiment d’avis

Google API de traitement du langage naturel peut aider. J’ai traité les textes de révision dans cet outil et capturé quatre champs supplémentaires: clairement positif, clairement négatif, neutre et mixte. Chacun de ces champs contenait une «note du document», une «ampleur par document» et la «phrase ayant obtenu la note la plus élevée».

L'API Google Natural Language Processing peut identifier les émotions et les sentiments derrière le texte - des critiques sur Amazon dans ce cas.

L’API Google Natural Language Processing peut identifier les émotions et les sentiments derrière le texte – des critiques sur Amazon dans ce cas.

Pour être sûr, les critiques d’Amazon fournissent également une note (une à cinq étoiles) et je l’ai dans l’ensemble de données. Mais je voulais voir si une analyse plus granulaire fournirait des facteurs prédictifs supplémentaires.

Voici un exemple de document et de phrases pour le produit B00GG9FB8U.

{'asin': 'B00GG9FB8U',
'best_sentence_magnitude': 0.8,
'best_sentence_score': 0.8,
'document_magnitude': 7.3,
'document_score': 0.1}

Après avoir ajouté les sentiments à notre ensemble de données, je suis prêt pour la partie la plus excitante: apprendre quels facteurs sont les plus prédictifs.

Apprentissage automatique avec BigML

J’ai téléchargé notre fichier source sur BigML, l’outil d’apprentissage automatique susmentionné.

J’ai sélectionné le customer_reviews_count comme objectif prédictif et un réseau neuronal profond comme type de modèle d’apprentissage automatique à construire, car il est généralement le plus puissant.

BigML a recherché 128 combinaisons de modèles pour trouver les plus performantes. Voici les résultats dans l’ordre – les principaux prédicteurs des ventes.

  1. Sous-catégorie 86,73%
  2. Champ1 (numéro de produit) 9,6%
  3. Nom de l’article 3,49%
  4. Total_offres 0,06%
  5. Upc1 0,04%
  6. Customer_average_review_rating 0,03%
  7. Max_price 0,02%
  8. Min_price 0,01%

J’ai été surpris que le sentiment de l’avis n’ait aucun impact et que les notes («6. Customer_average_review_rating») et le prix («7. Max-price» et «8. Min_price») aient très peu d’impact prédictif.

La catégorie d'un produit sur Amazon est le meilleur prédicteur des ventes, selon une analyse d'apprentissage automatique utilisant BigML.

La catégorie d’un produit sur Amazon est le meilleur prédicteur des ventes, selon une analyse d’apprentissage automatique utilisant BigML.

Mais je peux maintenant voir comment le choix de la catégorie de produit et du nom du produit pourrait avoir un impact significatif car certains produits et catégories sont intrinsèquement populaires avec une forte demande. De même, le nombre d’offres de produits prédisait également les ventes globales.



Leave a reply

un × cinq =