Introduction
Quand on vend des produits que ce soit au supermarché ou sur un site web, la notion de panier d’achat du consommateur intervient immédiatement.
Le consommateur a un comportement que l’on peut analyser à travers ses achats. Son comportement bien qu’individuel peut être régit par une règle plus globale. Il est ainsi possible de déterminer les offres qui plairont efficacement aux consommateurs.
Tout d’abord, qu’appel t’on un panier d’achat ?
Regardons un exemple extrait d’une base de données pour nous rendre compte,de ce que cela peut représenter:
Client | Panier |
1808 | tropical.fruit, whole.milk, rolls.buns, citrus.fruit, sugar, meat, candy, semi.finished.bread, napkins, long.life.bakery.product |
2552 | tropical.fruit,whole.milk,other.vegetables, pot.plants,butter, chocolate,root.vegetables,coffee, shopping.bags,female.sanitary.products, hygiene.articles |
2300 | pip.fruit,other.vegetables,frankfurter, fruit.vegetable.juice,sausage, pork,flour,white.wine,hygiene.articles, long.life.bakery.product |
Nous avons trois paniers de trois clients différents. Du lait, des fruits, des légumes, des jus de fruits sont parmi les produits achetés par ces clients. Cela correspond finalement à ce que chacun d’entre nous pouvons acheter lorsque nous faisons nos courses.
On se rend rapidement compte que l’on peut essayer de déterminer des profils de consommations. Avec une approche plus globale, on peut efficacement augmenter la consommation des produits en connaissant les produits qui s’assemblent bien.
Un exemple très commun que l’on revoit tous les ans en France est pour la chandeleur au 2 février de chaque année. Les Français en cette période font des crêpes. Pour faire des crêpes il faut du lait , des œufs , de la farine , du beurrer, du sucres, de la confiture et de la patte à tartiner. Il n’est pas rare de voir sur les étalages des supermarchés pendant cette période de l’année proposer des promotions sur le lait, la farine et les œufs.
C’est effectivement un exemple assez facile. Il y a des outils pour chercher efficacement dans les bases de données des paniers de consommateurs et pour fabriquer des règles efficaces.
Les règles d’association
Les règles d’association font partie des règles utilisées par tous les groupes commerciaux compétents.
Avant de voir un exemple, nous nous attardons sur trois indices qui permettent de qualifier le résultat retourné par les algorithmes.
L’indice de support est la probabilité que l’on achète uniquement tous les produits ensemble dans la base de données. C’est assez rare sur des paniers complexes.
L’indice de confiance est la probabilité que sachant que des produits sont dans une transaction on achète aussi sont association. Plus grand, mieux c’est.
L’indice du lift est la corrélation de significativité de l’association au sein de la base de données. Il faut qu’il soit supérieur a 1.
lhs | rhs | support | confidence | lift | |
whole.milk,
chocolate, yogurt, root.vegetables, waffles |
sliced.cheese | 0.001282709 | 1 | 19.297030 | |
other.vegetables,
rolls.buns, yogurt, sausage, pastry |
whole.milk | 0.004104669 | 1 | 2.182531 | |
citrus.fruit,
chocolate, oil |
other.vegetables | 0.003335044 | 1 | 2.655313 | |
citrus.fruit,
pork, cream.cheese. |
whole.milk | 0.002565418 | 1 | 2.182531 | |
other.vegetables,
rolls.buns, yogurt,pastry |
whole.milk | 0.008978964 | 0.8139535 | 1.776479 | |
other.vegetables, beef,
bottled.water, detergent |
soft.cheese | 0.001282709 | 0.8333333 | 22.09751 |
Cette liste correspond en première colonne aux produits que l’on peut associer pour acheter le produit en deuxième colonne.
Dans cette exemple, on se rend compte de la difficulté d’une telle démarche dans une base complexe. Ces règles brutes demandent à être retravaillé systématiquement et prennent un temps considérable pour être utilisable.
En regardant l’exemple du lait, on s’aperçoit qu’il y a plusieurs possibilités pour que la vente soit améliorée. On pourrait se dire qu’en prenant juste les légumes et des petits pains cela suffirait, mais c’est une erreur. C’est bien l’association avec l’ensemble des ingrédients qui rend le panier cohérent pour le consommateur. Il y a plusieurs segments de consommateurs à qui on veut plaire en même temps d’où le choix cornélien pour constituer des offres commerciales qui feront mouche à chaque fois.
Inverser le processus
On a vu que les règles d’association donne un résultat brut et cohérent sur les paniers d’achat. Mais un commerce ne peut pas toujours fonctionner de la sorte. Il peut, par exemple, arrivé d’avoir des stocks de produits important à vendre et dont les règles d’association ne paraissent pas aider.
En utilisant une simple régression logistique ou une analyse de la variance on peut chercher dans l’ensemble des paniers , les produits dont l’action est significative. La description du modèle est suffisante pour valider à cout sûr une telle association de produits.
Dans notre exemple, nous cherchons le moyen le plus sure d’avoir une canette de bière dans le panier en choisissant d’autres produits.
L’anova donnera la liste suivante pour une significativité <1% (très bon, 99 % sure que ca colle):
whole.milk, rolls.buns, brown.bread, root.vegetables, pastry, ham, red.blush.wine, sugar, ice.cream , frozen.vegetables, salty.snack , canned.vegetables
En regardant ce panier, on a certainement trouvé un segment de consommateur. C’est un consommateur qui ne cuisine pas ou très peu, et qui aime le sucré.
Conclusion
En travaillant efficacement avec des données de panier on peut déterminer des segments de clientèles par rapport aux produits qu’ils consomment.
Le dernier exemple est frappant. On arrive à dessiner rapidement un dessin de notre panier et du consommateur qu’il pourrait être.