Tech Talk: Comment utiliser l'analyse prédictive pour les campagnes de vente croisée

Tech Talk: Comment utiliser l'analyse prédictive pour les campagnes de vente croisée

Comment construire un modèle ML pour la vente croisée - afin de prédire si un client achètera plus de produits dans une période définie.

Comment construire un modèle ML pour la vente croisée - afin de prédire si un client achètera plus de produits dans une période définie.

Comment construire un modèle ML pour la vente croisée - afin de prédire si un client achètera plus de produits dans une période définie.

Dans une industrie B2B saturée, la vente croisée est une approche intéressante pour augmenter les revenus à moindre coût. Si un client a déjà acheté vos produits, lui vendre un autre produit est généralement moins cher que de convaincre un nouvel acheteur.

La plupart des entreprises ont fait confiance à l'expertise marketing interne pour décider qui contacter dans une campagne de vente croisée. Une autre approche consiste à utiliser des méthodes d'apprentissage automatique pour prendre des décisions appuyées par des données afin de déterminer quel client contacter et quel produit offrir.

Dans cet article, nous nous concentrerons sur la construction d'un modèle d'apprentissage automatique pour la vente croisée. Ce modèle prédira si un client achètera un autre produit de l'entreprise dans un horizon temporel défini. L'objectif est d'identifier les caractéristiques des clients qui achètent ce produit, puis de le recommander aux clients similaires.

Comprendre et transformer les données pour la modélisation

Tout d'abord, nous extrayons les données utiles des systèmes sources. Nous les transformons ensuite et les rendons disponibles pour la modélisation. Ces étapes sont appelées Extract-Transform-Load (ETL), processus que nous avons déjà abordé auparavant.

Que classifions-nous exactement ? Définir une cible précise

En parallèle de l'ETL, nous devons clarifier la définition de la cible avec le département marketing. La cible est ce que nous prédirons. Dans notre cas, nous avons défini la cible comme l'achat de produit du client dans les quelques mois suivant une date spécifiée. Dans cette future période, nous examinons si le client achète, appelée la fenêtre de prédiction.

Sur quelles informations nous appuyons-nous ? Dialoguer avec les parties prenantes

Nous analysons le comportement des clients sur une certaine période passée pour définir leur comportement futur. Nous appelons cette période passée la fenêtre d'observation. Par exemple, savoir qu'un client a dépensé 1000 euros il y a 5 ans peut ne pas être pertinent pour notre problème actuel. Le même client dépensant 500 euros sur un autre produit il y a deux mois est probablement plus adapté.

Pouvons-nous prédire si les clients achèteront un produit dans les 6 prochains mois en fonction de leur comportement au cours des 12 derniers mois ?

Nous créons des indicateurs qui décrivent le comportement d'achat du client. Par exemple, nous pouvons étudier le comportement d'achat basé sur la fenêtre d'observation. Nous calculons donc le montant dépensé par produit, le nombre d'interactions avec l'équipe de vente, le nombre d'échanges avec le service après-vente, le nombre d'e-mails commerciaux ouverts, etc. Pour calculer ces indicateurs, nous tranchons les données pertinentes du système source, puis les agrégeons de différentes manières en les additionnant, en faisant une moyenne ou en prenant des ratios. Nous désignons généralement cette partie comme l'ingénierie des caractéristiques.

Encodage des variables catégorielles

Étant donné que nous devons former le modèle de classification avec des données numériques, nous encodons des données catégorielles, c'est-à-dire converties en valeurs numériques interprétables par le modèle. La méthode d'encodage la plus célèbre est de créer une variable binaire par catégorie. Nous appelons cela l'encodage à chaud (one-hot encoding). Cette méthode est facile à mettre en œuvre et fonctionne généralement bien. Cependant, lorsque la variable à encoder a une grande cardinalité, créer une variable binaire par catégorie augmentera considérablement la dimensionnalité du jeu de données. Cela peut entraîner un manque d'observations d'apprentissage suffisantes pour prédire la cible. Par exemple, si une variable catégorielle a 250 valeurs uniques, l'encodage de cette variable créera 250 variables binaires.

Pour encoder ces variables avec une grande cardinalité, l'encodage cible est la solution. Pour chaque catégorie, nous calculons la probabilité de la cible. Ensuite, nous remplaçons la catégorie par sa probabilité. Nous obtenons alors une seule colonne contenant des probabilités. Cette méthode fonctionne bien pour des variables telles que les codes postaux ou NACE.

Déséquilibre des classes

Pour certains produits, très peu de clients les utilisaient. Dans nos données d'apprentissage, les deux classes étaient alors complètement déséquilibrées - 5 % de la population était dans la classe qui achèterait bientôt le produit, et les 95 % restants ne l'achèteraient pas. Ces proportions sont problématiques car les modèles peuvent classer indistinctement toutes les observations dans la classe majoritaire. Nous avons alors recours à des techniques de sur-échantillonnage ou de sous-échantillonnage pour rectifier l'équilibre entre les classes, de 5 %-95 % à 20 %-70 %.

En d'autres termes, nous créons artificiellement de nouvelles observations de la classe minoritaire (sur-échantillonnage) ou supprimons des observations de la classe majoritaire. Généralement, nous effectuons les deux procédures en parallèle pour atteindre l'équilibre. Dans le cas de cette étude, nous avons combiné le sur-échantillonnage avec SMOTE et le sous-échantillonnage aléatoire.

Mesurer la performance du modèle dans un contexte marketing

Une fois que vous avez formé les modèles de prédiction, vous souhaitez évaluer leur utilité. Vous voulez également disposer d'une métrique de performance qui signifiera quelque chose pour ceux qui l'utiliseront, par exemple, l'équipe marketing. Dans ce contexte, les métriques de qualité sont généralement le gain au lift à un certain point ou le gain (lift) cumulé à un certain seuil. L'avantage de ces métriques est leur interprétabilité directe.

Ces métriques comparent la performance du modèle avec une sélection au hasard, répondant à la question 'à quel point mon modèle est-il meilleur que le hasard ?'. Supposons que nous voulions lancer une campagne de vente croisée et que nous voulions obtenir une liste de clients à contacter.

Il existe plusieurs façons de créer cette liste. Nous pouvons nous appuyer sur le hasard, sur l'expertise de notre équipe ou sur un modèle prédictif. Pour chaque méthode, nous demandons un tri de liste des clients les plus susceptibles d'acheter aux moins susceptibles. Si nous décidons de ne contacter que les 10 % premiers de la liste, nous obtiendrons les clients en lesquels l'équipe marketing ou le modèle prédictif ont le plus confiance. Dans le cas du modèle prédictif, celui-ci traduira cela par des scores de prédiction plus élevés.

Un exemple de performance du modèle de vente croisée

Si nous avons 20 % de nos clients intéressés par l'achat du produit, nous voudrons les trouver aussi rapidement que possible sans avoir à contacter 100 % de notre base de données. C'est précisément là que le gain cumulé est intéressant. Il nous donne la proportion de clients à contacter pour trouver une certaine proportion d'acheteurs.

Si nous prenons le graphique ci-dessous, sur l'axe des abscisses, nous avons le pourcentage de clients atteints par la campagne. Évidemment, nous commençons d'abord à contacter des clients pour lesquels nous sommes plus confiants qu'ils achèteront, ceux avec des scores de prédiction plus élevés. Sur l'axe des ordonnées, nous avons le pourcentage des acheteurs réels qui ont été contactés. Il y a plusieurs lignes sur le graphique, une par méthode utilisée pour créer la liste.

Le gain cumulé pour un problème de vente croisée comparant la sélection aléatoire, l'expertise et le modèle prédictif

En utilisant une sélection aléatoire de clients, on trouvera des acheteurs de manière linéaire, c'est-à-dire que si vous contactez 20 % des clients, vous aurez trouvé 20 % des acheteurs. C'est la performance de référence que nous souhaitons dépasser. Si nous nous fions à une liste d'experts marketing (ligne turquoise), en contactant les 20 % premiers clients, nous trouverons environ 40 % de tous les acheteurs, deux fois plus que la sélection aléatoire. En contactant les 20 % de clients recommandés par le modèle prédictif (ligne rose/rouge), nous trouverons 60 % de tous les acheteurs.

C'est un moyen pratique de décrire la performance du modèle et de la mettre en perspective.

Utiliser les scores de prédiction pour orienter votre stratégie commerciale

Nous pouvons utiliser les mêmes graphiques pour élaborer la stratégie de contact. Nous pourrions déjà convaincre les premiers clients avec des scores de prédiction plus élevés. Ainsi, il peut ne pas être nécessaire de dépenser de l'argent pour les contacter car ils achèteront le produit de toute façon. À l'autre extrémité du spectre, les clients dans les derniers 10 % ne sont pour la plupart pas intéressés par le produit. Contacter ces clients pourrait alors entraîner un gaspillage d'argent.

Dérivation de l'intérêt pour le produit par quantile

C'est là que la

À partir de ces segments, nous pourrions élaborer une stratégie :

  • Soit sécuriser les convaincus

  • Ou transformer les clients hésitants en clients convaincus

Les points à retenir

Dans ce Tech Talk, nous. Nous avons abordé les points suivants :

  • L'importance de définir précisément la cible avec l'équipe marketing,

  • Construire vos données d'apprentissage en fonction d'une fenêtre d'observation,

  • Encoder soigneusement vos variables catégorielles,

  • Adapter vos données d'apprentissage pour une classification déséquilibrée,

  • Utiliser le gain cumulé pour expliquer la performance de votre modèle,

  • Utiliser le gain cumulé pour élaborer la stratégie commerciale.


Dans une industrie B2B saturée, la vente croisée est une approche intéressante pour augmenter les revenus à moindre coût. Si un client a déjà acheté vos produits, lui vendre un autre produit est généralement moins cher que de convaincre un nouvel acheteur.

La plupart des entreprises ont fait confiance à l'expertise marketing interne pour décider qui contacter dans une campagne de vente croisée. Une autre approche consiste à utiliser des méthodes d'apprentissage automatique pour prendre des décisions appuyées par des données afin de déterminer quel client contacter et quel produit offrir.

Dans cet article, nous nous concentrerons sur la construction d'un modèle d'apprentissage automatique pour la vente croisée. Ce modèle prédira si un client achètera un autre produit de l'entreprise dans un horizon temporel défini. L'objectif est d'identifier les caractéristiques des clients qui achètent ce produit, puis de le recommander aux clients similaires.

Comprendre et transformer les données pour la modélisation

Tout d'abord, nous extrayons les données utiles des systèmes sources. Nous les transformons ensuite et les rendons disponibles pour la modélisation. Ces étapes sont appelées Extract-Transform-Load (ETL), processus que nous avons déjà abordé auparavant.

Que classifions-nous exactement ? Définir une cible précise

En parallèle de l'ETL, nous devons clarifier la définition de la cible avec le département marketing. La cible est ce que nous prédirons. Dans notre cas, nous avons défini la cible comme l'achat de produit du client dans les quelques mois suivant une date spécifiée. Dans cette future période, nous examinons si le client achète, appelée la fenêtre de prédiction.

Sur quelles informations nous appuyons-nous ? Dialoguer avec les parties prenantes

Nous analysons le comportement des clients sur une certaine période passée pour définir leur comportement futur. Nous appelons cette période passée la fenêtre d'observation. Par exemple, savoir qu'un client a dépensé 1000 euros il y a 5 ans peut ne pas être pertinent pour notre problème actuel. Le même client dépensant 500 euros sur un autre produit il y a deux mois est probablement plus adapté.

Pouvons-nous prédire si les clients achèteront un produit dans les 6 prochains mois en fonction de leur comportement au cours des 12 derniers mois ?

Nous créons des indicateurs qui décrivent le comportement d'achat du client. Par exemple, nous pouvons étudier le comportement d'achat basé sur la fenêtre d'observation. Nous calculons donc le montant dépensé par produit, le nombre d'interactions avec l'équipe de vente, le nombre d'échanges avec le service après-vente, le nombre d'e-mails commerciaux ouverts, etc. Pour calculer ces indicateurs, nous tranchons les données pertinentes du système source, puis les agrégeons de différentes manières en les additionnant, en faisant une moyenne ou en prenant des ratios. Nous désignons généralement cette partie comme l'ingénierie des caractéristiques.

Encodage des variables catégorielles

Étant donné que nous devons former le modèle de classification avec des données numériques, nous encodons des données catégorielles, c'est-à-dire converties en valeurs numériques interprétables par le modèle. La méthode d'encodage la plus célèbre est de créer une variable binaire par catégorie. Nous appelons cela l'encodage à chaud (one-hot encoding). Cette méthode est facile à mettre en œuvre et fonctionne généralement bien. Cependant, lorsque la variable à encoder a une grande cardinalité, créer une variable binaire par catégorie augmentera considérablement la dimensionnalité du jeu de données. Cela peut entraîner un manque d'observations d'apprentissage suffisantes pour prédire la cible. Par exemple, si une variable catégorielle a 250 valeurs uniques, l'encodage de cette variable créera 250 variables binaires.

Pour encoder ces variables avec une grande cardinalité, l'encodage cible est la solution. Pour chaque catégorie, nous calculons la probabilité de la cible. Ensuite, nous remplaçons la catégorie par sa probabilité. Nous obtenons alors une seule colonne contenant des probabilités. Cette méthode fonctionne bien pour des variables telles que les codes postaux ou NACE.

Déséquilibre des classes

Pour certains produits, très peu de clients les utilisaient. Dans nos données d'apprentissage, les deux classes étaient alors complètement déséquilibrées - 5 % de la population était dans la classe qui achèterait bientôt le produit, et les 95 % restants ne l'achèteraient pas. Ces proportions sont problématiques car les modèles peuvent classer indistinctement toutes les observations dans la classe majoritaire. Nous avons alors recours à des techniques de sur-échantillonnage ou de sous-échantillonnage pour rectifier l'équilibre entre les classes, de 5 %-95 % à 20 %-70 %.

En d'autres termes, nous créons artificiellement de nouvelles observations de la classe minoritaire (sur-échantillonnage) ou supprimons des observations de la classe majoritaire. Généralement, nous effectuons les deux procédures en parallèle pour atteindre l'équilibre. Dans le cas de cette étude, nous avons combiné le sur-échantillonnage avec SMOTE et le sous-échantillonnage aléatoire.

Mesurer la performance du modèle dans un contexte marketing

Une fois que vous avez formé les modèles de prédiction, vous souhaitez évaluer leur utilité. Vous voulez également disposer d'une métrique de performance qui signifiera quelque chose pour ceux qui l'utiliseront, par exemple, l'équipe marketing. Dans ce contexte, les métriques de qualité sont généralement le gain au lift à un certain point ou le gain (lift) cumulé à un certain seuil. L'avantage de ces métriques est leur interprétabilité directe.

Ces métriques comparent la performance du modèle avec une sélection au hasard, répondant à la question 'à quel point mon modèle est-il meilleur que le hasard ?'. Supposons que nous voulions lancer une campagne de vente croisée et que nous voulions obtenir une liste de clients à contacter.

Il existe plusieurs façons de créer cette liste. Nous pouvons nous appuyer sur le hasard, sur l'expertise de notre équipe ou sur un modèle prédictif. Pour chaque méthode, nous demandons un tri de liste des clients les plus susceptibles d'acheter aux moins susceptibles. Si nous décidons de ne contacter que les 10 % premiers de la liste, nous obtiendrons les clients en lesquels l'équipe marketing ou le modèle prédictif ont le plus confiance. Dans le cas du modèle prédictif, celui-ci traduira cela par des scores de prédiction plus élevés.

Un exemple de performance du modèle de vente croisée

Si nous avons 20 % de nos clients intéressés par l'achat du produit, nous voudrons les trouver aussi rapidement que possible sans avoir à contacter 100 % de notre base de données. C'est précisément là que le gain cumulé est intéressant. Il nous donne la proportion de clients à contacter pour trouver une certaine proportion d'acheteurs.

Si nous prenons le graphique ci-dessous, sur l'axe des abscisses, nous avons le pourcentage de clients atteints par la campagne. Évidemment, nous commençons d'abord à contacter des clients pour lesquels nous sommes plus confiants qu'ils achèteront, ceux avec des scores de prédiction plus élevés. Sur l'axe des ordonnées, nous avons le pourcentage des acheteurs réels qui ont été contactés. Il y a plusieurs lignes sur le graphique, une par méthode utilisée pour créer la liste.

Le gain cumulé pour un problème de vente croisée comparant la sélection aléatoire, l'expertise et le modèle prédictif

En utilisant une sélection aléatoire de clients, on trouvera des acheteurs de manière linéaire, c'est-à-dire que si vous contactez 20 % des clients, vous aurez trouvé 20 % des acheteurs. C'est la performance de référence que nous souhaitons dépasser. Si nous nous fions à une liste d'experts marketing (ligne turquoise), en contactant les 20 % premiers clients, nous trouverons environ 40 % de tous les acheteurs, deux fois plus que la sélection aléatoire. En contactant les 20 % de clients recommandés par le modèle prédictif (ligne rose/rouge), nous trouverons 60 % de tous les acheteurs.

C'est un moyen pratique de décrire la performance du modèle et de la mettre en perspective.

Utiliser les scores de prédiction pour orienter votre stratégie commerciale

Nous pouvons utiliser les mêmes graphiques pour élaborer la stratégie de contact. Nous pourrions déjà convaincre les premiers clients avec des scores de prédiction plus élevés. Ainsi, il peut ne pas être nécessaire de dépenser de l'argent pour les contacter car ils achèteront le produit de toute façon. À l'autre extrémité du spectre, les clients dans les derniers 10 % ne sont pour la plupart pas intéressés par le produit. Contacter ces clients pourrait alors entraîner un gaspillage d'argent.

Dérivation de l'intérêt pour le produit par quantile

C'est là que la

À partir de ces segments, nous pourrions élaborer une stratégie :

  • Soit sécuriser les convaincus

  • Ou transformer les clients hésitants en clients convaincus

Les points à retenir

Dans ce Tech Talk, nous. Nous avons abordé les points suivants :

  • L'importance de définir précisément la cible avec l'équipe marketing,

  • Construire vos données d'apprentissage en fonction d'une fenêtre d'observation,

  • Encoder soigneusement vos variables catégorielles,

  • Adapter vos données d'apprentissage pour une classification déséquilibrée,

  • Utiliser le gain cumulé pour expliquer la performance de votre modèle,

  • Utiliser le gain cumulé pour élaborer la stratégie commerciale.


Dans une industrie B2B saturée, la vente croisée est une approche intéressante pour augmenter les revenus à moindre coût. Si un client a déjà acheté vos produits, lui vendre un autre produit est généralement moins cher que de convaincre un nouvel acheteur.

La plupart des entreprises ont fait confiance à l'expertise marketing interne pour décider qui contacter dans une campagne de vente croisée. Une autre approche consiste à utiliser des méthodes d'apprentissage automatique pour prendre des décisions appuyées par des données afin de déterminer quel client contacter et quel produit offrir.

Dans cet article, nous nous concentrerons sur la construction d'un modèle d'apprentissage automatique pour la vente croisée. Ce modèle prédira si un client achètera un autre produit de l'entreprise dans un horizon temporel défini. L'objectif est d'identifier les caractéristiques des clients qui achètent ce produit, puis de le recommander aux clients similaires.

Comprendre et transformer les données pour la modélisation

Tout d'abord, nous extrayons les données utiles des systèmes sources. Nous les transformons ensuite et les rendons disponibles pour la modélisation. Ces étapes sont appelées Extract-Transform-Load (ETL), processus que nous avons déjà abordé auparavant.

Que classifions-nous exactement ? Définir une cible précise

En parallèle de l'ETL, nous devons clarifier la définition de la cible avec le département marketing. La cible est ce que nous prédirons. Dans notre cas, nous avons défini la cible comme l'achat de produit du client dans les quelques mois suivant une date spécifiée. Dans cette future période, nous examinons si le client achète, appelée la fenêtre de prédiction.

Sur quelles informations nous appuyons-nous ? Dialoguer avec les parties prenantes

Nous analysons le comportement des clients sur une certaine période passée pour définir leur comportement futur. Nous appelons cette période passée la fenêtre d'observation. Par exemple, savoir qu'un client a dépensé 1000 euros il y a 5 ans peut ne pas être pertinent pour notre problème actuel. Le même client dépensant 500 euros sur un autre produit il y a deux mois est probablement plus adapté.

Pouvons-nous prédire si les clients achèteront un produit dans les 6 prochains mois en fonction de leur comportement au cours des 12 derniers mois ?

Nous créons des indicateurs qui décrivent le comportement d'achat du client. Par exemple, nous pouvons étudier le comportement d'achat basé sur la fenêtre d'observation. Nous calculons donc le montant dépensé par produit, le nombre d'interactions avec l'équipe de vente, le nombre d'échanges avec le service après-vente, le nombre d'e-mails commerciaux ouverts, etc. Pour calculer ces indicateurs, nous tranchons les données pertinentes du système source, puis les agrégeons de différentes manières en les additionnant, en faisant une moyenne ou en prenant des ratios. Nous désignons généralement cette partie comme l'ingénierie des caractéristiques.

Encodage des variables catégorielles

Étant donné que nous devons former le modèle de classification avec des données numériques, nous encodons des données catégorielles, c'est-à-dire converties en valeurs numériques interprétables par le modèle. La méthode d'encodage la plus célèbre est de créer une variable binaire par catégorie. Nous appelons cela l'encodage à chaud (one-hot encoding). Cette méthode est facile à mettre en œuvre et fonctionne généralement bien. Cependant, lorsque la variable à encoder a une grande cardinalité, créer une variable binaire par catégorie augmentera considérablement la dimensionnalité du jeu de données. Cela peut entraîner un manque d'observations d'apprentissage suffisantes pour prédire la cible. Par exemple, si une variable catégorielle a 250 valeurs uniques, l'encodage de cette variable créera 250 variables binaires.

Pour encoder ces variables avec une grande cardinalité, l'encodage cible est la solution. Pour chaque catégorie, nous calculons la probabilité de la cible. Ensuite, nous remplaçons la catégorie par sa probabilité. Nous obtenons alors une seule colonne contenant des probabilités. Cette méthode fonctionne bien pour des variables telles que les codes postaux ou NACE.

Déséquilibre des classes

Pour certains produits, très peu de clients les utilisaient. Dans nos données d'apprentissage, les deux classes étaient alors complètement déséquilibrées - 5 % de la population était dans la classe qui achèterait bientôt le produit, et les 95 % restants ne l'achèteraient pas. Ces proportions sont problématiques car les modèles peuvent classer indistinctement toutes les observations dans la classe majoritaire. Nous avons alors recours à des techniques de sur-échantillonnage ou de sous-échantillonnage pour rectifier l'équilibre entre les classes, de 5 %-95 % à 20 %-70 %.

En d'autres termes, nous créons artificiellement de nouvelles observations de la classe minoritaire (sur-échantillonnage) ou supprimons des observations de la classe majoritaire. Généralement, nous effectuons les deux procédures en parallèle pour atteindre l'équilibre. Dans le cas de cette étude, nous avons combiné le sur-échantillonnage avec SMOTE et le sous-échantillonnage aléatoire.

Mesurer la performance du modèle dans un contexte marketing

Une fois que vous avez formé les modèles de prédiction, vous souhaitez évaluer leur utilité. Vous voulez également disposer d'une métrique de performance qui signifiera quelque chose pour ceux qui l'utiliseront, par exemple, l'équipe marketing. Dans ce contexte, les métriques de qualité sont généralement le gain au lift à un certain point ou le gain (lift) cumulé à un certain seuil. L'avantage de ces métriques est leur interprétabilité directe.

Ces métriques comparent la performance du modèle avec une sélection au hasard, répondant à la question 'à quel point mon modèle est-il meilleur que le hasard ?'. Supposons que nous voulions lancer une campagne de vente croisée et que nous voulions obtenir une liste de clients à contacter.

Il existe plusieurs façons de créer cette liste. Nous pouvons nous appuyer sur le hasard, sur l'expertise de notre équipe ou sur un modèle prédictif. Pour chaque méthode, nous demandons un tri de liste des clients les plus susceptibles d'acheter aux moins susceptibles. Si nous décidons de ne contacter que les 10 % premiers de la liste, nous obtiendrons les clients en lesquels l'équipe marketing ou le modèle prédictif ont le plus confiance. Dans le cas du modèle prédictif, celui-ci traduira cela par des scores de prédiction plus élevés.

Un exemple de performance du modèle de vente croisée

Si nous avons 20 % de nos clients intéressés par l'achat du produit, nous voudrons les trouver aussi rapidement que possible sans avoir à contacter 100 % de notre base de données. C'est précisément là que le gain cumulé est intéressant. Il nous donne la proportion de clients à contacter pour trouver une certaine proportion d'acheteurs.

Si nous prenons le graphique ci-dessous, sur l'axe des abscisses, nous avons le pourcentage de clients atteints par la campagne. Évidemment, nous commençons d'abord à contacter des clients pour lesquels nous sommes plus confiants qu'ils achèteront, ceux avec des scores de prédiction plus élevés. Sur l'axe des ordonnées, nous avons le pourcentage des acheteurs réels qui ont été contactés. Il y a plusieurs lignes sur le graphique, une par méthode utilisée pour créer la liste.

Le gain cumulé pour un problème de vente croisée comparant la sélection aléatoire, l'expertise et le modèle prédictif

En utilisant une sélection aléatoire de clients, on trouvera des acheteurs de manière linéaire, c'est-à-dire que si vous contactez 20 % des clients, vous aurez trouvé 20 % des acheteurs. C'est la performance de référence que nous souhaitons dépasser. Si nous nous fions à une liste d'experts marketing (ligne turquoise), en contactant les 20 % premiers clients, nous trouverons environ 40 % de tous les acheteurs, deux fois plus que la sélection aléatoire. En contactant les 20 % de clients recommandés par le modèle prédictif (ligne rose/rouge), nous trouverons 60 % de tous les acheteurs.

C'est un moyen pratique de décrire la performance du modèle et de la mettre en perspective.

Utiliser les scores de prédiction pour orienter votre stratégie commerciale

Nous pouvons utiliser les mêmes graphiques pour élaborer la stratégie de contact. Nous pourrions déjà convaincre les premiers clients avec des scores de prédiction plus élevés. Ainsi, il peut ne pas être nécessaire de dépenser de l'argent pour les contacter car ils achèteront le produit de toute façon. À l'autre extrémité du spectre, les clients dans les derniers 10 % ne sont pour la plupart pas intéressés par le produit. Contacter ces clients pourrait alors entraîner un gaspillage d'argent.

Dérivation de l'intérêt pour le produit par quantile

C'est là que la

À partir de ces segments, nous pourrions élaborer une stratégie :

  • Soit sécuriser les convaincus

  • Ou transformer les clients hésitants en clients convaincus

Les points à retenir

Dans ce Tech Talk, nous. Nous avons abordé les points suivants :

  • L'importance de définir précisément la cible avec l'équipe marketing,

  • Construire vos données d'apprentissage en fonction d'une fenêtre d'observation,

  • Encoder soigneusement vos variables catégorielles,

  • Adapter vos données d'apprentissage pour une classification déséquilibrée,

  • Utiliser le gain cumulé pour expliquer la performance de votre modèle,

  • Utiliser le gain cumulé pour élaborer la stratégie commerciale.


Prêt à atteindre vos objectifs avec les données ?

Si vous souhaitez atteindre vos objectifs grâce à une utilisation plus intelligente des données et de l'IA, vous êtes au bon endroit.

Prêt à atteindre vos objectifs avec les données ?

Si vous souhaitez atteindre vos objectifs grâce à une utilisation plus intelligente des données et de l'IA, vous êtes au bon endroit.

Prêt à atteindre vos objectifs avec les données ?

Si vous souhaitez atteindre vos objectifs grâce à une utilisation plus intelligente des données et de l'IA, vous êtes au bon endroit.

Prêt à atteindre vos objectifs avec les données ?

Si vous souhaitez atteindre vos objectifs grâce à une utilisation plus intelligente des données et de l'IA, vous êtes au bon endroit.

© 2025 Agilytic

© 2025 Agilytic

© 2025 Agilytic