Description:C'est un projet pratique d'apprentissage automatique(AnnexeDonnées+Code+Documentation+Explication vidéo),Si nécessaireDonnées+Code+Documentation+Explication vidéoPeut être obtenu directement à la fin de l'article.
1.Contexte du projet
La publicité économique est une publicité à but lucratif,Généralement des annonces commerciales,Il s'agit de vendre des biens ou de fournir des services.,Moyens de diffuser l'information sur les produits ou services auprès des consommateurs ou des utilisateurs, moyennant paiement, par l'intermédiaire des médias publicitaires.C'est ce qu'est la publicité commerciale..Pour promouvoir la vente de produits,Les fabricants publient souvent des annonces sur plusieurs canaux.Le projet sera basé sur la télévision、Les données sur la publicité à la radio et dans les journaux prédisent les revenus publicitaires,En tant que référence importante pour la formulation de la stratégie publicitaire de l'entreprise.
Dans le cadre de ce projet, les données sur la publicité sont prédites à l'aide d'un modèle de régression du réseau neuronal artificiel.,Et ajuster le modèle par algorithme de recherche de grille,Optimiser le modèle.
2.Acquisition de données
Les données de cette modélisation proviennent du réseau(Les auteurs de ce projet ont compilé),Les statistiques des éléments de données sont les suivantes::
Les données détaillées sont les suivantes:(Présentation partielle):
3.Prétraitement des données
3.1 AvecPandasOutils pour voir les données
UtiliserPandasOutilshead()Méthode de visualisation des cinq premières lignes de données:
Code clé:
3.2 Données manquantes vue
UtiliserPandasOutilsinfo() Méthode de visualisation des données :
Comme vous pouvez le voir dans l'image ci - dessus,En tout.5Variables, Aucune valeur manquante dans les données ,Total1000Données.
Code clé:
3.3Statistiques descriptives des données
AdoptionPandasOutilsdescribe() Méthode pour voir la moyenne des données 、Écart type、Minimum、Quantile、Max..
Les codes clés sont les suivants::
4.Analyse exploratoire des données
4.1 Graphique des revenus
AvecMatplotlibOutilsplot()Méthode de dessin du diagramme linéaire:
4.2 Histogramme de la répartition des revenus
AvecMatplotlibOutilshist()Méthode de dessin des histogrammes:
Comme le montre la figure ci - dessus, Les recettes sont réparties principalement entre 150~250Entre.
4.3 Diagramme de dispersion et ligne d'ajustement du mode de placement et du revenu de la publicité télévisée
AvecseabornOutilslmplot () Méthode de dessin du diagramme de dispersion et de la ligne d'ajustement :
Comme le montre la figure ci - dessus, Le mode d'investissement de la publicité télévisée a une bonne relation linéaire avec le revenu .
4.4 Analyse de corrélation
Comme vous pouvez le voir dans l'image ci - dessus,Plus la valeur est grande, plus la corrélation est forte,Les valeurs positives sont positivement corrélées、Une valeur négative est une corrélation négative.
5.Ingénierie des caractéristiques
5.1 Créer des données sur les caractéristiques et les étiquettes
Les codes clés sont les suivants::
5.2 Partage des ensembles de données
Adoptiontrain_test_split()Méthode selon80%Jeux d'entraînement、20%L'ensemble d'essai est divisé,Les codes clés sont les suivants::
6. Construire un modèle de régression du réseau neuronal artificiel
Utilisation principaleMLPRegressor Algorithmes et algorithmes d'optimisation de la recherche en grille ,Pour la régression des objectifs.
6.1 Paramètres par défaut construire le modèle
6.2 Paramètres optimaux recherchés par la recherche en grille
Code clé:
Paramètres optimaux:
6.3 Modèle de construction numérique des paramètres optimaux
7.Évaluation du modèle
7.1Indicateurs d'évaluation et résultats
Les indicateurs d'évaluation comprennent principalement des valeurs de variance interprétables.、Erreur absolue moyenne、Erreur carrée moyenne、RValeur carrée, etc.
Comme le montre le tableau ci - dessus,,RFang Wei0.9412 Amélioration par rapport au paramètre par défaut ;La variance interprétable est0.6777 Amélioration par rapport au paramètre par défaut , Le modèle de régression optimisé donne de bons résultats .
Les codes clés sont les suivants::
7.2 Comparaison des valeurs réelles et prévues
Comme le montre la figure ci - dessus, les fluctuations des valeurs réelles et prévues sont essentiellement les mêmes.,Bon ajustement du modèle.
8.Conclusions et perspectives
En résumé, Cet article utilise l'algorithme de régression du réseau neuronal artificiel pour construire le modèle de régression , Trouver le nombre optimal de couches cachées et de neurones par algorithme de recherche en grille ,Enfin, le modèle proposé s'est avéré très efficace., Peut être utilisé pour la prévision dans la production réelle , Améliorer le développement des entreprises , Plus de profit .
Matériel nécessaire à la mise en œuvre de ce projet d'apprentissage automatique,Les ressources du projet sont les suivantes::
Description du projet:
Liens:https://pan.baidu.com/s/1dW3S1a6KGdUHK90W-lmA4w
Code d'extraction:bcbpSi le disque réseau échoue,Peut ajouter un blogueur Wechat:zy10178083