{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "## Model Selection - Instagram Top Post" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "# Importing the required libraries\n", "import numpy as np\n", "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "import seaborn as sns\n", "\n", "from sklearn.preprocessing import LabelEncoder\n", "from sklearn.model_selection import train_test_split, cross_val_score\n", "from sklearn.linear_model import LogisticRegression\n", "from sklearn.ensemble import RandomForestClassifier\n", "from sklearn.neural_network import MLPClassifier\n", "from sklearn.metrics import confusion_matrix , classification_report, f1_score,\\\n", " accuracy_score, precision_score, recall_score, f1_score\n", "from sklearn.model_selection import GridSearchCV\n", "\n", "SEED = 0" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | height | \n", "width | \n", "has_audio | \n", "video_view_count | \n", "is_video | \n", "is_verified | \n", "followers_count | \n", "comments_count | \n", "hashtag_count | \n", "like_count | \n", "tag_name | \n", "caption_length | \n", "is_top | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1349 | \n", "1080 | \n", "False | \n", "0 | \n", "False | \n", "False | \n", "774304 | \n", "626 | \n", "0 | \n", "50311 | \n", "2021 | \n", "49 | \n", "1 | \n", "
1 | \n", "1332 | \n", "1080 | \n", "False | \n", "0 | \n", "False | \n", "False | \n", "68438 | \n", "7 | \n", "11 | \n", "1957 | \n", "2021 | \n", "382 | \n", "1 | \n", "
2 | \n", "1350 | \n", "1080 | \n", "False | \n", "0 | \n", "False | \n", "False | \n", "3122 | \n", "102 | \n", "23 | \n", "595 | \n", "2021 | \n", "377 | \n", "1 | \n", "
3 | \n", "1080 | \n", "1080 | \n", "False | \n", "0 | \n", "False | \n", "False | \n", "250500 | \n", "123573 | \n", "5 | \n", "8290 | \n", "2021 | \n", "512 | \n", "1 | \n", "
4 | \n", "1349 | \n", "1080 | \n", "False | \n", "0 | \n", "False | \n", "False | \n", "3578 | \n", "26 | \n", "4 | \n", "365 | \n", "2021 | \n", "45 | \n", "1 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
2165 | \n", "1085 | \n", "1080 | \n", "False | \n", "0 | \n", "False | \n", "False | \n", "2002 | \n", "28 | \n", "15 | \n", "74 | \n", "world | \n", "671 | \n", "0 | \n", "
2166 | \n", "750 | \n", "750 | \n", "True | \n", "48 | \n", "True | \n", "False | \n", "72 | \n", "0 | \n", "8 | \n", "7 | \n", "world | \n", "51 | \n", "0 | \n", "
2167 | \n", "1080 | \n", "1080 | \n", "False | \n", "0 | \n", "False | \n", "False | \n", "1386 | \n", "0 | \n", "19 | \n", "4 | \n", "world | \n", "200 | \n", "0 | \n", "
2168 | \n", "1110 | \n", "1080 | \n", "False | \n", "0 | \n", "False | \n", "False | \n", "450271 | \n", "260 | \n", "19 | \n", "8371 | \n", "world | \n", "463 | \n", "0 | \n", "
2169 | \n", "640 | \n", "640 | \n", "False | \n", "26 | \n", "True | \n", "False | \n", "42 | \n", "0 | \n", "29 | \n", "17 | \n", "world | \n", "429 | \n", "0 | \n", "
2170 rows × 13 columns
\n", "\n", " | height | \n", "width | \n", "has_audio | \n", "video_view_count | \n", "is_video | \n", "is_verified | \n", "followers_count | \n", "comments_count | \n", "hashtag_count | \n", "like_count | \n", "... | \n", "tag_name_travel | \n", "tag_name_trump | \n", "tag_name_university | \n", "tag_name_water | \n", "tag_name_wolf | \n", "tag_name_women | \n", "tag_name_word | \n", "tag_name_workathome | \n", "tag_name_workonline | \n", "tag_name_world | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1674 | \n", "750 | \n", "750 | \n", "1 | \n", "50 | \n", "1 | \n", "0 | \n", "30 | \n", "0 | \n", "6 | \n", "4 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
1978 | \n", "1080 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "5563 | \n", "11 | \n", "0 | \n", "153 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
1746 | \n", "645 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "188 | \n", "0 | \n", "19 | \n", "1 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
1191 | \n", "658 | \n", "750 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "483 | \n", "15 | \n", "14 | \n", "62 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
990 | \n", "1080 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1950 | \n", "126 | \n", "19 | \n", "759 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
1013 | \n", "600 | \n", "480 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "124858 | \n", "9 | \n", "29 | \n", "819 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
462 | \n", "1350 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "15899 | \n", "65 | \n", "22 | \n", "528 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
495 | \n", "640 | \n", "640 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "699 | \n", "12 | \n", "0 | \n", "187 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
2013 | \n", "750 | \n", "750 | \n", "0 | \n", "37 | \n", "1 | \n", "0 | \n", "578 | \n", "0 | \n", "17 | \n", "9 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
608 | \n", "1348 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "626462 | \n", "45 | \n", "22 | \n", "10428 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
878 | \n", "1349 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "117806 | \n", "242 | \n", "30 | \n", "11651 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
2005 | \n", "1053 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "338110 | \n", "107 | \n", "0 | \n", "4287 | \n", "... | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
653 | \n", "1080 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1442 | \n", "16 | \n", "16 | \n", "617 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
1252 | \n", "1080 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "714 | \n", "0 | \n", "27 | \n", "3 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
548 | \n", "640 | \n", "640 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "614130 | \n", "13 | \n", "29 | \n", "1771 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
440 | \n", "1346 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "120920 | \n", "9 | \n", "29 | \n", "275 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
158 | \n", "1080 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "25226 | \n", "32 | \n", "30 | \n", "557 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
1100 | \n", "750 | \n", "750 | \n", "0 | \n", "108 | \n", "1 | \n", "0 | \n", "7045 | \n", "0 | \n", "28 | \n", "16 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
2121 | \n", "800 | \n", "640 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "137 | \n", "2 | \n", "15 | \n", "12 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "
1281 | \n", "905 | \n", "1080 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "2284 | \n", "0 | \n", "5 | \n", "4 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
20 rows × 130 columns
\n", "\n", " | Model | \n", "Training Acc | \n", "Testing Acc | \n", "Precision | \n", "Recall | \n", "F1 Score | \n", "
---|---|---|---|---|---|---|
1 | \n", "Random Forest | \n", "0.966195 | \n", "0.939227 | \n", "0.941652 | \n", "0.938186 | \n", "0.938987 | \n", "
0 | \n", "Logistic Regression | \n", "0.900430 | \n", "0.869245 | \n", "0.873701 | \n", "0.871021 | \n", "0.869131 | \n", "