<div>
<style scoped>
    .dataframe tbody tr th:only-of-type {
        vertical-align: middle;
    }

    .dataframe tbody tr th {
        vertical-align: top;
    }

    .dataframe thead th {
        text-align: right;
    }
</style>
<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>Week</th>
      <th>SKU</th>
      <th>Customer</th>
      <th>Unit Price ($)</th>
      <th>Units sold ('000s)</th>
      <th>Unnamed: 5</th>
      <th>Unnamed: 6</th>
      <th>Unnamed: 7</th>
      <th>Unnamed: 8</th>
      <th>Unnamed: 9</th>
      <th>Unnamed: 10</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>0</th>
      <td>31/Mar/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>13.0</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>1</th>
      <td>07/Apr/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>12.9</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>2</th>
      <td>14/Apr/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>14.8</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>3</th>
      <td>21/Apr/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>13.6</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>4</th>
      <td>28/Apr/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>15.0</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
  </tbody>
</table>
</div>

          Week       SKU  Customer  Unit Price ($)  Units sold ('000s)  \
0  31/Mar/2019  SKU01001  CUS09005            4.99                13.0   
1  07/Apr/2019  SKU01001  CUS09005            4.99                12.9   
2  14/Apr/2019  SKU01001  CUS09005            4.99                14.8   
3  21/Apr/2019  SKU01001  CUS09005            4.99                13.6   
4  28/Apr/2019  SKU01001  CUS09005            4.99                15.0   

   Unnamed: 5  Unnamed: 6  Unnamed: 7  Unnamed: 8  Unnamed: 9  Unnamed: 10  
0         NaN         NaN         NaN         NaN         NaN          NaN  
1         NaN         NaN         NaN         NaN         NaN          NaN  
2         NaN         NaN         NaN         NaN         NaN          NaN  
3         NaN         NaN         NaN         NaN         NaN          NaN  
4         NaN         NaN         NaN         NaN         NaN          NaN  

<div>
<style scoped>
    .dataframe tbody tr th:only-of-type {
        vertical-align: middle;
    }

    .dataframe tbody tr th {
        vertical-align: top;
    }

    .dataframe thead th {
        text-align: right;
    }
</style>
<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>Week</th>
      <th>SKU</th>
      <th>Customer</th>
      <th>Unit Price</th>
      <th>Unnamed: 4</th>
      <th>Unnamed: 5</th>
      <th>Unnamed: 6</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>0</th>
      <td>28/Apr/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>8.98</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>1</th>
      <td>05/May/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>8.98</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>2</th>
      <td>12/May/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>8.98</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>3</th>
      <td>19/May/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>7.50</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>4</th>
      <td>26/May/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>8.98</td>
      <td>NaN</td>
      <td>NaN</td>
      <td>NaN</td>
    </tr>
  </tbody>
</table>
</div>

          Week       SKU  Customer  Unit Price  Unnamed: 4  Unnamed: 5  \
0  28/Apr/2024  SKU01001  CUS09005        8.98         NaN         NaN   
1  05/May/2024  SKU01001  CUS09005        8.98         NaN         NaN   
2  12/May/2024  SKU01001  CUS09005        8.98         NaN         NaN   
3  19/May/2024  SKU01001  CUS09005        7.50         NaN         NaN   
4  26/May/2024  SKU01001  CUS09005        8.98         NaN         NaN   

   Unnamed: 6  
0         NaN  
1         NaN  
2         NaN  
3         NaN  
4         NaN  

<div>
<style scoped>
    .dataframe tbody tr th:only-of-type {
        vertical-align: middle;
    }

    .dataframe tbody tr th {
        vertical-align: top;
    }

    .dataframe thead th {
        text-align: right;
    }
</style>
<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>Week</th>
      <th>SKU</th>
      <th>Customer</th>
      <th>Unit Price ($)</th>
      <th>Units sold ('000s)</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>0</th>
      <td>31/Mar/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>13.0</td>
    </tr>
    <tr>
      <th>1</th>
      <td>07/Apr/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>12.9</td>
    </tr>
    <tr>
      <th>2</th>
      <td>14/Apr/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>14.8</td>
    </tr>
    <tr>
      <th>3</th>
      <td>21/Apr/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>13.6</td>
    </tr>
    <tr>
      <th>4</th>
      <td>28/Apr/2019</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>4.99</td>
      <td>15.0</td>
    </tr>
  </tbody>
</table>
</div>

          Week       SKU  Customer  Unit Price ($)  Units sold ('000s)
0  31/Mar/2019  SKU01001  CUS09005            4.99                13.0
1  07/Apr/2019  SKU01001  CUS09005            4.99                12.9
2  14/Apr/2019  SKU01001  CUS09005            4.99                14.8
3  21/Apr/2019  SKU01001  CUS09005            4.99                13.6
4  28/Apr/2019  SKU01001  CUS09005            4.99                15.0

<div>
<style scoped>
    .dataframe tbody tr th:only-of-type {
        vertical-align: middle;
    }

    .dataframe tbody tr th {
        vertical-align: top;
    }

    .dataframe thead th {
        text-align: right;
    }
</style>
<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>Week</th>
      <th>SKU</th>
      <th>Customer</th>
      <th>Unit Price</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>0</th>
      <td>28/Apr/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>8.98</td>
    </tr>
    <tr>
      <th>1</th>
      <td>05/May/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>8.98</td>
    </tr>
    <tr>
      <th>2</th>
      <td>12/May/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>8.98</td>
    </tr>
    <tr>
      <th>3</th>
      <td>19/May/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>7.50</td>
    </tr>
    <tr>
      <th>4</th>
      <td>26/May/2024</td>
      <td>SKU01001</td>
      <td>CUS09005</td>
      <td>8.98</td>
    </tr>
  </tbody>
</table>
</div>

          Week       SKU  Customer  Unit Price
0  28/Apr/2024  SKU01001  CUS09005        8.98
1  05/May/2024  SKU01001  CUS09005        8.98
2  12/May/2024  SKU01001  CUS09005        8.98
3  19/May/2024  SKU01001  CUS09005        7.50
4  26/May/2024  SKU01001  CUS09005        8.98

Handling Unseen Categories in Label Encoding for SKU Column in Predictive Sales Model

Train a XGBoost model based on the train csv to predict the total number of sales of the result.csv. Try to find the model that would perform best for this