df = pd.read_csv(data_path, low_memory=False)
#時間特征
df['date'] = pd.to_datetime(df['date'])
#年
df['year'] = df['date'].map(lambda x: (x.year))
#月
df['month'] = df['date'].map(lambda x: (x.month))
#日
df['day'] = df['date'].map(lambda x: (x.day))
#小時
df['hour'] = df['date'].map(lambda x: (x.hour))
#分鐘
df['minute'] = df['date'].map(lambda x: (x.minute))
#星期幾
df['dayofweek'] = df['date'].map(lambda x: (x.dayofweek+1))
上述的時間特征為數值型
自行百度搜索one-hot
如上所示,將一個時間變量變成一個二維平面圓周上的點。這樣就能解決周期性因素。