#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# pylint: disable=W1401
"""
Created on Mon Nov 6 21:04:24 2017
@author: lu
"""
import numpy as np
import pandas as pd
from sqlalchemy import create_engine
"""
這部分代碼主要是用Python連接數據庫,提取數據進行分析。
所j以在運行代碼之前需要講sql語句運行一遍將數據插入到mysql數據庫中
注意這裡需要提前創建一個database,並且在開頭增加使用database的語句
mysql -uroot -p < 7law.sql
需要等待一會
此部分代碼沒有運行,存在一定問題
count107-->統計107類別情況
programmer_1-->大概了解了處理數據意圖
programmer_2-->提取所需數據,並且保存到數據庫中
programmer_3-->進行數據篩選,保存到數據庫中
programmer_4-->合並某些特征為一個特征,保存到數據庫
programmer_5-->推薦矩陣
"""
def count107(i):
j = i[["fullURL"]][i["fullURLId"].str.contains("107")].copy()
# 添加空列
j["type"] = None
# 利用正則進行匹配,並重命名
j["type"][j["fullURL"].str.contains("info/.+?/")] = u"知識首頁"
j["ty