這篇文章將推薦5個大家可能沒有聽說過的機器學習項目,來自不同生態系統和編程語言。你可能會發現你並不需要其中的某一個工具,但是深入了解它們的實現細節和代碼有助於啟發我們的思路。
一.Hyperopt-sklearn
Hyperopt-sklearn
使用了多種搜索算法,可以搜索所有支持的分類器或者只是用參數給定的唯一分類器,它支持一系列數據預處理步驟,比如 PCA,
TfidfVectorizer, Normalzier, 以及 OneHotEncoder 等。
二.Dlib
Dlib 是使用 C++ 實現的可用於創建機器學習和數據分析應用的通用工具庫,並且提供了Python 接口。
三.NN++
NN++ 是一個 C++ 實現的輕量級、非常容易使用的神經網絡,無需安裝,直接#include即可。
四.LightGBM
來自微軟的梯度增強樹算法實現,提供了 C++ 和 Python 接口。
五.Sklearn-pandas
Sklearn-pandas 是一個正在開發中的模塊,在 Scikit-Learn 的機器學習方法和 Pandas 風格的 Data Frame 之間提供一個橋梁。