程序師世界是廣大編程愛好者互助、分享、學習的平台，程序師世界有你更精彩！


設為首頁	加入收藏

首頁
編程語言: C語言|JAVA編程
 Python編程
網頁編程: ASP編程|PHP編程
 JSP編程
數據庫知識: MYSQL數據庫|SqlServer數據庫
 Oracle數據庫|DB2數據庫

您现在的位置：程式師世界 >> 編程語言 > >> 更多編程語言 >> Python

Python第13章 Python建模庫介紹

編輯：Python

本書中，我已經介紹了Python數據分析的編程基礎。因為數據分析師和科學家總是在數據規整和准備上花費大量時間，這本書的重點在於掌握這些功能。

開發模型選用什麼庫取決於應用本身。許多統計問題可以用簡單方法解決，比如普通的最小二乘回歸，其它問題可能需要復雜的機器學習方法。幸運的是，Python已經成為了運用這些分析方法的語言之一，因此讀完此書，你可以探索許多工具。

本章中，我會回顧一些pandas的特點，在你膠著於pandas數據規整和模型擬合和評分時，它們可能派上用場。然後我會簡短介紹兩個流行的建模工具，statsmodels和scikit-learn。這二者每個都值得再寫一本書，我就不做全面的介紹，而是建議你學習兩個項目的線上文檔和其它基於Python的數據科學、統計和機器學習的書籍。

13.1 pandas與模型代碼的接口

模型開發的通常工作流是使用pandas進行數據加載和清洗，然後切換到建模庫進行建模。開發模型的重要一環是機器學習中的“特征工程”。它可以描述從原始數據集中提取信息的任何數據轉換或分析，這些數據集可能在建模中有用。本書中學習的數據聚合和GroupBy工具常用於特征工程中。

優秀的特征工程超出了本書的范圍，我會盡量直白地介紹一些用於數據操作和建模切換的方法。

pandas與其它分析庫通常是靠NumPy的數組聯系起來的。將DataFrame轉換為NumPy數組，可以使用.values屬性：

In [10]

上一篇文章： Python第14章數據分析案例
下一篇文章： Python第11章時間序列

Python

怎麼用Python讀取千萬級數據自動寫入MySQL數據庫

怎麼用Python讀取千萬級數據自動寫入MySQL數據庫這篇

Un exemple complet de réalisation de diagrammes thermodynamiques Python

Table des matièresUn.、Traiteme

python自動化實現的簡單使用

目錄環境配置定位1.Link_text定位超鏈接2.混合元素

Python Development -- 16 collection type built-in methods

List of articles One . purpos

Python升級之路( Lv8 ) 異常機制

Python系列文章目錄第一章 Python 入門第二章 P

Python中ndarray對象和list(列表)的相互轉換

Python的列表的功能挺多的，但是ndarray對象更強大

相關文章

没有相关文章

閱讀排行榜

Summary of common Django interview questions (2) 使用命令行參數運行的 Python 程序如何在 pycharm 中調試 Python draws chords Mutual conversion of Python timestamp and date Python3.7 machine learning -day2 Python requests module JSON reports an error Reshape in Python_ Reshape of numpy () python---內置庫os python發送post請求 python Spyder debug 出現異常 [Python crawler] Getting started with crawler and requests module

熱門圖文

asp清理緩存的代碼 Swift 與Objective-c語法參照 dialog-android：在對話中的setView問題 Struts2學習筆記，struts2學習延續取模觀察者模式(Subject/Observer) php中遍歷數組方法 php實現監控varnish緩存服務器的狀態

欄目導航

編程綜合問答

更多關於編程

編程問題解答

Copyright © 程式師世界 All Rights Reserved