用Python做数据分析离不开几个好的轮子(或称为科学棧/第三方包等),比如matplotlib,numpy, scipy, pandas, scikit-learn, gensim等,这些包的功能强大,丰富,包括含了绘图,机器学习,爬虫,数据分析等等。而开发工具推荐使用pycharm或者Jupyter notebook(ipython notebook)。开发起来的样子是这样的。
此方法,同时适用于windows和linux(也许mac也行,没实践过)。我的环境是Ubuntu16.04,64位,python2.7.12,python3.5.1+。不过,这次的记录安装方式跟系统关系不大,linux和windows实践方式相同,只不过,windows用户打开CMD后,输入的命令不带sudo,也不需要另行安装pip(windows自带)
1.安装Jupyter notebook(或者安装pycharm直接下载安装皆可,Linux和Windows同样适用)
#如果是ubuntu16.04 默认已经安装了python2和python3
#需要另行安装pip,python2的pip安装
sudo apt-get python-pip
#如果安装python3的pip
sudo apt-get python3-pip
#安装开发工具Jupyter notebook
sudo pip3 install jupyter
#如果是ubuntu16.04 默认已经安装了python2和python3
#需要另行安装pip,python2的pip安装
sudo apt-get python-pip
#如果安装python3的pip
sudo apt-get python3-pip
#安装开发工具Jupyter notebook
sudo pip3 install jupyter
注意,只能安装一个jupyter notebook,默认只能包含一个内核,如python3或者python2,请根据自己开发需求。
特殊需求:
需要python3和python2共存的,请看我另几篇文章。Windows下Python多版本共存
2.在线安装(Windows/Linux)主要的数据分析工具(轮子)
注意:Ubuntn中,默认的pip 是指python2的,pip3才是python3的,如果安装python3的轮子,请将pip替换成pip3,反之亦然。
数据分析(为了避免依赖冲突,请按顺序安装)
sudo pip3 install numpy
sudo pip3 install pandas
#安装matplotlib需要先安装libpng和freetype
sudo apt-get install libpng-dev
#如果不知到需要下载工具的全称,可以用来查找需要工具的关键词sudo apt search freetype
sudo apt-get install libfreetype6-dev
sudo pip3 install matplotlib
sudo pip3 install scipy
#文本处理工具
sudo pip3 install gensim
#机器学习
sudo pip3 install scikit-learn
安装完成某个轮子之后,应该是这样的
以此方法安装,随着知识领域的扩展和经验的增加,我们会发现更多更有趣的轮子。
查看已经安装的轮子
pip3 list
3.离线安装(windows/linux)数据分析工具(轮子)
直接在上述网址下载对应的.whl(虽然本网址http://www.lfd.uci.edu/~gohlke/pythonlibs/只有win的= =,但是方法适合任何平台,离线包可以去官网下载,如https://pypi.python.org/pypi/scipy/)
pip3 install 下载的本地路径/numpy-1.11.1+mkl-cp35-cp35m-win_amd64.whl
pip3 install 下载的本地路径/numpy-1.11.1-cp27-cp27mu-manylinux1_x86_64.whl
4.主要的大数据分析轮子介绍
已经存在的介绍就不赘述了,直接上送包下载地址,且该地址对包有了大意的介绍。
送上python包地址http://www.lfd.uci.edu/~gohlke/pythonlibs/
Ubuntu 14.04安装Python 3.3.5 http://www.linuxidc.com/Linux/2014-05/101481.htm
CentOS上源码安装Python3.4 http://www.linuxidc.com/Linux/2015-01/111870.htm
《Python核心编程 第二版》.(Wesley J. Chun ).[高清PDF中文版] http://www.linuxidc.com/Linux/2013-06/85425.htm
《Python开发技术详解》.( 周伟,宗杰).[高清PDF扫描版+随书视频+代码] http://www.linuxidc.com/Linux/2013-11/92693.htm
Python脚本获取Linux系统信息 http://www.linuxidc.com/Linux/2013-08/88531.htm
在Ubuntu下用Python搭建桌面算法交易研究环境 http://www.linuxidc.com/Linux/2013-11/92534.htm
Python 语言的发展简史 http://www.linuxidc.com/Linux/2014-09/107206.htm
Python 的详细介绍:请点这里
Python 的下载地址:请点这里
本文永久更新链接地址:http://www.linuxidc.com/Linux/2016-08/134107.htm