Saturday, August 20, 2016

用 Docker與 Python Jupyter Notebook 做巨量資料分析


https://github.com/lucasko-tw/docker-jupyter

Jupyter Notebook是一個Python的IDE

使用Jupyter Notebook的好處是:
1. 只要透過瀏覽器連到Server就可以進行開發。
2. 與同事進行開發時,可以共同維護程式碼。

此次將透過Docker快速建置 Jupyter的平台

預設的Jupyter並沒有安裝資料分析相關的套件
因此我補充了許多資料分析會使用到的套件
如:anaconda、tensorflow、scikit-learn、elasticsearch、pyes

透過以下的連結,可以簡單的快速部署我已經建置好的客製化Jupyter
Docker Hub:https://hub.docker.com/r/lucasko/jupyter/

操作如下

下載docker image:


啟用container:
docker run -p 8888:8888 -d -it  lucasko/jupyter:latest  /bin/bash  -c "/opt/conda/bin/jupyter notebook --notebook-dir=/opt/notebooks --ip='*' --port=8888"








檢視網站:
http://localhost:8888/tree


此Docker已經安裝好了許多巨量資料分析會使用到的python套件
如:anaconda、scikit-learn、elasticsearch、pyes

若有其他需要的套件可以自己去改Dockerfile
加入自己需要的套件







No comments:

Post a Comment