2015年1月29日 星期四

[心得] 用Markdown寫blog初體驗! 試試看StackEdit吧!

用Markdown寫blog初體驗! 試試看StackEdit吧!

開始寫github readme後,瘋狂的愛上Marksown的格式,不但設定簡單,而且非常適合用來書寫包含程式的文件.之前在寫blog的時候,最大的麻煩就是遇到要夾上程式碼.早期試過把整段丟到gits,對於長碼還ok,但是有時候只是想打個一兩行又嫌麻煩.我現在的短碼都會套用格式設定,但是其實超醜也很難調整(對不起各位).今天終於被我發現這個好用的工具StackEdit啦!

2015年1月28日 星期三

[Apache Spark][教學] Spark x Docker x ipython Notebook !(四)-pyspark設定+commit images

        我最近感受到催稿的壓力了orz,話不多說最終章開始.承繼之前的進度,設定完ipython notebook以及對外通道後,再來就是要設定pyspark.原理是將pyspark放入ipython的import路徑中就可以了.

2015年1月25日 星期日

[Apache Spark] Spark編成指南繁體中文版計畫啟動


        
        雖然現在大部分都是直接看英文資料,但是有中文的資料看起來還是非常方便.Spark目前在國內的中文資源還是相當貧乏,所以才想說可以從翻譯一些官方文件開始,讓更多人能夠輕易接觸這個技術,所以開了一個專案一起來共同翻譯~

[心得] 寫在三萬人次之前的Q&A

        
        記得去年十二月才剛破兩萬人次,還來不及發文,一轉眼就來到三萬人次了,真的很感謝大家的支持.比起資料分析,寫程式方面我只是個小小的新手,越寫越覺得自己的不足,還有非常多需要努力的地方.原本只當這裡是記錄學習過程的地方,但是從寫作過程中,因為開始有些讀者,更有動力去學習新東西來跟大家分享,更重視文字和內容的品質,也因此認識了一些好朋友,是個相當難得的經驗.以下以Q&A來回答一些讀者常問到問題:

2015年1月17日 星期六

[Apache Spark][教學] Spark x Docker x ipython Notebook !(二)-Python安裝設定篇


        文章開頭也是先謝謝前輩https://www.digitalocean.com/community/tutorials/how-to-set-up-python-2-7-6-and-3-3-3-on-centos-6-4.在上一回,[Spark][教學] Spark x Docker x ipython Notebook !(一)-Docker + Spark安裝篇,我們從大大那邊抓下來Spark的環境,但是還缺少python的環境,所以這篇文章就是要介紹怎樣在前一個環境中建立python環境.Docker在建立環境時有兩種方式,一種是進入container內,將程式安裝起來後,將建好的container儲存起來使用,另外一種就是用Dockerfile的方式紀錄安裝的過程.因為我Dockerfile還不熟,所以先介紹第一種方式.

[Apache Spark][教學] Spark x Docker x ipython Notebook !(一)-Docker + Spark安裝篇

圖片來源:http://www.docker.com/
       
        文章開頭先感謝前輩們的貢獻:http://philipzheng.gitbooks.io/docker_practice/.Docker是今年非常火紅的技術,可以透過輕量化虛擬container來實現系統或程式的部屬配置.我們在實物開發上常遇到的問題是,開發環境和正式環境彼此存在著差異,來來回回把程式搬到正式環境上執行是非常花時間的事情.Docker透過輕量化虛擬技術讓開發者可以很輕易地將程式放到模擬出來的正式環境執行,測試,減低了很多開發上的時間成本.同時Docker可以保證開發環境的一致性,如果不小心掛掉,簡單重啟一個就好,也節省很多維護的時間.
        我們可以在Docker上run Hadoop或Spark,把寫好的程式丟到上面執行,但是有沒有辦法直接在Docker的模擬出來的環境上開發spark程式,而且還是透過方便又強大的IDE介面(你當然也可以直接開vim寫,但是不在討論範圍內XD)?本文要介紹如何在Docker上面運行spark,並且透過ipython notebook來編輯,並以互動式方式來使用Spark.

2015年1月16日 星期五

[閒聊] 組織管理的難題


        大部分的人都得在一個組織中工作,在組織中工作的人常常會有一個感嘆,人的問題才是最難的問題。這種情節不只發生在顧問業或行銷單位,就算在IT單位中,也會認同人的問題比技術還難解決。     
        小職員抱怨小主管,小主管向下抱怨老闆,向上抱怨員工,大主管抱怨總經理,部門之間互相看不順眼,小組之間恩怨情仇難解。不曉得實計算起來,一個人在工作中處理內部人事的時間,跟實際解決問題的時間比重如何?

2015年1月11日 星期日

[R] 類神經網絡(neural network)套件實作


        最近很認真的K了Coursera上的machine learning課程,才稍微了解類神經網路(neural network)的運作原理(但是要自己implement演算法什麼的還是離我太遙遠).不過我的精神就是,雖然沒吃過豬肉,好歹也要去看看豬走路吧.而且類神經網路是近年很流行的deep learning的基礎,瞭解一下不吃虧的.

2015年1月10日 星期六

資料分析鍊金術(八)-想像力是你的超能力


圖片來源:https://psychologies.co.uk/self/what-would-your-super-power-be.html
        
        加入技術單位之後,在真正分析資料問題之前,常需要思考處理眼前的技術問題.有時候會天真地認為,只要解決技術問題,資料就已經分析完成.就像當我們披荊斬棘的來到城堡面前,奮力爬上城堡,打倒魔王,救回公主後,才發現要過著幸福快樂的生活,還需要學會如何與公主相處