2014年7月24日 星期四

[Python] 自製N-Gram Analyst 文字探勘(text mining)軟體1.01a release




        下載點:
https://drive.google.com/file/d/0B04hqU30ytQMQU9WZzRkQ3QxSnM/edit?usp=sharing
         GIT HUB:
         https://github.com/bryanyang0528/NGramAnalyst
         更新訊息:
         #2014-07-22 1.01a 更新項目:
         #   a. 將空白字元當成換段落符號
         
         #2014-07-21 1.01 更新項目:
         #   a. 修正重覆分析grid不會自動清空的bug
         #   b. 可以分析.xls .xlsx檔案

        讀取EXCEL的方式也很簡單,把EXCEL檔拉到視窗裡,選擇要分析的欄位就可以了。使用上有任何問題或需求歡迎留言:)



8 則留言:

  1. Bryan您好:

    我現在有筆19000列的資料,內容是拍賣網站的問與答資料

    我用您開發的軟體進行文字探勘,程式會跑到當掉,沒有回應。我如果把資料篩選成100筆,就可以跑,想請問該如何解決呢?

    我的電腦設備:
    i3 2.4GHz, 4G RAM, WIN7-64bit旗艦版

    懇請指點迷津,謝謝

    回覆刪除
    回覆
    1. 當初沒做壓力測試..因為演算法效率很差,執行的時候會吃大量記憶體...orz 現行情況應該是無解

      刪除
    2. 好的,那請問一下,若想進行資料量比較大的,就是要在python原生的開發環境下開發囉?因為對python不熟,想了解一下,感謝您的回覆 :)

      刪除
    3. 建議你搜尋結巴分詞,會看到很多有用的資料,用起來也很簡單

      刪除
    4. 恩恩,已經在學習了,感謝分享 :)

      刪除
  2. 不能執行ㄝ (視窗說window版本不相容) 要先灌 python?
    log如下---
    D:\Python\NGramAnalyst\App\dist\NGramAnalyst.exe:417: wxPyDeprecationWarning: Call to deprecated item 'InitAllImageHandlers'.

    回覆刪除