2017年7月4日 星期二

中文分詞


在機器學習的領域中,英文分詞在很多地方都能學到及應用得到,用 Python 的 TextBlob 也能處理;但是中文卻沒太多的資訊,而且中文的文字素材也少得可憐,得靠自己製作。幸好,還有一個名為 Jieba 的 Python 庫能輕鬆做出中文分詞,又能加入自訂義詞語。今日拿了 Sita 專頁的留言試了一下,不是完美,卻是一個不錯的開始。

沒有留言: