2017年7月26日 星期三

SnowNLP


今日嘗試了 SnowNLP 這個 Python Module,用它來進行正體中文分詞。

把先前從 Facebook 抓下來的評語,抽了一少部份放進去;關鍵字得到 base, lasting 服, primavista 及貼, 似乎不太準確。查看學到的詞彚,零零碎碎,同樣沒有多大作用。至於情感分析,「但隻濕粉堅強..控油一流」得出 96.88%, 亦即是正評。這個倒是不錯。

由於上面的測試是用跟來的基本模型,對於特定的行業,應該要用特定的訓練素材。下一次要自行訓練看看,但先要收集同 一行業但不同公司的數據才有下一步。

沒有留言: