2017年1月20日 星期五

初嘗百度大腦


百度大腦剛對外開放。跟 Microsoft Machine Learning Studio 一樣,提供免費的接口呼叫額度;而這個額度足夠開發的需要。因此,我也立即申請了一個帳號。

簡單地建立了應用程式,得到 App ID, App Key 及 App Secret。這些都會呼叫百度大腦接口所需的資料。
<?php
//----------------------------------------------------------------------------------------
//  Baidu Machine Learning API Test Program
//----------------------------------------------------------------------------------------
//  Platform: CentOS 7
//  Language: PHP 5
//  Copyright 2017 Pacess Studio.  All rights reserved.
//----------------------------------------------------------------------------------------

require_once "../nlp.php";

//----------------------------------------------------------------------------------------
const APP_ID = "123456";
const API_KEY = "abcdefghijklmnopqrstuvwxyz";
const SECRET_KEY = "abcdefghijklmnopqrstuvwxyz";

//----------------------------------------------------------------------------------------
//  Init NLP
$nlp = new nlp(APP_ID, API_KEY, SECRET_KEY);

//  Testing 分詞
$resultArray = $nlp->wordseg("你好陳僖儀");
echo("Word Segment: ".json_encode($resultArray)."\n\n");

//  Testing 詞性標注
$resultArray = $nlp->wordpos("你好陳僖儀");
echo("Word Pos: ".json_encode($resultArray)."\n\n");

//  Testing 詞向量
$resultArray = $nlp->wordembedding("你好陳僖儀", "");
echo("Word Embedding: ".json_encode($resultArray)."\n\n");

//  Testing 短文相似度
$resultArray = $nlp->simnet("你好陳僖儀", "你好世界");
echo("Similarity: ".json_encode($resultArray)."\n\n");

//  Testing 中文 DNN
$resultArray = $nlp->dnnlm("陳僖儀是個非常出色的歌手");
echo("DNN: ".json_encode($resultArray)."\n\n");

//  Testing 情感分析
$resultArray = $nlp->commentTag("陳僖儀唱的歌很好聽,是一個很有愛心的人");
echo("Comment Tag: ".json_encode($resultArray)."\n\n");

?>
以下是測試結果:
測試結果不是太好。不清楚是否繁體中文的緣故。六個測試中,只有「詞向量」做得不錯,能從「你好陳僖儀」分出「你好」及「陳僖儀」。而中文 DNN 算是可以,能從「陳僖儀是個非常出色的歌手」分出「陳, 僖, 儀, 是, 個, 非常, 出色, 的, 歌手」。

沒有留言: