2018年5月11日 星期五

特徵檢測


在公司設置了一台電腦,它會收集路過的同事的樣貌。這些素材將會用來訓練機器學習模型,最後希望當同事路過時,電腦能分辦出是哪一位,並說句「你好」。

時間過得很快,素材已經有多達十三萬張。當中有很多是連貫的動作,相信對機器學習訓練來說作用不大,可以刪除。然而,這個動作要輪流把每張相片都看過,才能作出篩選。我實在很希望把它自動化。但自動化是先要有一個訓練好的模型;而訓練模型又需要素材,亦即是要手動分一次。好像跑不出迴圈,怎樣也要手動做一次。後來我嘗試用 Feature detection,希望可以憑此來基本判定是哪一個人;可惜卻事與願遺。不過,我發現用另一個方法能計算出兩張圖片的相似度。我編寫了程序,它能把一部份相似的相片刪除,餘下的才需要手動處理。問題是,餘下的也有好幾萬張,要如何做到快,還在思索中...。

沒有留言: