Singtao Daily: 電話錄音轉文字 三萬音檔一晚完成

An interview with Singtao Daily

November 25, 2021
News Articles

初創研發鎖屏技術 客戶包括美國公司

AI識別主人防手機電腦被偷窺

記者:王詩穎

 

創科領航

 

不少人都遇過手機或是電腦熒幕被偷窺,假若公司或客戶機密資料因偷窺偷影外泄,問題就更嚴重。有創業一年多的初創公司研發出系統,利用A/、大數據和區塊鏈技術,結合人像及物體識別,當手機或電腦的前置鏡頭偵測到非原有用戶的樣貌,或用手機拍攝熒幕,都會馬上鎖定熒幕,並拍攝該人偷窺偷影的情景,寫入區塊鏈內,不容資料修改。手機日新月異,研發人員要不斷教導AI何謂「手機」,笑言公司內積存了大量智能電話。

  

創新鏈科技行政總裁吳創文(Kevin)從事IT業界二十多年,去年與另外三位同伴創立初創公司創新鏈科技(InnoBlock),研發出不同產品。其中的SafeGuard系列,就防止數據、資料和私隱泄漏。他指,資訊科技界大多聚焦在電腦泄漏資料,惟也有不少經手機外泄資料。

 

前置相機反拍「偷窺者」

 

創新鏈科技銷售及市場部總監黃沛筠(Rowena)解釋,產品結合AI、大數據和區塊鏈技術,利用人像及物體識別,一旦有他人藏身後方用手機拍攝用家的手機、平板和電腦熒幕,嘗試偷取機密資料,或有非授權人士坐於電腦前,前置相機感應後,會於一至兩秒內馬上鎖定熒幕。同時,鏡頭會拍攝兩張實時照片,也即時傳送用戶。他們又以區塊鏈的不可竄改性,將資料記錄在區塊鏈。

  

她表示要不斷訓練系統,學習甚麽是「手機」,認識「鏡頭」,建立資料庫。由於手機款式,推陳出新,加上有變化萬千的手機殼,Kevin不諱言最複雜的部分為機器學習,因本身沒有相關數據,因此笑言公司內有多部手機,也會借朋友的手機訓練系統。

 

Rowena強調,機器學習須不停訓練,如市面有不同形狀的針孔攝錄機,「不是百分之一百防止所有偷影,而是盡可能防止。」他們建議客戶不要將精準度調至四十以下,換言之,前置相機偵測到與手機有四成相似的物品,已會鎖上熒幕,實行「有殺錯無放過」。至於可拍攝到多遠的「偷拍者」,她指須視乎裝置上的前置鏡頭。

 

他們指客戶來自不同行業,包括美國一家知名機械設計公司,負責承接客戶的機械產品,每位客戶都有獨特圖則,應用SafeGuard就可防止圖則泄漏。創新鏈科技早前於金管局主辦的「環球合規科技挑戰賽」中勝出,以可識別粵英普等語言SafeGuard在「客戶資料保密」組別得到亞軍。Rowena指,系統針對企業及公司的痛點,並可配合監管機構的管治和風險與合規等,得到獎項就像取得認同,之後會更努力。

  

電話錄音轉文字 三萬音檔一晚完成

 

致電客戶服務熱綫時,總會聽到「為確保服務質素,對話內容可能已被錄音」。當雙方溝通有爭議,或涉法律違規須追查,企業或監管機構往往要花大量時間重聽內容。有光科技以語音識別(ASR)及自然語言處理(NLP)等人工智能前沿技術,將電話對答及錄音轉成文字,可用一晚時間,將三萬個語音檔案轉換成文字,分辨出有多少人發言和分析內容。部分監管機構都有使用服務,而技術有助尋找「微信女」的「唱高散貨」騙局中,誰是真正騙徒。

 

可識別粵英普等語言

 

有光科技創辦人及首席執行官溫豪夫,以及首席科學家及首席技術官林潤生,之前都在港大從事研發及教學工作,及後進駐科學園,將研發商品化。溫豪夫指,語音分析系統「Callinter」以語音識別技術、自然語言處理及大數據分析,利用海量語音數據進行深度學習,能夠準確識別普通話、英語,以及粵語和四川話等。系統可分析電話對答,又可分辨出有多少人發言,並整理成文字。港人習慣中英夾雜,他指即使中英夾雜、國語加英文,系統的準確度達八成五至九成五。

 

近年社交媒體與通訊軟件上不時有炒股群組,包括涉及「唱高散貨」騙局,誘使投資者高價買入特定股票,然後騙徒在高價賣出或「拋售」圖利,坊間俗稱「微信女」騙局。溫豪夫表示可透過系統,即使是語音,都可分辨有多少人說話,分析說話內容,有助尋找「唱高散貨」騙局中,誰是真正的騙子。

 

此項技術早前在金管局的「環球合規科技挑戰賽」中勝出,有光科技在「操守與客戶保障」類別中奪冠。