User Icon

 /  ENG

單元9 , 主題3:互聯相依的當代世界 , 單元1.2 , 單元1.4

字幕眼鏡 助聽障人士「看到」別人說話

22-01-2024

【明報專訊】商界常說本地勞工不足,必須輸入外勞,但本地數十萬殘疾人士就業率長期偏低。其中聽障人士的工作能力其實接近普通人,但礙於很多僱主和消費者未必願意以紙筆等方式與他們溝通,他們仍然被投閒置散。有初創公司正研發一種「字幕眼鏡」,透過將語音辨識成文字投射到鏡片上,讓聽障人士「看到」別人的說話,協助他們工作和上學。

明報記者 薛偉傑

攝影 黃志東

創啟社會科技有限公司共同創辦人蕭啟穎表示,公司去年中開始研發「聽障人士字幕眼鏡」(以下簡稱字幕眼鏡),設計概念是將語音即時辨識成文字,投射在鏡片上,讓佩戴該眼鏡的聽障人士能夠「看到」別人說話,從而解決他們和其他人溝通的障礙。

以往曾經有公司提出另一種方案,讓普通人在智能手機上安裝一套視像辨識軟件,來辨識聽障人士的手語,以解決雙方溝通問題。但蕭啟穎覺得,要即時視像辨識手語,難度比即時語音辨識大。所以,該公司選擇了技術相對成熟的語音辨識方案。經過大約半年研發,該公司去年底已經造出字幕眼鏡第一代原型,重約100克,配備一枚800mAh鋰電池,充滿電約需1小時,之後可連續用3小時。鏡片方面,有透明鏡片和太陽眼鏡鏡片兩種選擇。第一代原型暫時必須透過Wi-Fi,連線到智能手機或路由器上網才可運作,它使用微軟雲端服務將語音即時辨識成文字。

暫可辨識廣東話普通話英語

語言方面,暫時支援廣東話、普通話、英語的辨識;字幕有繁體中文、簡體中文、英文等。考慮到廣東話的獨特性及聽障人士的習慣問題,該公司將繁體中文字幕再細分成口語和書面語兩個選擇,即一共支援4種字幕。蕭啟穎解釋,有些聽障人士反映,他們大多比較習慣使用書面語文字,而不是口語文字,即使看字幕亦一樣。

暫時有5名聽障人士試用過第一代原型,包括社企「黑暗中對話」和「活髮社」的聽障員工。評語方面,主要是希望能夠再提高語音辨識的準確率和速度,其中以黑暗中對話聽障員工的評語較佳,活髮社方面提供了較多改進意見。

支援4種字幕 包括口語

本身也是弱聽人士的活髮社創辦人鄭毅敏認為,以服務業的聽障員工使用字幕眼鏡來說,一定是選擇透明鏡片較佳,因為用太陽鏡片會讓顧客感覺不親切。此外,現時第一代原型的眼鏡臂太粗,外觀較奇怪。應該要造得幼一點和輕巧一點,看來盡量與普通眼鏡無分別。字幕投射方面,她認為只需顯示別人的說話便足夠,毋須顯示聽障使用者自己的說話。現時字幕眼鏡同時顯示別人和使用者的說話,看起來較混亂,畫面也較多字和擁擠。

至於語音辨識速度,她認為還需再提高,尤其是字幕眼鏡有時反應好像慢了一拍,若在服務業使用可能會引致尷尬。整體來說,她認為字幕眼鏡適合弱聽人士多過完全失聰人士。

該公司的弱聽員工亦建議,增加一個遙控器,比起在眼鏡臂上按按鈕方便。此外,現時原型不能將使用者背後的語音收集和辨識成字幕,若有人在背後呼叫,使用者無法知悉。所以,建議增加在眼鏡後方收音功能。

蕭啟穎同意,第一代原型的設計未算很理想,還有很多地方可以優化。他接受關於字幕投射方面的建議,相信有關修改可以很快完成。至於語音辨識速度問題,他解釋,因為字幕眼鏡原型現時必須以連線模式(雲端模式)運作,有時可能會因為網絡不暢順顯得慢了。他計劃將來增加離線運作模式,讓語音辨識在字幕眼鏡內處理,以縮短反應時間。不過,離線運作模式的缺點是,語音辨識資料庫容量會比連線模式小得多,而且不能經常更新,準確率可能會因而降低。為了避免提高了速度但拖低準確率,他計劃將來的字幕眼鏡只需透過連接一條USB線到個人電腦,就可以更新軟件。

已投資數十萬 零售價料6000元

關於收身減重方面,蕭啟穎估計,若採用市場上能量密度最高的鋰電池,眼鏡臂可以縮小,整體重量也可降低至約80克,電池容量可增至1500mAh。但若是離線運作,連續使用時間只有3小時。因為離線運作模式需要晶片和記憶體頻繁運作,耗電會比連線運作模式高。

該公司已在字幕眼鏡的研發上投入數十萬元,蕭啟穎估計,還要再研製多兩代至三代,做更多測試和改進,至少一年後,字幕眼鏡才可以量產推出,估計零售價約6000元。他預料,累積總投資可能需要約300萬元,所以希望能夠找到投資者支持,同時考慮申請資助計劃。