微信今日正式上線智能開放平臺。語音識別和圖像識別成為首批開放給第三方應用開發(fā)者的智能識別技術(shù)。
通過調(diào)用相關技術(shù)接口,第三方應用也可以實現(xiàn)微信中已有的語音轉(zhuǎn)文字、圖片掃描等功能。
微信模式識別中心團隊向騰訊科技介紹,麥克風、攝像頭等傳感設備讓人和機器的交互更加便利。但語音和圖像識別的技術(shù)門檻還相對較高,如果微信能把已有的技術(shù)儲備開放給開發(fā)者,將能幫助更多應用減少技術(shù)投入成本。
語音識別技術(shù)主要體現(xiàn)在語音輸入,可直接將用戶的語音轉(zhuǎn)化成對應的文字。用戶不需要依靠鍵盤就能完成文字輸入或者用語音進行功能操作。
目前多個產(chǎn)品已在使用微信語音識別技術(shù),比如QQ音樂中的語音搜索、騰訊地圖中的地理位置語音搜索、嘀嘀打車中的語音叫車轉(zhuǎn)文字等。據(jù)微信模式識別團隊介紹,智能玩具、智能家電和可穿戴設備產(chǎn)品也會成為該接口的應用領域。
圖像開放平臺可幫助開發(fā)者將圖片識別技術(shù)集成于自己的應用中,引入利用手機攝像頭的視覺搜索功能??勺R別的圖片類型包括平面海報、廣告、雜志和報紙上的插圖等平面圖像。開發(fā)者在后臺上傳并管理需要識別的圖片后,用戶就可以使用手機攝像頭掃描并識別出對應圖片,獲取相關聯(lián)的網(wǎng)站、音頻、視頻、社交媒體、電子商務渠道等內(nèi)容。
傳統(tǒng)媒體和電商領域應用或?qū)⒊蔀閳D片識別技術(shù)接口的深度合作伙伴。比如傳統(tǒng)媒體應用利用該接口后,用戶在雜志或報紙上看到喜歡的商品,通過掃描圖片就會獲得商品的詳細信息、購買來源并進行下單購買。線下商家在推廣活動時,也可讓用戶在掃一掃圖片后,完成一系列的線上抽獎、游戲、優(yōu)惠活動等。
除了以上兩個技術(shù)平臺,智能開放平臺還會在未來開放語義理解、人臉識別等技術(shù)。一些能夠方便用戶移動生活的技術(shù)也在研究范圍內(nèi),比如聲紋識別等。
微信相關智能技術(shù)接口此前多服務于微信內(nèi)部的公眾平臺,此次智能開放平臺的推出將服務范圍從公眾號推廣到了更大規(guī)模的第三方應用。想要接入相關技術(shù)接口的應用開發(fā)者,在填寫應用基本信息后的三個工作日將能獲得審核結(jié)果。審核通過后可正式使用。
智能開放平臺上線后,微信應用在智能領域的探索還將繼續(xù)。微信官方向騰訊科技透露,“搖一搖搜歌”、“掃一掃”等功能都曾獲得過用戶好評。但更大的驚喜還在后面,新版微信會添加一個新“智能服務”。他們相信,這個新功能或?qū)⒃俣纫脩舴错懀唧w內(nèi)容目前還不方便介紹。