1月16日消息,1月13日下午,北京大鐘寺的一個(gè)報(bào)告廳里,由抖音集團(tuán)產(chǎn)品經(jīng)理、研發(fā)工程師以及清華大學(xué)、浙江大學(xué)等高校學(xué)生組成的12支隊(duì)伍正在進(jìn)行決賽。5個(gè)多月前,64支隊(duì)伍,501名參賽選手開啟了這場(chǎng)“AI助力視障群體”為主題的技術(shù)公益大賽。
靈瞳產(chǎn)品演示圖
經(jīng)過(guò)三個(gè)多小時(shí)的角逐,3號(hào)參賽隊(duì)伍“靈瞳”團(tuán)隊(duì)以最高分獲得一等獎(jiǎng),他們?cè)O(shè)計(jì)了一款“對(duì)話式視覺(jué)助手”。這是一款應(yīng)用于手機(jī)和智能眼鏡的APP,初始界面類似相機(jī)。它可以聽取和理解用戶發(fā)起的提問(wèn),同時(shí)點(diǎn)擊按鈕錄制物品信息,它會(huì)根據(jù)問(wèn)題提取有效信息并語(yǔ)音回答。
“靈瞳”在交互和視覺(jué)技術(shù)上的表現(xiàn)得到了評(píng)委和觀眾的一致青睞。交互上,除了連續(xù)探索模式,它還可以實(shí)現(xiàn)指尖探索,即用手觸摸屏幕來(lái)告訴用戶物品的相對(duì)應(yīng)位置。還有一種功能是對(duì)話定位,用戶可以先告訴“靈瞳”想要什么樣的物品,比如想要尋找一個(gè)紅色的東西,用戶可以拿著攝像頭去尋找,一旦你想要的目標(biāo)出現(xiàn)在屏幕中,“靈瞳”就會(huì)提示用戶的位置,在屏幕的左側(cè)還是右側(cè)。“靈瞳”還有一些輔助能力,比如找對(duì)襪子,線下買衣服,“靈瞳”都可以幫助你做一些輔助信息和判斷。
“靈瞳”團(tuán)隊(duì)的成員,一名抖音集團(tuán)的研發(fā)工程師在賽后接受媒體采訪時(shí)表示,他最早的觸動(dòng)來(lái)自于身邊人——一位好友去年患上視網(wǎng)膜相關(guān)的疾病,接下來(lái),他的眼睛會(huì)慢慢受影響甚至失明。從那之后,他就開始關(guān)注相關(guān)領(lǐng)域的技術(shù)和研發(fā),直至這次參加比賽。
其他11支進(jìn)入決賽的團(tuán)隊(duì)根據(jù)自身的技術(shù)特點(diǎn),還提供了關(guān)于視障人群的出行、辦公、購(gòu)物、美妝、游戲等需求的智能解決方案。抖音公益的相關(guān)負(fù)責(zé)人表示,賽后會(huì)支持和協(xié)助有價(jià)值的項(xiàng)目進(jìn)行孵化和落地,期待它們成為視障群體切實(shí)可用的產(chǎn)品。
比如“BANG”團(tuán)隊(duì),他們?yōu)橐曊先后w提供了一款無(wú)障礙的創(chuàng)作工具:用AI技術(shù)實(shí)現(xiàn)文本轉(zhuǎn)圖、圖像編輯、色塊成圖等功能,支持語(yǔ)音交互方式,幫助視力障礙人群進(jìn)行便捷創(chuàng)作和表達(dá)。
而“世界和平”團(tuán)隊(duì)則從工作場(chǎng)景出發(fā),希望提供一種面向B端的“工區(qū)無(wú)障礙改造”的智能工具,為有視力障礙人群就職的機(jī)構(gòu)提供無(wú)障礙化改造方案,以給視障群體提供更加舒服的辦公環(huán)境。
相關(guān)數(shù)據(jù)顯示,中國(guó)目前有1700多萬(wàn)視力障礙人士,越來(lái)越多的社會(huì)力量關(guān)注到了他們,并試圖用技術(shù)和公益的方式來(lái)助力他們解決現(xiàn)實(shí)的困境。