一個(gè)里程碑:谷歌實(shí)現(xiàn)視頻內(nèi)容識(shí)別,并探討AI民主化
來源:虎嗅網(wǎng)
3月8日的Google Cloud NEXT '17 大會(huì)上的Keynote演講中,谷歌云機(jī)器學(xué)習(xí)與人工智能首席科學(xué)家李飛飛代表谷歌發(fā)布了多個(gè)谷歌云API產(chǎn)品,并正式宣布了谷歌云對數(shù)據(jù)科學(xué)社區(qū)Kaggle的收購。
一個(gè)里程碑:谷歌實(shí)現(xiàn)視頻內(nèi)容識(shí)別
根據(jù)the Verge的報(bào)道,李飛飛現(xiàn)場演示了一個(gè)叫視頻智能(Video Intelligence)的API,該API支持自動(dòng)識(shí)別視頻中的物體和內(nèi)容,使它們變得可搜索。李飛飛表示,通過視頻識(shí)別技術(shù),“我們將開始給數(shù)字星空中一個(gè)黑暗的物質(zhì)照亮光芒。”
有了該API的幫助,開發(fā)者能夠開發(fā)出支持搜索和發(fā)現(xiàn)視頻中信息的應(yīng)用程序。不僅如此,它還能幫助標(biāo)記視頻中的場景變化。
李飛飛表示:“像素的世界已經(jīng)延伸到圖像以外。視頻對于機(jī)器學(xué)習(xí)研究人員來說一直以來都是個(gè)挑戰(zhàn)。但現(xiàn)在的該項(xiàng)新服務(wù)能夠使得從視頻中提取信息變得跟從圖像中提取信息一樣簡單。”
如果不出意外,谷歌是公開報(bào)道中首個(gè)實(shí)現(xiàn)視頻內(nèi)容識(shí)別的科技企業(yè),這也是人工智能的一個(gè)里程碑。國內(nèi)的百度、阿里、騰訊、科大訊飛、搜狗這些個(gè)自詡“人工智能公司”或者在大力投入人工智能的公司,不知又被甩出幾條街了。
谷歌人工智能應(yīng)用進(jìn)展
而根據(jù)機(jī)器之心在現(xiàn)場的報(bào)道,李飛飛還通過一些具體案例介紹了谷歌人工智能的應(yīng)用進(jìn)展:
零售
機(jī)器學(xué)習(xí)算法在幫助谷歌的 AdSense為消費(fèi)者提供更合適的建議,但也仍還有進(jìn)步的空間,比如供應(yīng)鏈優(yōu)化、隨時(shí)間預(yù)測需求改變以及使用無人機(jī)或無人車為消費(fèi)者快遞貨物等等。
媒體娛樂
比如Google Photos的自動(dòng)照片標(biāo)注和YouTube的推薦播放列表。虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)依賴計(jì)算機(jī)視覺來進(jìn)行運(yùn)動(dòng)追蹤、環(huán)境監(jiān)測和游戲。甚至新聞報(bào)道也將可以自動(dòng)生成。人工智能將能幫助我們創(chuàng)造更加個(gè)性化的內(nèi)容,比如音樂、視頻和藝術(shù)品。
金融
機(jī)器學(xué)習(xí)正在信用卡風(fēng)險(xiǎn)檢測、反詐騙和洗錢等方面發(fā)揮越來越大的作用。
醫(yī)療保健
人工智能正在真正改善著人們的生活,比如布滿傳感器的智能化醫(yī)院、增強(qiáng)診斷等。幾個(gè)月前,谷歌大腦的研究者表明可以使用深度學(xué)習(xí)來幫助診斷糖尿病性視網(wǎng)膜炎。
人工智能的下一步將是“AI民主化
李飛飛還認(rèn)為,人工智能的下一步將是“AI民主化”,包括民主化計(jì)算、民主化算法、民主化數(shù)據(jù)和民主化人才四個(gè)方面。
民主化計(jì)算
李飛飛說:“去年,我們推出了Beta版的 Cloud ML Engine,今天我在這里宣布其已經(jīng)實(shí)現(xiàn)了更廣泛的可用性。Cloud ML Engine 是一個(gè)能夠利用谷歌所有計(jì)算資源的平臺(tái)。”
根據(jù)介紹,有了ML Engine后,用戶可以使用其熟悉的TensorFlow庫,把精力放在自身創(chuàng)意和解決方案上,谷歌云則會(huì)為用戶處理基礎(chǔ)架構(gòu)和模型上的問題——用戶將它們上傳至谷歌云,ML Engine 能更快速地進(jìn)行大規(guī)模處理,并將其部署在移動(dòng)設(shè)備上。
民主化算法
李飛飛宣布了一項(xiàng)新產(chǎn)品——Vision API。她介紹道,正在穩(wěn)步研發(fā)的 Vision API 具備一些非常重要的新能力。第一,谷歌把該 API 的元數(shù)據(jù)(metadata)擴(kuò)展到了識(shí)別來自谷歌圖像的知識(shí)圖譜的數(shù)百萬實(shí)體;第二,增強(qiáng)了光學(xué)字符識(shí)別(OCR)功能,能夠從富含文本的圖像中提取出文本,比如法律文件等。
民主化數(shù)據(jù)
李飛飛認(rèn)為數(shù)據(jù)是民主化的另一部分,像人類一樣,人工智能需要大量數(shù)據(jù)為自我發(fā)展提供洞見。因此,數(shù)據(jù)集是人工智能需要克服的最大障礙中的一個(gè)。為了實(shí)現(xiàn)谷歌云實(shí)現(xiàn)數(shù)據(jù)民主化,李飛飛在大會(huì)上宣布谷歌收購了數(shù)據(jù)科學(xué)社區(qū)Kaggle,后者聚集了超過85萬數(shù)據(jù)科學(xué)家,還曾與谷歌云共同舉辦過YouTube 8M視頻理解挑戰(zhàn)賽。
“收購 Kaggle 之后,谷歌云將為這個(gè)龐大社區(qū)提供最先進(jìn)的機(jī)器學(xué)習(xí)環(huán)境,并提供直接市場化模型的機(jī)會(huì)。”李飛飛表示。
人才民主化
谷歌云發(fā)布了Advanced Solution Lab,實(shí)現(xiàn)其他公司與谷歌的人才合作,以幫助他們解決復(fù)雜的機(jī)器學(xué)習(xí)問題。
“AI民主化”概念此前鮮有科技公司提及,谷歌無疑又一次領(lǐng)先了世界。不過國內(nèi)的企業(yè)也在迎頭趕上,比如每年秋天的云棲大會(huì)就是阿里巴巴展示阿里云的最佳場所,跟谷歌不同,阿里的云棲大會(huì)更像是尋找商業(yè)伙伴,而谷歌云大會(huì)更像是前沿技術(shù)探索。