高通人工智能應(yīng)用創(chuàng)新大賽收官!9大獎項花落誰家?

發(fā)布時間:2020-09-18      閱讀量:6951次     

歷經(jīng) 7 個月,由高通公司(Qualcomm)、中國智谷·重慶經(jīng)開區(qū)、CSDN、Testin云測、OPPO、極視角、中科創(chuàng)達、創(chuàng)業(yè)邦聯(lián)合主辦,重慶經(jīng)開區(qū)·高通中國·中科創(chuàng)達聯(lián)合創(chuàng)新中心協(xié)辦,TensorFlow Lite 作為開源技術(shù)合作伙伴的行業(yè)內(nèi)專業(yè)性質(zhì)的“高通人工智能應(yīng)用創(chuàng)新大賽”順利收官!

經(jīng)過嚴酷的初賽和決賽兩輪 PK,最終由評委從參賽者提交的110 個優(yōu)秀作品中甄選出優(yōu)勝獲獎作品,由 9 支參賽團隊/個人分別斬獲白金獎、商業(yè)模式創(chuàng)新獎、重慶創(chuàng)新中心特別獎、AI 視覺計算創(chuàng)新應(yīng)用獎、算法創(chuàng)新獎、AI 應(yīng)用場景創(chuàng)新獎、終端側(cè)人工智能創(chuàng)新獎、5G 邊緣應(yīng)用技術(shù)獎與 AIOT DSP 應(yīng)用創(chuàng)新獎

究竟是哪些牛人摘得了今年的獎項呢?獲獎的作品有哪些獨特之處?話不多說,下面我們來一一揭曉。


各大獎項花落誰家?




白金獎



獲獎?wù)撸黑w天奇

參賽作品名稱:人工智能動畫系統(tǒng):賽博化身Cybatar

團隊成員與分工:趙天奇,聚力維度創(chuàng)始人CTO,項目方向與科研;王遠,聚力維度軟件開發(fā)組長,項目實施。

作品介紹:

賽博化身Cybatar是一款人工智能動畫制作應(yīng)用,包括實拍級面部捕捉、智能動捕、智能面捕、智能生成、智能聲捕等數(shù)字人技術(shù),讓每個人都可以每天制作幾分鐘專業(yè)動畫作品。當前版本內(nèi)置若干個自有或合作IP的CG角色、場景道具、以及合成模板,可以根據(jù)不同設(shè)定和權(quán)限使用生產(chǎn)內(nèi)容,素材庫多樣。僅利用普通攝像頭就可以精準捕捉用戶的面部表情,喜怒哀樂甚至各種微表情的變化都能精準展示,還能對不同控制者和使用場景進行精準面部調(diào)節(jié),例如眼睛大小,脖子高低等。

這款應(yīng)用未來可實現(xiàn)的功能包括三維場景轉(zhuǎn)換、多人多來源控制系統(tǒng)、游戲分時組合控制機制、網(wǎng)絡(luò)同步更新機制、網(wǎng)絡(luò)直錄播合作機制、人工智能捏臉系統(tǒng)、換裝系統(tǒng)以及動作捕捉,手勢捕捉,聲音捕捉等AI算法。

效果展示:

聚力維度研制了新型面捕網(wǎng)絡(luò)結(jié)構(gòu)模型,克服了傳統(tǒng)面捕算法受限于建模精度,拍攝角度和環(huán)境光照的缺點。模型可分為通用ID提取模型、表情提取模型、表情優(yōu)化模型、姿態(tài)提取模型以及時空融合模型。

通過這種分任務(wù)網(wǎng)絡(luò)和多級結(jié)構(gòu),達到了表情和姿態(tài)的精確提取和轉(zhuǎn)換,同時保證了模型在進行面捕頭捕時的一致性和實時性。

然后,將此模型順利移植到搭載高通驍龍865的安卓手機上,與UE4三維引擎相結(jié)合實現(xiàn)了虛擬數(shù)字人的實時面部表情重現(xiàn)。最后,針對移動端平臺進行了場景的優(yōu)化,包括光照、材質(zhì)、模型等,使得運行效率超過24fps。




商業(yè)模式創(chuàng)新獎



獲獎?wù)撸涸┘皟?yōu)學(xué)貓研發(fā)團隊

參賽作品名稱:優(yōu)學(xué)貓AI系統(tǒng)

團隊成員與分工:袁博 優(yōu)學(xué)貓技術(shù)合伙人;孫博 優(yōu)學(xué)貓CEO;潘志剛 產(chǎn)品運營。

作品及開發(fā)過程介紹:

優(yōu)學(xué)貓兒童AI互動學(xué)習(xí)平臺包含學(xué)前兒童多科啟蒙AI智能硬件和AI課程,連接各種智能屏幕,把AI芯片嵌入傳統(tǒng)玩教具升級為智能教具,使用多種教育場景和AI互動技術(shù)激發(fā)兒童興趣,用視覺、聽覺、觸覺等多感官刺激感知,幫助兒童探究學(xué)習(xí),“授之以漁而非魚”。

優(yōu)學(xué)貓主要涉及的AI技術(shù):

第一是語音識別,主要用于優(yōu)學(xué)貓英語APP中,用戶會跟游戲以及真人錄播老師的音頻進行跟讀,由系統(tǒng)評判跟讀結(jié)果并反饋。具體的通過對采集聲音完成預(yù)處理,并使用CMUSphinx的語言模型及概率學(xué)統(tǒng)計進行語音識別的功能。

第二是使用了人體關(guān)鍵點識別及人體語義分割完成復(fù)雜場景的人物摳圖,并改進CocosNet網(wǎng)絡(luò)完成人體姿態(tài)重定向的部分,將小朋友放置到APP的場景內(nèi)實現(xiàn)交互及動畫;同時也使用了傳統(tǒng)CV的方式完成了對一些物體的邊緣檢測和濾波功能,使得小朋友可以自己進行DIY創(chuàng)作。

參考CocosNet,跨域?qū)崿F(xiàn)人體姿態(tài)遷移:

基于人體關(guān)鍵點配合Spine骨骼動畫實現(xiàn)任務(wù)場景交互融合,同時通過人體語義分割實現(xiàn)Mesh權(quán)重綁定,最終作用于APP場景內(nèi),讓小朋友看到自己虛擬進入課堂。

第三優(yōu)學(xué)貓課程通過視頻自動切片技術(shù)根據(jù)不同的錯誤反饋操作,計算出不同的反饋的無縫連接視頻,模擬真人老師直播過程。

第四優(yōu)學(xué)貓實現(xiàn)了AI教具智能陪練,記錄孩子學(xué)習(xí)數(shù)據(jù)智能,分析測評,智能點評等不同的功能。




重慶創(chuàng)新中心特別獎



獲獎?wù)撸菏Y琦及律動團隊

參賽作品名稱:律動(心肺疾病輔助診斷終端和服務(wù))

團隊成員與分工:蔣琦 戴維森開普蘭顧問,盼達用車CIO,負責整體產(chǎn)品和后端實現(xiàn);王守崑 原豆瓣首席科學(xué)家,作為顧問提供算法調(diào)優(yōu)指導(dǎo)等;于子豪,負責前端交互。

作品及開發(fā)過程介紹:

律動提供心肺疾病輔助診斷、定位于家用預(yù)診斷市場的終端和服務(wù)。近二十年來,電子聽診和心肺輔助診斷領(lǐng)域雖有成果但存在著很多待突破的困境,比如數(shù)據(jù)庫缺乏、采樣終端成本昂貴、反饋系統(tǒng)迭代慢、量產(chǎn)規(guī)模較小等。律動通過高性價比的電子聽診器采集心肺音數(shù)據(jù),再利用人工智能算法對比潛在的疾病種類,從而解決上述問題。律動做到極致的成本控制、易用、準確,硬件方案控制在200元人民幣內(nèi),單病例采樣規(guī)模做到10000例,商業(yè)化做到100類型心肺相關(guān)病例覆蓋,并建立快速的反饋系統(tǒng)優(yōu)化診斷模型。

該項目補全了國內(nèi)對心肺音疾病數(shù)據(jù)庫的空白,只需要簡單幾步操作,在安靜環(huán)境中將電子聽診器插入手機耳機插孔,采集心音或肺音數(shù)據(jù),經(jīng)Tensorflow Lite等推測疾病種類。當前階段識別準確率已達到82%,隨著樣本的補充,識別的病癥寬度和準確度都會繼續(xù)提高。




AI視覺計算創(chuàng)新應(yīng)用獎



獲獎?wù)撸和鯉煆V

團隊成員與分工:個人

參賽作品名稱:基于移動端的農(nóng)作物病蟲害識別系統(tǒng)

作品及開發(fā)過程介紹:

“三農(nóng)”問題是當前我國密切關(guān)注的社會問題,基于圖像處理技術(shù)的農(nóng)作物病蟲害識別具有快速、精確、實時等特點,能夠協(xié)助農(nóng)耕人員及時采取有效的防治措施。該系統(tǒng)采用大規(guī)模專業(yè)圖像數(shù)據(jù)來訓(xùn)練深度學(xué)習(xí)模型,現(xiàn)已支持近15種農(nóng)作物、80種常見病蟲害種類的識別,識別準確率大于90%,單張圖片的識別時間小于200ms。

利用該系統(tǒng),農(nóng)耕人員只需要下載一個App,拿出手機拍照圈定要識別的區(qū)域,該系統(tǒng)就能夠自動的識別農(nóng)作物的發(fā)病狀態(tài)和種類。

上圖為基于移動端的農(nóng)作物病蟲害識別項目系統(tǒng)概述圖。首先,在服務(wù)端采用大規(guī)模專業(yè)圖像數(shù)據(jù)來訓(xùn)練深度學(xué)習(xí)模型,并使用AutoML和知識遷移等技術(shù)使得在有限時延的限制下搜索出更高精度的模型,再將訓(xùn)練好的模型部署到搭載高通驍龍865 5G移動平臺的OPPO Ace2手機上,利用高通第五代 AIEngine加速整個模型部署的性能,得到整個項目的原型。最后利用云端大數(shù)據(jù)為每個農(nóng)戶提供精準個性化的綜合解決方案。

在開發(fā)過程中,作者遇到的主要問題是如何用較少的數(shù)據(jù)訓(xùn)練出較高精度和泛化性的模型,以及需要準備一個適當?shù)沫h(huán)境。由于作者本身沒有App設(shè)計和開發(fā)的經(jīng)驗,對Android開發(fā)不熟練,需要邊學(xué)習(xí)邊開發(fā),過程雖略微坎坷,不過問題總算被一一解決,感謝在項目過程中給與幫助的朋友。




算法創(chuàng)新獎



獲獎?wù)撸宏糖?/span>

參賽作品名稱:基于顏色補償?shù)膱D像增強

團隊成員與分工:個人

作品及開發(fā)過程介紹:

近年來,盡管水下圖像處理領(lǐng)域取得了相對不錯的效果,但仍存在很多痛點。為此,本項目針對水下圖像顏色復(fù)原提出了一種實現(xiàn)成本低且復(fù)原效果好的的復(fù)原方法,期望矯正水下圖像的色偏同時去除水下成像后向散射的干擾。

實現(xiàn)水下圖像顏色復(fù)原以及清晰度恢復(fù)的主要步驟如下:

原圖通過WCID估計出水下圖像不同波段光線的全局衰減率以及局部衰減率

根據(jù)第一步計算的衰減率對衰減較多的顏色通道進行色彩補償

對補償后圖像進行白平衡去除過度補償?shù)呢撁嫘?yīng)

根據(jù)圖像的藍綠通道采用去霧的方式估計水體圖像的透射率

采用大氣散射模型去除水體圖像的后向散射得到清晰的圖像

實驗結(jié)果展示:




AI應(yīng)用場景創(chuàng)新獎



獲獎?wù)撸褐x永明 (香港光云科技團隊)

參賽作品名稱:TrueToF—主動式AI ToF成像及應(yīng)用

團隊成員與分工:謝永明,香港光云科技創(chuàng)始人,項目統(tǒng)籌;周經(jīng)偉,3D成像算法研發(fā);李建英,工程管理與實施;王興鶴,產(chǎn)品設(shè)計。

作品及開發(fā)過程介紹:

伴隨ToF產(chǎn)品的發(fā)展,再加上ToF輸出深度信息,不會有色彩圖像信息輸出,保證了個人隱私?;诖朔矫婵紤],香港光云科技推出了TrueToF人像應(yīng)用,通TrueToF提供的三維圖像信息非常有利于做圖像分割與3D識別,可以快速定位感興趣區(qū)域,從而降低后期AI算法的數(shù)據(jù)處理復(fù)雜度,簡化用戶的人臉I(yè)D注冊流程并提升3D人臉識別系統(tǒng)的精準度。

TrueToF ToF成像AI優(yōu)化

相較于傳統(tǒng)ToF成像,TrueToF利用機器學(xué)習(xí),通過對環(huán)境的機器學(xué)習(xí),正確識別與提升黑色物體、強光環(huán)境下的ToF成像精度和準度,并進行動態(tài)成像以保證移動設(shè)備的節(jié)電需求。

TrueToF ToF人像摳圖

基于快速的人臉識別機器學(xué)習(xí)模型,可實現(xiàn)毫秒級的人臉檢測、人像提取,同時保證3D人像與物體的摳圖在復(fù)雜背景的邊緣準度。

TrueToF ToF人臉識別

本系統(tǒng)可一次性提取超過400個3D特征點作為特征比對點,并通過高通第五代 AI Engine加速,具備毫秒級采集,有效簡化用戶人臉I(yè)D的注冊流程,通過毫秒級的人臉識別模塊,可根據(jù)3D特征快速定位人臉并進行實時的人臉跟蹤及識別。

TrueToF ToF表情映射

通過400多個特征點的實時匹配,可獲取實時面部信息,保障了人臉的“任意角度”跟蹤,通過利用高通第五代 AI Engine加速,可實現(xiàn)實時面部表情的獲取,可用于3D表情的實時映射等。




終端側(cè)人工智能創(chuàng)新獎



獲獎?wù)撸簠矔苑?/span>

參賽作品名稱:基于安卓的photo2cartoon應(yīng)用

團隊成員與分工:隊長:叢曉峰(研二學(xué)生),負責Android studio開發(fā)APP,采用深度學(xué)習(xí)框架進行模型訓(xùn)練和端側(cè)部署。

作品及開發(fā)過程介紹:

目前,手機APP已經(jīng)成為兒童學(xué)習(xí)的重要入口。本項目旨在提高兒童繪畫學(xué)習(xí)的趣味性,利用深度學(xué)習(xí)圖圖轉(zhuǎn)換(Image-to-Image Translation)技術(shù),將用戶手工繪制的“簡筆畫”轉(zhuǎn)為“真實圖像”。

該App提供了四個面板,分別用于記錄用戶在繪制草圖過程中,不同階段對應(yīng)生成的圖像。用戶可以通過選擇顯示器標號(1,2,3,4),將生成的圖像指定到任意畫板上,如下:

系統(tǒng)使用當前學(xué)界普遍認可的image2image轉(zhuǎn)換方法,根據(jù)端側(cè)的實時性要求進行模型設(shè)計。采用Conv/DeConv + InstanceNorm + ReLU作為基本模塊設(shè)計編碼解碼網(wǎng)絡(luò)(Conv表示卷積,Deconv表示反卷積)。模型采用深度學(xué)習(xí)領(lǐng)域的生成對抗網(wǎng)絡(luò)思想,對生成器和判別器進行聯(lián)合訓(xùn)練,確保生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的同步優(yōu)化。

生成器網(wǎng)絡(luò)作為移動端部署的核心網(wǎng)絡(luò),負責將用戶繪制的草圖轉(zhuǎn)換為真實圖像。生成器由多個卷積模塊和反卷積模塊構(gòu)成,整體結(jié)構(gòu)為編碼-解碼思想,如下圖:



5G 邊緣應(yīng)用技術(shù)獎



獲獎?wù)撸宏慁i

參賽作品名稱:AI智能圖鑒

團隊成員與分工:陳鵬 博特智能VP 世界100強IT企業(yè)高級研發(fā)工程師+后臺算法和業(yè)務(wù)邏輯開發(fā);張靜 具設(shè)計部管理經(jīng)驗,擅長支持企業(yè)CIS系統(tǒng)設(shè)計服務(wù)VIS視覺設(shè)計,企業(yè)品牌視覺設(shè)計、企宣相關(guān)設(shè)計等;徐苑資深市場營銷專家,創(chuàng)意和傳播,產(chǎn)品和交互設(shè)計。

作品介紹:

AI智能圖鑒基于諦聽AI智能平臺,該平臺采用全流水線深度學(xué)習(xí)算法,以GPU/CPU為核心的服務(wù)器集群并行分布式架構(gòu),通過大量模型訓(xùn)練,利用算法實現(xiàn)了對違規(guī)圖片內(nèi)容的自動過濾,包括涉黃、低俗、涉政、涉暴恐、違禁廣告等多維度多分類的內(nèi)容審核過濾機制,以及場景、人物、動作、物體等各類情景標簽的識別。

本系統(tǒng)分為前端業(yè)務(wù)系統(tǒng)以及后端算法服務(wù)兩個主要部分,采用了微服務(wù)架構(gòu)設(shè)計思想并結(jié)合開源的spring框架設(shè)計而成。

本系統(tǒng)圖片內(nèi)容審核是基于深度神經(jīng)網(wǎng)絡(luò)模型實現(xiàn),采用像素集分類計數(shù)和網(wǎng)絡(luò)再生技術(shù)進行圖片內(nèi)容審核。此外,本系統(tǒng)采用了分布式架構(gòu)部署,最新版本的圖像模型訓(xùn)練集樣本庫已經(jīng)達到了25萬張,圖像算法目前的平均識別準確率達92%,特別是在涉黃圖片方面的識別率,模型的識別準確率達95.6%。

產(chǎn)品工作流程展示:從左到右依次初始界面、上傳審核、結(jié)果展示




AIOT DSP 應(yīng)用創(chuàng)新獎



獲獎?wù)撸海喊孜牟ǖ龋ń魑挚梢暟l(fā)展有限公司)

參賽作品名稱:AI智能后視鏡

團隊成員與分工:團隊

作品及開發(fā)過程介紹:

業(yè)界首款采用高通驍龍8核的智能后視鏡產(chǎn)品,整體方案以高通MSM8953芯片為主控,整合定位、攝像頭、安卓系統(tǒng)、算法、車載應(yīng)用等軟硬件資源。本地支持多路視頻顯示和錄像,前后ADAS預(yù)警、DMS預(yù)警、智能導(dǎo)航、語音交互、行車軌跡回放、藍牙電話、倒車后視影像、多媒體影音娛樂(QQ音樂和聽伴)等功能;在線支持視頻直播、行車軌跡、文件調(diào)取、電子圍欄、導(dǎo)航尋車、微信互聯(lián)、消息提醒、語音對講、在線升級等功能。

系統(tǒng)框架圖

值得注意的是,以上獲獎?wù)呤潜姸鄥①愖髌分械馁?,大賽進行過程中還涌現(xiàn)出一批優(yōu)秀的人才和AI解決方案,涉及工業(yè)、農(nóng)業(yè)、交通、電商、游戲、慈善、智能家居、健康、民政服務(wù)等多個領(lǐng)域,為AI應(yīng)用創(chuàng)新增加了新的血液!

相約“高通人工智能應(yīng)用創(chuàng)新大賽”頒獎典禮

最終決賽獲獎作品將于9月底在線上舉行的 “高通人工智能應(yīng)用創(chuàng)新大賽”頒獎典禮上進行獎項授予,并有來自高通公司、重慶經(jīng)開區(qū)、極視角、中科創(chuàng)達、清華大學(xué)、OPPO、Google TensorFlow 等公司的高管及技術(shù)主管也將出席此次活動,與大家分享各自對AI 領(lǐng)域的獨特見解,以及對未來的展望。

據(jù)大會官網(wǎng)介紹,本次大賽為唯一一名白金獎獲得者準備了搭載高通驍龍820A汽車平臺的領(lǐng)克05 SUV 一輛(僅承擔裸車價格部分),名分項賽道金獎獲獎?wù)咭矊⒎謩e獲得價值30,000元人民幣的獎品。

創(chuàng)新永不止步,高通人工智能應(yīng)用創(chuàng)新大賽不斷為業(yè)界應(yīng)用帶來更多優(yōu)秀人才與實用的解決方案,期待頒獎典禮帶給大家更多驚喜!