好未來AI團隊斬獲UbiComp 2020國際競賽冠軍
2020-08-09
近日,全球人機交互與普適計算領域頂級會議UbiComp2020(The ACM International Conference on Pervasive and Ubiquitous Computing)公布了競賽成績,好未來AI中臺機器學習團隊從全球50多支優(yōu)秀參賽隊伍中脫穎而出,以顯著優(yōu)勢奪得冠軍。
再奪國際冠軍,展示中國AI競爭力
UbiComp競賽是UbiComp2020會議的重要組成部分。該競賽由UbiComp組織,埃爾蘭根大學機器學習和數據分析實驗室、弗勞恩霍夫集成電路研究所聯合主辦。
近幾年,UbiComp的參會者及團隊數量高速增長,其中不乏谷歌、亞馬遜、微軟、阿里巴巴、騰訊等國內外領先互聯網研究機構及企業(yè)。今年,埃爾朗根-紐倫堡大學、杜伊斯堡-埃森大學等50多支專業(yè)團隊參賽。
本屆競賽以面向教育領域的前沿探索為主題,要求參賽者不依靠傳統(tǒng)的圖像識別技術,直接利用智能筆書寫軌跡信息,并對相應的書寫內容進行字符識別。經過兩輪的激烈角逐,好未來AI中臺機器學習團隊最終獲得冠軍,向世界展現了中國教育AI技術的硬實力。
現階段,OCR(光學字符識別)技術是大部分企業(yè)經常采用的文字識別技術,一般需要對書寫的最終結果進行拍照后識別。但這一過程容易受光線、陰影、拍攝角度、清晰度等因素影響,且完全忽略了書寫過程、動作及習慣等信息,導致識別結果不夠精準。
比賽中,好未來機器學習團隊完全不依賴OCR技術,而是使用E-RTCR模型,并融合兩種前沿深度學習模型R-Transformer與CRNN,成功地捕獲了智能筆中的多模態(tài)傳感器信號、學習數據中的局部突變特征與整體趨勢特征,即直接對智能筆的傳感器原始數據,包括書寫軌跡、角度、速度、加速度、停頓、筆畫等書寫過程進行建模識別。
相比使用OCR技術直接對圖像進行分析,該方法克服了傳感器信號極端抽象、不同人書寫習慣迥異、多傳感器信號分布差異大等難題。好未來機器學習團隊最終以評分遠超第二名的優(yōu)異成績奪冠。
好未來機器學習團隊以遠超第二名的優(yōu)異成績奪冠
隨著人們對教育體驗提升的不斷追求,智能筆等硬件設備逐漸開始在教學場景中投入使用。這類設備既能保留學生的紙面書寫習慣和自然感受,又能保證書寫軌跡、角度等信息被實時記錄。
好未來機器學習團隊自主研發(fā)的、業(yè)內領先的基于傳感器信號時間序列的字符識別技術,為教學場景的數據分析、內容識別、自動批改等打下了良好的基礎。
加大科研投入,夯實研究能力
自成立以來,好未來始終秉承“愛和科技讓教育更美好”的使命,致力于讓每個人都能享有公平而有質量的教育,不斷加大科技研發(fā)投入。2019 年 8 月,科技部批準依托好未來建設智慧教育國家新一代人工智能開放創(chuàng)新平臺。
依托于智慧教育國家新一代人工智能開放創(chuàng)新平臺,好未來AI中臺不斷加強底層學術能力的構建,在與國內外優(yōu)秀高校保持密切科研學術合作的同時,也在各技術細分領域的全球最高學術舞臺上,展示了中國教育AI的領先實力。
如,好未來AI團隊的數十項學術成果入選AAAI、WWW、AIED、NCME等國際頂級學術會議,獲世界計算機視覺領域頂級會議CVPR-EmotioNet競賽冠軍。在紐約國際人工智能頂級會議AAAI上,好未來AI團隊成功組織了首屆AI for Education學術研討會,推動教育AI領域的國際學術交流。
近年來,好未來AI中臺不斷取得前沿核心技術突破,并在語音技術、視覺理解、知識圖譜等AI能力持續(xù)積累的基礎上,實現多項技術的產品化應用,打造了包括AI課堂、教學過程評估、口語表達能力評測、作業(yè)拍搜批改等創(chuàng)新產品解決方案,覆蓋“教、學、測、練、評”各教學環(huán)節(jié)。
截至目前,好未來已擁有100余項針對教育行業(yè)的AI能力。其中,行業(yè)領先及獨有的模型數達到半數,周均調用量達到5億以上。好未來表示,將持續(xù)向全行業(yè)開放AI+教育實踐成果,全面賦能行業(yè)伙伴,共同推動實現公平而有質量的教育。