近日,,中國(guó)平安旗下平安產(chǎn)險(xiǎn)人工智能團(tuán)隊(duì)在ICDAR(國(guó)際文檔分析與識(shí)別大會(huì))上的國(guó)際票據(jù)掃描件文字識(shí)別和信息提取(SROIE)大賽中脫穎而出,,擊敗了國(guó)內(nèi)外100多家參賽單位和隊(duì)伍,綜合檢測(cè)識(shí)別技術(shù)位列榜單第一位,,榮獲世界第一,。
ICDAR專注于文本領(lǐng)域的識(shí)別與應(yīng)用,每?jī)赡陼?huì)舉辦一次各種文檔的識(shí)別競(jìng)賽,,至今吸引了89個(gè)國(guó)家的3500多支隊(duì)伍參與,,Google、Microsoft、Amazon,、 Facebook,、北京大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué),、騰訊,、搜狗等均曾參與其中,具有OCR(智能單證識(shí)別)領(lǐng)域的奧斯卡盛會(huì)之稱,。
SROIE大賽是由ICDAR主辦的國(guó)際頂級(jí)賽事,,是目前OCR技術(shù)領(lǐng)域全球最具挑戰(zhàn)性的比賽。SROIE比賽在對(duì)購(gòu)物小票做文本檢測(cè)和文本識(shí)別的基礎(chǔ)上還加入了極具挑戰(zhàn)的“關(guān)鍵信息抽取” 任務(wù),,包括“商店名稱”“商店地址”“購(gòu)物物品”和“總價(jià)”4個(gè)信息的提取,。這需要充分理解文檔、證件和小票等內(nèi)容,,定位識(shí)別并將所需要的關(guān)鍵信息提取出來,,相比常規(guī)的OCR具有更高準(zhǔn)確度的要求。
本次比賽數(shù)據(jù)使用了真實(shí)的購(gòu)物小票,,票面質(zhì)量惡劣,、格式不統(tǒng)一,是最貼近真實(shí)業(yè)務(wù)場(chǎng)景的一次,,難度相當(dāng)高,。在本次比賽中,平安產(chǎn)險(xiǎn)從檢測(cè)到文字識(shí)別到最后“關(guān)鍵信息抽取識(shí)別”的綜合能力比拼中力壓群雄,,奪得第一,,超過了眾多人工智能領(lǐng)先企業(yè)。
平安產(chǎn)險(xiǎn)相關(guān)負(fù)責(zé)人介紹,,在全面線上化,、自動(dòng)化、數(shù)據(jù)化轉(zhuǎn)型的過程中,,公司眾多業(yè)務(wù)場(chǎng)景都需要實(shí)現(xiàn)各種單證識(shí)別和信息提取,,而OCR技術(shù)是關(guān)鍵。目前,,OCR技術(shù)已經(jīng)在產(chǎn)險(xiǎn)承保,、理賠等環(huán)節(jié)被廣泛應(yīng)用,包括身份證,、銀行卡,、駕駛證、行駛證,、新車合格證,、發(fā)票等10余種業(yè)務(wù)場(chǎng)景,,年總使用量超過兩千萬,還有數(shù)十種類的單證識(shí)別正在研發(fā)應(yīng)用中,。
在中國(guó)平安“金融+科技”“金融+生態(tài)”的戰(zhàn)略指引下,,平安產(chǎn)險(xiǎn)加大科技的投入,強(qiáng)化智慧化經(jīng)營(yíng),。目前,,平安產(chǎn)險(xiǎn)的科技人才近千人,人工智能團(tuán)隊(duì)70余人,?;谌斯ぶ悄艿群诵目萍迹桨伯a(chǎn)險(xiǎn)已打造出智能機(jī)器人,、OCR智能單證識(shí)別,、IFD智能風(fēng)控反欺詐平臺(tái)、KYD駕駛風(fēng)險(xiǎn)預(yù)測(cè),、營(yíng)銷大腦,、AI開放平臺(tái)等六大創(chuàng)新產(chǎn)品。未來,,平安產(chǎn)險(xiǎn)將持續(xù)探索AI技術(shù)的場(chǎng)景化落地應(yīng)用,,加速向科技轉(zhuǎn)型。(王筱)