云計算

降本增效!華為譜寫廣東省農信聯社數字化轉型故事

ainet.cn   2023年02月21日

OCR是最早應用于企業(yè)降本增效的AI技術之一,目前已廣泛應用在金融、保險、醫(yī)療、交通、教育等諸多行業(yè)。

OCR是最早應用于企業(yè)降本增效的AI技術之一,可以對企業(yè)在經營過程中產生的大量的文檔、表格、圖片等非結構數據進行識別與提取,使其快速轉變?yōu)橛嬎銠C文字,幫助降低數據存儲量、支撐企業(yè)檔案循環(huán)分析。目前已廣泛應用在金融、保險、醫(yī)療、交通、教育等諸多行業(yè)。

隨著實踐的不斷深入,企業(yè)對OCR模型的需求呈現越來越多元化的趨勢。以廣東省農村信用社聯合社(以下簡稱“廣東省農信聯社”)的日常業(yè)務為例,工作人員需要人工識別和錄入大量不同類型的手寫文字,包括辦理存取款業(yè)務時的簽名識別、預留簽名印鑒的簽名比對、支票、解款、匯款等業(yè)務的手寫憑證等。

傳統OCR廠商組合式的服務存在算法普適性不強的問題,當面對不同的識別場景,開發(fā)人員需要重新對數據進行標注并訓練一個新的模型,這使得OCR服務的開發(fā)維護成本居高不下,也無法滿足業(yè)務快速發(fā)展的要求。

另一方面,缺乏高質量的手寫字體標注數據是提升OCR手寫字體識別模型精度的最大挑戰(zhàn)之一。相較于通用印刷體,手寫字體存在不規(guī)則、連筆、潦草等特點。OCR技術對手寫字體的識別難度遠超印刷體。在數據方面,對手寫字體的模型訓練也無法參照印刷體的訓練方式,即通過大量合成數據提高算法精度。

為解決廣東省農信聯社面臨的業(yè)務需求多元化、數據量少的難題,華為云盤古金融OCR大模型通過獨有的對比學習與掩膜圖像建模相融合的自監(jiān)督學習方法,能夠學習并充分利用大規(guī)模的無標簽OCR數據,只需要傳統方式十分之一的標注量,就可以訓練出高精度的手寫字體識別模型。在華為云與廣東省農信聯社的聯創(chuàng)實踐項目中,相較業(yè)界的小模型開發(fā)方式,盤古金融OCR大模型可以將字段識別精度從83.9%提升至91.0%。

此外,通過盤古金融OCR大模型,廣東省農信聯社可以實現用一個模型覆蓋多個通用的文字識別場景。例如,在柜面手寫單據業(yè)務場景中,盤古金融OCR大模型可以自動識別出日期、賬號、戶名、開戶行、大小寫金額等手寫信息,將原有的“人工錄兩錄一?!焙喕癁椤跋到y自動一錄,人工一錄一?!?。對于柜外清、VTM/STM上無紙化的簽字圖片,盤古金融OCR大模型可以識別簽名的具體文字或簽名的動態(tài)數據矢量文件,完成靜態(tài)簽名和動態(tài)簽名對比。

華為云盤古金融OCR大模型已在十一項經典數據集(如IIIT5K, SVT, IC13, IC15, SVTP, CUTE等)測試中取得顯著的精度提升。與原本領先的文字識別算法相比,盤古金融OCR大模型的精度平均提升5%以上。

面對當下越來越廣泛的移動辦公場景,業(yè)界移動端OCR算法普遍以犧牲算法精度的方式換取運行速度。華為云盤古金融OCR大模型可以平滑蒸餾出體積相差1000倍的大、中、小模型,滿足在多種設備上高效運行的使用條件,覆蓋金融、零售、電商、地產等行業(yè)的新型單據、卡證、表格的識別需求。

此外,華為云盤古金融OCR大模型能夠提供二次訓練能力,企業(yè)可在通用模型基礎上快速訓練出適應業(yè)務場景的新模型,讓企業(yè)自主掌握OCR服務構建能力。降低模型定制成本,縮短業(yè)務上線周期,幫助更多企業(yè)從傳統人工作業(yè)環(huán)節(jié)中解放出來,創(chuàng)造更大的生產力和價值,為金融行業(yè)數字化變革注入源動力。

(華為)

標簽:華為 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
ABB協作機器人,自動化從未如此簡單
優(yōu)傲機器人下載中心
2024全景工博會
專題報道
2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內外企業(yè)推進“雙碳”實踐的最新成果,鼓勵更多企業(yè)、科研機構、投資機構等廣泛... [更多]

中國國際進口博覽會
中國國際進口博覽會

11月5日至10日,第七屆中國國際進口博覽會在國家會展中心(上海)舉行。152個國家、地區(qū)和國際組織,近3500家參展企... [更多]

2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質領航”為全新主題。 [更多]