-
合合信息:專注文字識別15年,“我們是人工智能行業(yè)老兵”
-
周遠(yuǎn)方zhouyufang@guancha.cn
最后更新: 2021-07-09 21:14:06【文/觀察者網(wǎng) 周遠(yuǎn)方 編輯/劉惠】
2021世界人工智能大會(huì)于7月8日-10日在上海世博展覽館召開。
人工智能是上海落實(shí)國家戰(zhàn)略部署、重點(diǎn)發(fā)展的三大先導(dǎo)產(chǎn)業(yè)之一,在這片沃土上,近年來人工智能領(lǐng)域出現(xiàn)了許多創(chuàng)新場景和前沿進(jìn)展。
合合信息作為上海本土科技企業(yè)代表,2019和2020年成功在世界人工智能大會(huì)舉辦金融科技落地論壇,并先后邀請兩位諾貝爾獎(jiǎng)獲得者參與發(fā)言。
比起今天在人工智能賽道上叱咤風(fēng)云、炙手可熱的“四小龍”們,合合信息要低調(diào)得多。
圖片來源:合合信息
“我們其實(shí)可以稱得上人工智能行業(yè)的‘老炮兒’”,合合信息董事湯松榕在接受觀察者網(wǎng)采訪時(shí)說道,“2006年剛成立時(shí),人工智能專業(yè)畢業(yè)的人其實(shí)是不太能找到好工作的,因?yàn)榇蠹耶?dāng)時(shí)都不知道人工智能可以干什么?!?
但合合信息的創(chuàng)始團(tuán)隊(duì)是名副其實(shí)的正規(guī)軍,大部分骨干來自摩托羅拉人工智能實(shí)驗(yàn)室的,創(chuàng)始人鎮(zhèn)立新本人,則是中國科學(xué)院模式識別與智能系統(tǒng)專業(yè)的博士。
我們作為一個(gè)技術(shù)驅(qū)動(dòng)的團(tuán)隊(duì),選定了人工智能文字識別的方向,就是十幾年一直堅(jiān)持不斷地投入。
“文字識別,也稱為OCR,是一個(gè)比較冷門的方向”,湯松榕介紹,可能很多人覺得OCR是個(gè)非常開源的技術(shù),像Google、百度、微軟都發(fā)布了開源的OCR。但實(shí)際上,復(fù)雜場景下的文字識別技術(shù)難度很高,可能一份文件模糊到連肉眼無法分辨清楚,我們深度學(xué)習(xí)的人工智能技術(shù)能夠把文檔更清晰地識別出來,特別是在移動(dòng)端,比如我們拍照過度曝光、反光、抖動(dòng)、微弱光線等等情境下,我們拍出來的文件用傳統(tǒng)OCR是無法識別的,我們解決的就是這種復(fù)雜場景下的文字識別能力。
合合信息是第一個(gè)把AI文字識別技術(shù)應(yīng)用到移動(dòng)端的公司,2009年推出第一個(gè)產(chǎn)品“名片全能王”,幫助商務(wù)人士捕捉名片上的信息,錄入到通訊錄中。就是這樣的產(chǎn)品成為第一個(gè)幫助蘋果手機(jī)跟商務(wù)社交領(lǐng)域打通的APP,也給蘋果用戶帶來更好的體驗(yàn)。
15年默默的深耕,打磨出這次人工智能大會(huì)上的一大亮點(diǎn)。
甲骨文作為我國最早的成熟文字、世界四大古文字之一,因刻寫在龜甲和獸骨上而得名。目前,已出土的甲骨碎片多達(dá)16萬余件??上У氖?,這些甲骨碎片被埋在地下多年,經(jīng)歷了地下活動(dòng)的沖擊和挖掘造成的磨損,多數(shù)甲骨殘缺嚴(yán)重;又由于隨著人類歷史的遷徙遍布于世界各個(gè)角落,很難有完整的信息。
圖片來源:合合信息
隨著人工智能的引進(jìn),通過圖像識別技術(shù),可以進(jìn)行甲骨的自動(dòng)識別、撮合,為甲骨文學(xué)者的工作提質(zhì)增效。目前,這一技術(shù)處于內(nèi)測階段并首次在人工智能大會(huì)上展示,安陽殷墟景區(qū)作為這一技術(shù)的學(xué)術(shù)支持單位。
智能文字識別技術(shù)主要包含了智能圖像處理,基于深度學(xué)習(xí)的復(fù)雜場景文字識別,自然語言處理三個(gè)核心技術(shù)層。智能圖像處理技術(shù)主要對用戶拍攝的復(fù)雜文檔圖像進(jìn)行預(yù)處理,使得文檔圖像質(zhì)量得到大幅度提升。例如對圖像進(jìn)行增強(qiáng),讓圖像看起來更清晰,對形變圖像進(jìn)行還原矯正,對圖像中因光照不均產(chǎn)生的陰影問題進(jìn)行處理,對不同角度拍攝的圖像進(jìn)行定位和透視變換矯正?;谏疃葘W(xué)習(xí)的復(fù)雜場景文字識別技術(shù)主要利用合合信息自研的手寫印刷混排識別,抗強(qiáng)干擾識別,扭曲文字識別,復(fù)雜印章和手寫識別等一系列先進(jìn)深度學(xué)習(xí)識別技術(shù)來解決各種不同復(fù)雜場景下的文字識別問題。而自然語言處理技術(shù),則是對識別出的結(jié)果進(jìn)行進(jìn)一步的語義理解。
目前,合合信息的智能文字識別技術(shù)支持中、英、俄等56種語言的文檔圖像、100+種證件的快讀智能分類,以及全球不同國家、不同行業(yè)的卡證、票據(jù)、定制識別等多個(gè)AI場景的產(chǎn)品和解決方案。
- 責(zé)任編輯: 劉惠  周遠(yuǎn)方 
-
IDC發(fā)布隱私計(jì)算報(bào)告,浦發(fā)銀行與螞蟻技術(shù)合作成唯一入選案例
2021-07-09 19:49 世界人工智能大會(huì) -
-
-
第八屆中國產(chǎn)業(yè)互聯(lián)網(wǎng)高峰論壇在寶山開幕
2021-07-09 07:49 世界人工智能大會(huì) -
影像科多領(lǐng)域AI應(yīng)用下,GE醫(yī)療推出“愛迪生魔盒”統(tǒng)一接口
2021-07-08 22:54 世界人工智能大會(huì) -
商湯徐立:AI的突破將有規(guī)律地拓展人類認(rèn)知邊界
2021-07-08 21:49 世界人工智能大會(huì) -
華為輪值董事長胡厚崑:根深葉茂,共筑人工智能新生態(tài)
2021-07-08 16:44 世界人工智能大會(huì) -
基辛格:中美任何一方都不應(yīng)謀求技術(shù)壟斷
2021-07-08 15:12 世界人工智能大會(huì) -
全球首條時(shí)速140KM中低速磁浮列車上線
2021-07-07 18:29 科技前沿 -
字節(jié)跳動(dòng)辟謠
2021-07-05 13:38 大公司 -
運(yùn)滿滿、貨車幫、BOSS直聘被網(wǎng)絡(luò)安全審查
2021-07-05 09:26 網(wǎng)絡(luò)安全 -
神舟十二號乘組后續(xù)還將進(jìn)行一次出艙活動(dòng)
2021-07-04 16:23 航空航天 -
我國掌握大型空間機(jī)械臂核心技術(shù)及應(yīng)用
2021-07-04 15:42 航空航天 -
-
揭秘我國自主研制的“飛天”艙外航天服
2021-07-04 13:53 航空航天 -
全景相機(jī)拍到的地球畫面
2021-07-04 11:55 航空航天 -
壯美!核心艙艙外全景攝像機(jī)拍攝畫面來了
2021-07-04 11:09 航空航天 -
劉伯明、湯洪波均已出艙
2021-07-04 10:53 航空航天 -
“天河”超算取得國際領(lǐng)先突破
2021-07-03 23:18 科技前沿 -
太空又多了一顆中國星:“張彌曼星”!
2021-07-03 11:50
相關(guān)推薦 -
“特朗普和普京在房間里談話,英國只能敲門” 評論 43美議員竟致信6所頂尖高校:交出所有中國學(xué)生信息 評論 197不裝了!特朗普撂下電話就挑撥中俄關(guān)系 評論 269特朗普想給中國下“毒計(jì)”,自家人卻先遭殃了 評論 220最新聞 Hot
-
歐洲央行行長“罕見直言”:要為特朗普的“勒索”做好準(zhǔn)備
-
“俄戰(zhàn)略轟炸機(jī)基地遭烏軍無人機(jī)襲擊,騰起巨大蘑菇云”
-
“特朗普和普京在房間里談話,英國只能敲門”
-
手機(jī)里有批評特朗普的聊天記錄,法國科學(xué)家被美國拒絕入境
-
美議員竟致信6所頂尖高校:交出所有中國學(xué)生信息
-
菲總統(tǒng)姐姐質(zhì)問:菲律賓什么時(shí)候成了海牙的一個(gè)省?
-
不裝了!特朗普撂下電話就挑撥中俄關(guān)系
-
馬斯克超級高鐵夢碎,“中國破解了核心難題”
-
“普京愿承諾對烏剩余領(lǐng)土不提出主權(quán)要求,但特朗普要先…”
-
不想被吞并,加拿大轉(zhuǎn)頭找上歐盟
-
印度高鐵繼續(xù)拖,又看上了日本新列車
-
特朗普致哈梅內(nèi)伊信件曝光:限期2個(gè)月,否則…
-
中國依法處理,加拿大又急眼了
-
特朗普想給中國下“毒計(jì)”,自家人卻先遭殃了
-
美方找補(bǔ):特朗普不會(huì)坐等任何國家元首一小時(shí)
-
美軍削減開支,原定駐日美軍擴(kuò)張計(jì)劃懸了
快訊 -