2020-06-19 23:01:57 sunmedia 1431
?在過(guò)去一年,,風(fēng)報(bào)新增全網(wǎng)企業(yè)相關(guān)公開(kāi)數(shù)據(jù)突破15億條。公開(kāi)數(shù)據(jù)在IT時(shí)代到DT時(shí)代的變革中將發(fā)揮越來(lái)越重要的作用,如何有效處理及利用這些數(shù)據(jù)并實(shí)現(xiàn)價(jià)值轉(zhuǎn)化是企業(yè)現(xiàn)今面臨的最大挑戰(zhàn)。?
????2018年9月21日,在杭州舉辦的ATEC大會(huì)上,,風(fēng)報(bào)高級(jí)算法專家趙迎賓先生應(yīng)邀發(fā)表了“公開(kāi)情報(bào)+AI 助力企業(yè)數(shù)據(jù)化風(fēng)控”的演講,深入探索了風(fēng)報(bào)在公開(kāi)情報(bào)分析與智能風(fēng)控領(lǐng)域的技術(shù)實(shí)踐。?
????從公開(kāi)數(shù)據(jù)到情報(bào)?
????風(fēng)控是螞蟻金服的核心能力,,對(duì)公開(kāi)情報(bào)的獲取和挖掘能力是其中重要的組成部分,。?
????從2007年到2017年,在互聯(lián)網(wǎng)上的企業(yè)公開(kāi)信息數(shù)量增長(zhǎng)超過(guò)了40倍?,F(xiàn)在,,企業(yè)公開(kāi)信息分布在超過(guò)50000個(gè)政府部門(mén)網(wǎng)站,3000多家法院網(wǎng)站,,超過(guò)10萬(wàn)家媒體和自媒體門(mén)戶以及不計(jì)其數(shù)的企業(yè)官方網(wǎng)站和第三方平臺(tái),。?
????在面向小微企業(yè)的金融服務(wù)中,由于傳統(tǒng)征信數(shù)據(jù)的缺失,,公開(kāi)數(shù)據(jù)成為了金融服務(wù)機(jī)構(gòu)和企業(yè)控制風(fēng)險(xiǎn)的必要手段,。?
????要把公開(kāi)數(shù)據(jù)轉(zhuǎn)化為風(fēng)控能力和商業(yè)價(jià)值,需要跨越這三個(gè)挑戰(zhàn),。?
????第一,,數(shù)據(jù)孤島。雖然公開(kāi)數(shù)據(jù)的數(shù)量大,,但是它們分散在互聯(lián)網(wǎng)的各個(gè)角落,,而且重要的風(fēng)險(xiǎn)線索存在于網(wǎng)上的時(shí)間也有限,例如,,有些法院的開(kāi)庭公告只會(huì)在開(kāi)庭前在網(wǎng)站上可查,,開(kāi)庭后就不再公示了。?
????第二,,結(jié)構(gòu)化程度低,。例如,有大量不同的來(lái)源可以獲取到訴訟的信息,,格式,、結(jié)構(gòu)化程度也不盡相同。但是要了解這些訴訟對(duì)企業(yè)的影響到底有多大,,就需要知道每起訴訟的案由,、對(duì)手方、勝敗訴等一系列結(jié)構(gòu)化的信息,,再對(duì)結(jié)構(gòu)化的信息進(jìn)行統(tǒng)計(jì)分析,。?
????第三,數(shù)據(jù)之間缺乏關(guān)聯(lián),。企業(yè)與企業(yè)之間可能會(huì)發(fā)生股權(quán),、供應(yīng)鏈、擔(dān)保,、業(yè)務(wù)競(jìng)爭(zhēng)等大量不同的關(guān)聯(lián)關(guān)系,,評(píng)估不同的關(guān)聯(lián)關(guān)系對(duì)企業(yè)的經(jīng)營(yíng)可能產(chǎn)生的影響,以及風(fēng)險(xiǎn)事件發(fā)生時(shí)的可能傳導(dǎo)路徑,,需要建立在圖計(jì)算的核心能力上,,而一些流行的開(kāi)源圖數(shù)據(jù)庫(kù)在面對(duì)復(fù)雜的計(jì)算任務(wù)時(shí)顯得力不從心,。?
????風(fēng)報(bào)作為螞蟻金服科技金融智能應(yīng)用的又一重磅產(chǎn)品,致力于借助人工智能為合作伙伴提供企業(yè)情報(bào)分析及風(fēng)險(xiǎn)管理服務(wù),。通過(guò)標(biāo)準(zhǔn)化SaaS服務(wù)的模式,,風(fēng)報(bào)已賦能數(shù)百家合作伙伴,賦能企業(yè)實(shí)現(xiàn)數(shù)據(jù)化決策,,幫助金融機(jī)構(gòu)實(shí)現(xiàn)全流程統(tǒng)一風(fēng)控,,風(fēng)報(bào)希望通過(guò)消除信息差,打通傳統(tǒng)企業(yè)與金融機(jī)構(gòu)間的金融服務(wù)通道,,實(shí)現(xiàn)更平等和普惠的金融服務(wù),。?
????每周2次以上的快速發(fā)布,歷經(jīng) 300多個(gè)版本的迭代,,風(fēng)報(bào)在應(yīng)對(duì)上述挑戰(zhàn)方面積累了豐富的經(jīng)驗(yàn)和產(chǎn)品化沉淀,。?
????首先,風(fēng)報(bào)建立了一套成熟的分布式數(shù)據(jù)采集系統(tǒng),,結(jié)合人工智能技術(shù)實(shí)現(xiàn)了采集集群的智能調(diào)度,,并支持自動(dòng)化的網(wǎng)頁(yè)結(jié)構(gòu)分析,從中抽取標(biāo)題,、內(nèi)容,、發(fā)布時(shí)間、表格,、圖表等關(guān)鍵信息,,實(shí)現(xiàn)了對(duì)全網(wǎng)信息的高質(zhì)量覆蓋。?
????接下來(lái),,基于自研的自然語(yǔ)言處理技術(shù)和數(shù)千萬(wàn)條高質(zhì)量語(yǔ)料,,風(fēng)報(bào)建立了超過(guò)20個(gè)中文語(yǔ)義模型,將非結(jié)構(gòu)化的文本進(jìn)行清洗,、去重,、分析,,經(jīng)過(guò)分詞,、實(shí)體識(shí)別、關(guān)系抽取等多道工序,,把數(shù)據(jù)分門(mén)別類(lèi),,轉(zhuǎn)化為結(jié)構(gòu)化的企業(yè)情報(bào)信息。經(jīng)過(guò)結(jié)構(gòu)化處理的情報(bào),,結(jié)合風(fēng)報(bào)豐富的數(shù)據(jù)可視化,,使風(fēng)控人員能夠在大量信息中快速識(shí)別出企業(yè)的風(fēng)險(xiǎn)。?
????最后,,面對(duì)海量關(guān)聯(lián)圖譜關(guān)系的挑戰(zhàn),,風(fēng)報(bào)建設(shè)了一套基于內(nèi)存的圖計(jì)算引擎,,實(shí)現(xiàn)了在1億節(jié)點(diǎn)、10億關(guān)系的網(wǎng)絡(luò)上的秒級(jí)關(guān)聯(lián)計(jì)算能力,。在傳統(tǒng)的基于磁盤(pán)介質(zhì)的圖數(shù)據(jù)庫(kù)中,,挖掘到第4層、第5層的時(shí)間開(kāi)銷(xiāo)就已經(jīng)超出了用戶可以接受的極限,,而風(fēng)報(bào)的圖計(jì)算引擎能夠在1秒內(nèi)挖掘10層以上的企業(yè)關(guān)聯(lián),;在此基礎(chǔ)上,風(fēng)報(bào)還結(jié)合反洗錢(qián),、風(fēng)控等業(yè)務(wù)場(chǎng)景進(jìn)一步搭建了最終受益人,、混業(yè)經(jīng)營(yíng)等識(shí)別能力,進(jìn)一步豐富了圖計(jì)算引擎的場(chǎng)景應(yīng)用,。?
????基于“公開(kāi)數(shù)據(jù)+AI”,,風(fēng)報(bào)通過(guò)SaaS化的產(chǎn)品模式,在數(shù)據(jù)采集,、中文語(yǔ)義,、場(chǎng)景化服務(wù)能力等方面持續(xù)創(chuàng)新,探索出了一條可復(fù)制的科技賦能路線,。?
????到目前為止,,風(fēng)報(bào)已簽約了數(shù)百家合作伙伴,分布于銀行,、融資租賃,、供應(yīng)鏈金融、企業(yè)內(nèi)控,、不良資產(chǎn),、政府等不同的行業(yè)和企業(yè)部門(mén),覆蓋了潛在商機(jī)挖掘,、風(fēng)控前置,、盡職調(diào)查、競(jìng)爭(zhēng)對(duì)手情報(bào),、風(fēng)險(xiǎn)動(dòng)態(tài)監(jiān)控和監(jiān)管合規(guī)等大量應(yīng)用場(chǎng)景,。?
????信用風(fēng)險(xiǎn)感知:從“信仰”到信評(píng)?
????與人工智能技術(shù)的深度結(jié)合,可以更大地釋放公開(kāi)數(shù)據(jù)的潛力,。針對(duì)信用債的風(fēng)險(xiǎn)感知系統(tǒng),,是風(fēng)報(bào)產(chǎn)品賦能的最新案例。?
近年來(lái)信用債違約規(guī)模和數(shù)量表
????在2014年以前,,對(duì)于信用債的買(mǎi)方而言,,信用債的投資還可以依靠“信仰”,由于缺少實(shí)質(zhì)違約的案例,以及行業(yè)普遍存在的剛兌預(yù)期,,債券買(mǎi)方對(duì)于信用風(fēng)險(xiǎn)的重視程度并不高,。在之后短短的四年間,民營(yíng)企業(yè),、地方國(guó)企,、央企、城投相繼出現(xiàn)違約事件,,違約的主體數(shù),、總規(guī)模也呈逐年上升的趨勢(shì)。?
????因此,,有效識(shí)別風(fēng)險(xiǎn)的能力,,對(duì)于債券和債券基金的投資者會(huì)變得越來(lái)越不可或缺。傳統(tǒng)的信用債風(fēng)險(xiǎn)管理,,主要存在以下尚未解決的問(wèn)題:?
????? 基于財(cái)務(wù)指標(biāo)的風(fēng)控,,不能實(shí)時(shí)反映發(fā)行主體風(fēng)險(xiǎn);?
????? 外部風(fēng)險(xiǎn)事件來(lái)源廣,,非結(jié)構(gòu)化,,難以在風(fēng)險(xiǎn)模型中應(yīng)用;?
????? 無(wú)法預(yù)判關(guān)聯(lián)風(fēng)險(xiǎn)傳導(dǎo),。?
????結(jié)合“公開(kāi)數(shù)據(jù)+AI”,,風(fēng)報(bào)可以大大降低在信用債風(fēng)險(xiǎn)管理中利用公開(kāi)數(shù)據(jù)的難度。依托公開(kāi)數(shù)據(jù)實(shí)時(shí),、高頻的特點(diǎn),,結(jié)合強(qiáng)大的數(shù)據(jù)結(jié)構(gòu)化和關(guān)聯(lián)分析能力,可以幫助機(jī)構(gòu)更加快速地捕捉企業(yè)風(fēng)險(xiǎn)的動(dòng)態(tài)變化,,建立更高質(zhì)量的信用債主體評(píng)價(jià)體系,。?
????回到這次ATEC大會(huì)“暖科技”的主題,在未來(lái),,隨著被動(dòng)投資的理念得到更廣泛的普及,,風(fēng)報(bào)的風(fēng)險(xiǎn)感知能力可以和財(cái)富管理結(jié)合,幫助個(gè)人投資者更好地基于自己的風(fēng)險(xiǎn)偏好,,發(fā)現(xiàn)適合自己的投資標(biāo)的,,實(shí)現(xiàn)在財(cái)富管理領(lǐng)域的平等、普惠,。?
????風(fēng)報(bào)相信,,通過(guò)推動(dòng)公開(kāi)數(shù)據(jù)和人工智能技術(shù)的廣泛、平等的利用,,可以為世界帶來(lái)更多微小而美好的變化。?
? ??