ENGLISH 中財(cái)主站 加入收藏
當(dāng)前位置: 首 頁(yè) > 正文

我院教師韓璐在國(guó)際頂級(jí)權(quán)威期刊《Expert Systems With Applications》發(fā)表論文

發(fā)布時(shí)間:2025-11-13瀏覽次數(shù):


近日,我院韓璐副教授作為第一作者的合作論文Integrated Multivariate Segmentation Tree for Heterogeneous Credit Data Analysis in Small- and Medium-Sized Enterprises在國(guó)際頂級(jí)權(quán)威期刊《Expert Systems With Applications》在線發(fā)表。該期刊是中央財(cái)經(jīng)大學(xué)AAA期刊,JCR一區(qū)期刊、中國(guó)科學(xué)院一區(qū)期刊,在計(jì)算機(jī)科學(xué)、人工智能、運(yùn)籌學(xué)與管理科學(xué)領(lǐng)域具有重要的學(xué)術(shù)影響力。論文在線鏈接:https://doi.org/10.1016/j.eswa.2025.130389

論文介紹

本論文提出一種名為集成多變量分割樹(IMST)的機(jī)器學(xué)習(xí)框架,用于解決中小企業(yè)信用評(píng)估中的異構(gòu)數(shù)據(jù)建模難題。傳統(tǒng)方法依賴資產(chǎn)負(fù)債率、凈利潤(rùn)率等結(jié)構(gòu)化財(cái)務(wù)指標(biāo),雖具解釋力,但難以全面反映企業(yè)運(yùn)營(yíng)狀況與潛在風(fēng)險(xiǎn)。近年來(lái),非結(jié)構(gòu)化文本數(shù)據(jù)(如銀行貸后記錄、企業(yè)公告、新聞報(bào)道)因其蘊(yùn)含的動(dòng)態(tài)行為特征和軟信息受到關(guān)注。然而,如何有效融合文本與數(shù)值數(shù)據(jù),并構(gòu)建兼具高精度與可解釋性的模型,仍是關(guān)鍵挑戰(zhàn)。

針對(duì)此問(wèn)題,論文提出了IMST框架,系統(tǒng)整合異構(gòu)數(shù)據(jù)并平衡預(yù)測(cè)性能與可解釋性。方法分為三階段:第一階段將文本轉(zhuǎn)化為低維語(yǔ)義表示。通過(guò)對(duì)1,428份中小企業(yè)審計(jì)文本預(yù)處理(去停用詞、實(shí)體抽取、屬性標(biāo)注),構(gòu)建文檔-術(shù)語(yǔ)矩陣,并采用非負(fù)矩陣分解生成潛變量,實(shí)現(xiàn)文本結(jié)構(gòu)化與高效計(jì)算。第二階段優(yōu)化財(cái)務(wù)特征選擇。針對(duì)冗余且相關(guān)的財(cái)務(wù)比率(如流動(dòng)資產(chǎn)/總資產(chǎn)、留存收益/總資產(chǎn)),使用Lasso回歸進(jìn)行變量篩選,通過(guò)L1正則化實(shí)現(xiàn)稀疏建模。第三階段構(gòu)建基于多變量聯(lián)合分裂的決策樹。IMST在每個(gè)節(jié)點(diǎn)綜合多個(gè)變量,以基尼指數(shù)或信息熵為準(zhǔn)則進(jìn)行分割,提升劃分精細(xì)度與魯棒性。同時(shí)引入“最弱鏈接剪枝”機(jī)制,結(jié)合交叉驗(yàn)證防止過(guò)擬合,增強(qiáng)泛化能力。整體設(shè)計(jì)兼顧準(zhǔn)確性、簡(jiǎn)潔性與可解釋性,適用于金融風(fēng)控等高透明度需求場(chǎng)景。

實(shí)驗(yàn)結(jié)果表明,IMST在真實(shí)城商行數(shù)據(jù)上準(zhǔn)確率達(dá)88.9%,優(yōu)于單變量決策樹及SVM、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)等主流模型。尤其在識(shí)別高風(fēng)險(xiǎn)企業(yè)方面,準(zhǔn)確率較基線提升超12個(gè)百分點(diǎn)。模型具備良好實(shí)用性:樹形結(jié)構(gòu)支持直觀規(guī)則提取,便于信貸人員理解;訓(xùn)練快、參數(shù)少,適合部署于實(shí)時(shí)審批系統(tǒng)。多輪交叉驗(yàn)證顯示其在不平衡數(shù)據(jù)與小樣本條件下仍具穩(wěn)健性。

本研究貢獻(xiàn)有三:一是提出完整的文本與結(jié)構(gòu)化數(shù)據(jù)融合方案,打破建模壁壘;二是創(chuàng)新決策樹范式,結(jié)合特征選擇與多變量分裂,提升表現(xiàn)力與效率;三是為中小企業(yè)信用評(píng)估提供高性能、高可解釋的實(shí)用工具,推動(dòng)智能風(fēng)控落地。

作者簡(jiǎn)介

韓璐,管理科學(xué)與工程學(xué)院副教授、博士生導(dǎo)師,中國(guó)系統(tǒng)工程學(xué)會(huì)數(shù)據(jù)科學(xué)與知識(shí)系統(tǒng)工程專委會(huì)委員。長(zhǎng)期從事數(shù)據(jù)科學(xué)、計(jì)算金融方面的研究,已在《Expert Systems With Applications》、《Engineering Applications of Artificial Intelligence》、《Knowledge and Information Systems》、《系統(tǒng)工程理論與實(shí)踐》、《管理工程學(xué)報(bào)》等國(guó)內(nèi)外知名期刊發(fā)表了學(xué)術(shù)論文40余篇,出版了《A Valuation of the Science and Technology Innovation Board in China》、《Modelling Consumer Financing Behaviour in China》等3部專著;主持和參與了10余項(xiàng)省部級(jí)以上課題;榮獲過(guò)中央財(cái)經(jīng)大學(xué)“馳望”一流學(xué)術(shù)成果獎(jiǎng)、中央財(cái)經(jīng)大學(xué)青年教師教學(xué)基本功大賽綜合三等獎(jiǎng)等榮譽(yù)獎(jiǎng)勵(lì)。



撰稿人:韓璐

審核人:劉志東




太仆寺旗| 普兰县| 大竹县| 旅游| 斗六市| 安阳市| 嘉鱼县| 滁州市| 沐川县| 客服| 叶城县| 卢氏县| 肇源县| 孟津县| 胶州市| 海盐县| 随州市| 垫江县| 岳阳县| 浦县| 荥阳市| 昂仁县| 富川| 临湘市| 鄂伦春自治旗| 剑川县| 得荣县| 宣武区| 社会| 惠州市| 汝州市| 舒城县| 屏东县| 桦川县| 桃江县| 石台县| 铁岭市| 扶风县| 赤峰市| 福泉市| 于田县|