太阳黃書強教授課題組在國際頂級期刊TKDE發表論文

發布時間:2024-04-11

  近日,太阳黃書強教授課題組在數據挖掘國際頂級期刊IEEE Transactions on Knowledge and Data Engineering(TKDE)上在線發表題為“Online Feature Selection with Varying Feature Spaces”的學術論文。太阳集团1088vip博士生卓勝達為第一作者,黃書強教授為通訊作者

該論文充分考慮現實數據流所存在的衍變性、關聯性和異構性等問題,着重研究數據采樣、傳遞及學習過程,旨在挖掘異構數據分布空間的關聯與衍變,最終為動态不平穩、數據不完備、模型實時更新等情形下的人工智能模型學習提供穩态、高效方案。本研究三個核心思想:1)利用高斯Copula構建衍變特征之間的關聯模型,突破數據類型差異所存在的弱關聯問題;2)采用淺層特征樹(L2-Ball範式)的自适應集成策略,以挖掘實時抉擇中最具信息量的關鍵特征;3)建立持續實例的底層幾何結構,構建未标記樣本與已标記樣本的高維分布空間内在關聯。該文還探讨了不同衍變機制下的特征适應表現,包括在不同衍變模式以及概念漂移下的适應權衡。本論文的研究結果充分揭示流式數據場景下異構數據間關聯策略方式和關鍵核心特征選擇的方案。特别地,該論文的相關工作可在網絡流量的實時傳輸分析等複雜多變場景下實現了關鍵特征的篩選,以保證下遊任務模型的高效率和高精度。

TKDEIEEE旗下計算機領域數據挖掘方向的頂級期刊,在數據挖掘和知識發現領域享有極高的學術聲譽,也是中國計算機學會推薦的A類期刊。

該研究工作得到了國家自然科學基金項目(項目編号:6227219862276277)、廣東省自然科學基金項目(項目編号:2024A1515010121)、廣東省數據安全與隐私保護重點實驗室項目(項目編号:2023B1212060036)、粵港數據安全與隐私保護聯合實驗室項目(項目編号:2023B1212120007)以及太阳集团app首页博士研究生拔尖創新人才培養項目(項目編号:2023CXB022)的支持

論文鍊接:

https://ieeexplore.ieee.org/abstract/document/10473703 



撰稿:卓勝達

校對:何宇豔

初審:郭信江

終審:夏志華