成果介紹
本發(fā)明公開了一種重疊社區(qū)集合質量度量指標計算方法、裝置,通過獲取社區(qū)集合X、Y中各社區(qū)中的元素得到頂點集合V,分別遍歷社區(qū)集合X、Y,記錄各頂點vi在社區(qū)集合X、Y中全部所屬社區(qū)的標簽,得到標簽集合ListXid[i]、ListYid[i],并構建各頂點的社區(qū)標簽笛卡爾乘積數(shù)據(jù)集DicList[i],最后得到社區(qū)標簽數(shù)據(jù)集合ListXid, 之后基于貪心算法和負載均衡,將ListXid集合中的元素切分并分發(fā)至各個進程,由各進程運算處理得到計算各指標的所需數(shù)值,最后合并各指標相關數(shù)值至單一進程進行運算,得到關于社區(qū)集合X、Y的度量指標。該方法采用并行分布式計算框架MPICH并利用計數(shù)相同社區(qū)標簽對來加速社區(qū)集合質量度量指標的運算速度,同時通過該重疊社區(qū)集合質量度量指標計算方法可同時計算出質量度量指標,適用于大規(guī)模重疊社區(qū)集合質量度量指標的計算。