IR
一种社交网络中有影响力用户的识别方法
卢鹏丽; 董晨; 蔚京娟; 栾瑞; 陈炜; 张芝铷
2020-09-01
专利权人兰州理工大学
公开日期2020-09-01
授权国家中国
专利类型发明申请
摘要本发明公开了一种基于社交网络的有影响力用户的识别方法,包括步骤:数据标准化,将选取的社交网络数据集抽象成为社交网络图并计算出邻接矩阵;权值计算,利用离散程度以及累积分布函数将各节点的拓扑结构转化为数值用于计算;节点排序,按照节点的权值大小对各节点进行排序;动态攻击,按百分比依次删除排序后的节点并计算每次删除前后的最大连通子图所占比例;精确性分析,通过计算各节点的权值与节点真实传播能力之间的关系来判定节点的重要性。本发明不再仅仅考虑单个节点的性能,而是将网络的拓扑结构包含在内,从网络全局对节点的重要性进行分析,丰富了重要节点的识别手段,提高了重要节点识别的精度。
申请日期2020-04-30
优先权日2020-04-30
专利状态撤回-视为撤回
申请号CN202010361263.0
公开(公告)号CN111612641A
IPC 分类号G06Q50/00
专利代理人栾洋洋
代理机构广州蓝晟专利代理事务所(普通合伙)
CPC分类号G06Q50/01
权利要求1.一种社交网络中有影响力用户的识别方法,其特征在于,包括: 步骤1,数据标准化,将选取的社交网络数据集抽象成为社交网络图并计算出邻接矩阵; 步骤2,权值计算,利用离散程度以及累积分布函数将各节点的拓扑结构转化为数值用于计算各节点的EMH值,包括步骤 S21:在标准化处理过的数据集中找出每个节点的邻居节点,并计算节点的离散程度,离散程度的计算公式为:其中,节点的H指数是指节点的邻居节点中至少有H个节点的度大于等于H,H_max是邻居节点中最大的H指数值,节点v的邻居节点中有一个节点的H指数值为j,则将αj(v)记为1,否则记为0; S22:利用网络中每一个节点的度以及计算好的离散程度,根据公式计算各个节点的改进后的H指数(IH),其中,|Dv|即节点v的度,α1和α2表示[0,1]区间内的随机数,A1表示节点v的邻居节点中离散程度大于v的节点个数,A2表示节点v的邻居节点中离散程度等于v的节点个数; S23:通过计算网络中各节点的IH值,将节点v的邻居节点按照IH值的大小排序,排序后序列为S(v)={c1(v),c2(v),...,cm(v)},其中,c1(v)表示的是节点v的邻居节点中最大的IH值,cm(v)表示的是节点v的邻居节点中最小的IH值; S24:将排序后的结果用到累积分布函数中,累积分布函数的公式为其中,s和r表示的是[0,1]区间内的随机数,Sj(v)表示的是在序列S(v)中的第j个位置的数值,将节点v的邻居节点的MC进行求和,求和公式为其中,Nv表示的是节点v的邻居节点集合,vj是邻居节点集Nv中的一个元素,MC(vj)表示的是节点vj的MC值; 步骤3,将步骤2中求得的网络中各节点的EMH值进行排序,排序后的结果用EMH序列R={r1,r2,...,rm}表示,其中,r1表示的是网络中EMH值最大节点的数值,rm表示的是网络中EMH值最小节点的数值; 步骤4,动态攻击,包括步骤 S41:删除步骤3中计算出的序列R中排名靠前的N个的节点,计算删除节点后网络中最大连通子图所占比例; S42:重新计算步骤S41中删除节点后网络中各节点的EMH值并进行正向排序,排序后的结果用序列R1={r11,r21,...,rm1}表示,删除R1中排名靠前的N个的节点并计算删除节点后网络中最大连通子图所占比例; S43:重复步骤S41和S42,直至网络中的所有节点都为孤立节点,并将每次删除节点后最大连通子图所占比例的数值用序列S={s1,s2,...,sn}表示 S44:将步骤S43中得到的序列S与现有方法所得的最大连通子图占比序列进行比较,在同一时间点的数值越小,则代表所删除的节点越重要,从而找到网络中重要程度高的节点集; 步骤5,精确性分析,将步骤3中计算出的EMH序列与通过SIR模型求得的各节点的真实传播能力序列进行对比,经过对比得到的Kendell相关系数越大,则代表EMH序列与真实数据集之间越接近,从而找到步骤4中所述重要程度高的节点集中社交网络中有影响力的用户。 2.如权利要求1所述的社交网络中有影响力用户的识别方法,其特征在于,步骤1包括:将社交网络中的用户记为节点,将社交网络中用户间的关系记为节点间的连边,节点及其连边关系用邻接矩阵A=(aij)n×n表示,其中,n表示网络中用户的数量,aij表示网络中任意两个用户间的关系。 3.如权利要求1所述的社交网络中有影响力用户的识别方法,其特征在于,步骤S41所述删除序列R中排名靠前的N个的节点,N=20。
引用专利CN107357886A;CN107945036A;CN109034562A;CN109087009A;US10218579B1
被引用专利数量6
简单法律状态失效
文献类型专利
条目标识符https://ir.lut.edu.cn/handle/2XXMBERH/107579
专题兰州理工大学
推荐引用方式
GB/T 7714
卢鹏丽,董晨,蔚京娟,等. 一种社交网络中有影响力用户的识别方法[P]. 2020-09-01.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[卢鹏丽]的文章
[董晨]的文章
[蔚京娟]的文章
百度学术
百度学术中相似的文章
[卢鹏丽]的文章
[董晨]的文章
[蔚京娟]的文章
必应学术
必应学术中相似的文章
[卢鹏丽]的文章
[董晨]的文章
[蔚京娟]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。