聚类分析的网络论坛社团探测算法探究

聚类分析的网络论坛社团探测算法探究

ID:24285088

大小:50.00 KB

页数:4页

时间:2018-11-13

聚类分析的网络论坛社团探测算法探究_第1页
聚类分析的网络论坛社团探测算法探究_第2页
聚类分析的网络论坛社团探测算法探究_第3页
聚类分析的网络论坛社团探测算法探究_第4页
资源描述:

《聚类分析的网络论坛社团探测算法探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、聚类分析的网络论坛社团探测算法探究 1引言  X络论坛(BBS)由于具有及时性、交互性、开放性等特点,因而也是X络舆论产生、形成和发展的主要场所,整个X络论坛的参与者呈现一种特性社团结构,即整个X络由若干个社团构成,每个社团内部的节点之间的连接相对紧密,各社团之间的连接相对稀疏.研究X络论坛的社团结构,对了解BBS中X络舆论的传播特点具有现实意义.  X络论坛中成员根据兴趣或背景而形成真实的社会团体,X络中的这些社区有助于更加有效地理解其成员结构和分析X络舆论传播特性.目前对X络社团结构研究主要有两类主要的方法社会学中的分

2、级聚类和计算机科学中的图形分割方法.分级聚类是探测X络社团的传统方法,基于各个节点间连接的相似性或强度将X络划分成子群,并根据划分时是往X络中添加还是移除边可分为凝聚算法和分裂算法,Girvan和Nean提出基于边介数的分裂算法(简称GN算法);KemighanLin算法和谱平分法则是较为出名的图形分割算法,其中KernighanLin算法根据使社团内部及社团间的边最优化的原则对原始的X络进行分类,谱平分法是根据X络图的Laplace矩阵进行向特征向量空间的谱映射.该文算法是谱平分法的一种改进算法,将模块度函数与聚类分析算

3、法结合进行社团结构探测.  2试验及结果  海峡四川钓友联谊会是海峡钓鱼X的一个子板块,其中参与者大部分为四川本地钓鱼爱好者,论坛成员具有共同的兴趣爱好.该板块为四川钓鱼爱好者的学习与交流提供了一条新途径.针对相关主题,论坛成员可以提出问题、发表各自的观点和看法,相互交流,相互帮助.  实际数据处理时,根据对己掌握的id对应关系,对部分id进行了特别处理,例如将清凉油和151这2个id合并处理,将被草压死的骆驼与骆驼,黑武器与黑版视为同一个id.  2.1连接权矩阵的生成  该文从6000余名在该论坛中发言的成员中筛选出满

4、足各种阈值条件的成员1436人,并生成对应的连接权矩阵.  2.2对比试验  为验证算法的有效性,该文将该论坛数据分别运用K-Means算法,N算法以及该文的基于模拟退火的社团探测算法.其中,K-Means算法是常见的聚类算法,是基于距离聚类中心最近法则为标准对个体进行分类的;而N算法则采用竞争型神经X络模型,进行无监督学习的分类.这里要注意的是,这里所有的算法程序都用matlab编写.  这里运行次数为得到最优解的平均运行次数,时间为平均运行时间.  表2给出了应用C-basedSA算法模块度在0.36以上的聚类结果,k

5、=3,4,5时模块度较高.  图1给出了k=5,降温速率为0.997时的探测算法的迭代过程,迭代到2300次左右就己经求出了最优解.  2.3结果分析  通过对实际数据运行3种不同的社团探测算法,结果表明:K-Means算法速度较快,但受初始化条件影响较大,可靠性也比其他两种算法差,X络规模扩大对算法性能影响较大;N算法对初始化条件依赖程度较K-Means算法较低,但运算速度较慢,并且对数据预处理需要花较长的时间;三种算法中,C-basedSA算法不依赖初始化条件的选取,直接使用模块度函数作为目标函数对X络进行社团探测,能

6、保证达到全局最优解,可靠性较其他两种算法要高,该算法的复杂度依赖于系统降温速率的设置,其缺点是运行时间较长.  3结束语  提出了针对X络论坛的社交X络的构建方法,将组合优化的方法与聚类分析的思想相互结合并应用到X络论坛社团结构的求取上,并提出了用模拟退火算法来求解,解决了实际工作实践中遇到的问题.试验结果验证了算法的准确性,模拟退火算法与聚类分析的思想能有效的结合起来,对论坛社团结构进行分析有较大的实用价值.  试验结果同时说明,基于兴趣的X络论坛中的社交X络社团结构不太明显,值得注意的是,该文使用的是非重叠性的社团探测

7、算法,考虑到实际X络中,个体往往具有多群体特性,因此,改进社团结构的定义以及在此基础上探索新的社团划分方法是一个值得研究的方向.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。