- 无标题文档
查看论文信息

中文题名:

 微博用户转发行为预测模型的构建    

姓名:

 林成龙    

保密级别:

 公开    

学科代码:

 040104    

学科专业:

 教育技术学    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2014    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 教育技术学院    

第一导师姓名:

 李艳燕    

第一导师单位:

 北京师范大学教育技术学院    

第二导师姓名:

 王铟    

提交日期:

 2014-06-11    

答辩日期:

 2014-06-11    

中文关键词:

 微博转发 ; 预测模型 ; 支持向量机 ; 信息增益 ; 文本分类 ; 词语相似度    

中文摘要:
随着Web2.0概念的持续升温,微博在现代社会变得越来越重要。微博用户通过转发操作,使得微博平台上的信息形成了指数级的增长和流动。本研究关注微博用户的转发行为,通过分析影响微博用户的转发行为的特征因素,构建预测模型,以求对微博用户的转发行为进行预测。 首先本研究分析了影响微博用户转发行为的特征因素,包括微博发布者特征、微博文本特征、微博接受者特征、相互关系特征等4个一级维度,39个二级维度。针对所需数据,本研究利用新浪微博平台进行随机抽取,并对所抽取的样本进行预处理,将所有特征全部转换为数字表征的形式。数据预处理阶段包括采用贝叶斯分类方法对微博文本进行分类,以及利用“知网”提供的WordSimilarity工具,计算词语之间的相似度,并将其作为相似度相关特征的数字表征形式。针对预处理之后的数据,构建每条数据样本对应的特征向量,利用SVM支持向量机构建针对微博用户转发行为的基本预测模型。由于每个特征对用户转发行为的影响可能存在不同,所以利用信息增益算法,计算每个特征的信息增益值,对不同特征赋予不同的权重,对每条数据样本对应的特征向量进行加权处理,并再次利用SVM支持向量机构建优化预测模型。对于优化预测模型的评估,利用信息检索的标准指标对其进行评估。实验证明,优化预测模型的查准率达到11.87%,召回率达到58.67%,精确率达到82.19%,错误率达到17.81%,F-measure值达19.75%。
优秀论文:

 北京师范大学优秀本科论文    

馆藏号:

 本040104/1437    

开放日期:

 2014-06-11    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式