中文题名: | 微博用户转发行为预测模型的构建 |
姓名: | |
保密级别: | 公开 |
学科代码: | 040104 |
学科专业: | |
学生类型: | 学士 |
学位: | 理学学士 |
学位年度: | 2014 |
学校: | 北京师范大学 |
校区: | |
学院: | |
第一导师姓名: | |
第一导师单位: | |
第二导师姓名: | |
提交日期: | 2014-06-11 |
答辩日期: | 2014-06-11 |
中文关键词: | |
中文摘要: |
随着Web2.0概念的持续升温,微博在现代社会变得越来越重要。微博用户通过转发操作,使得微博平台上的信息形成了指数级的增长和流动。本研究关注微博用户的转发行为,通过分析影响微博用户的转发行为的特征因素,构建预测模型,以求对微博用户的转发行为进行预测。
首先本研究分析了影响微博用户转发行为的特征因素,包括微博发布者特征、微博文本特征、微博接受者特征、相互关系特征等4个一级维度,39个二级维度。针对所需数据,本研究利用新浪微博平台进行随机抽取,并对所抽取的样本进行预处理,将所有特征全部转换为数字表征的形式。数据预处理阶段包括采用贝叶斯分类方法对微博文本进行分类,以及利用“知网”提供的WordSimilarity工具,计算词语之间的相似度,并将其作为相似度相关特征的数字表征形式。针对预处理之后的数据,构建每条数据样本对应的特征向量,利用SVM支持向量机构建针对微博用户转发行为的基本预测模型。由于每个特征对用户转发行为的影响可能存在不同,所以利用信息增益算法,计算每个特征的信息增益值,对不同特征赋予不同的权重,对每条数据样本对应的特征向量进行加权处理,并再次利用SVM支持向量机构建优化预测模型。对于优化预测模型的评估,利用信息检索的标准指标对其进行评估。实验证明,优化预测模型的查准率达到11.87%,召回率达到58.67%,精确率达到82.19%,错误率达到17.81%,F-measure值达19.75%。
﹀
|
优秀论文: | |
馆藏号: | 本040104/1437 |
开放日期: | 2014-06-11 |