包含关键词“生物信息学”的推文示例,最近我们被客户要求撰写关于推特twitter网络的研究报告,包括一些图形和统计输出。
相关视频:复杂网络分析CNA简介与R语言对婚礼数据聚类(社区检测)和可视化|数据分享
第1步: 加载所需的软件包
# 加载所需的软件包
library(igraph)
第2步: 收集关于“生物信息学”的推文
# 包含“生物信息学”的英语推文
dm_tweets = searchTwitter("bioinformatics", n=500,)
# 得到文本
dm_txt = sapply(dm_tweets, function(x) x$getText())
第3步:识别转发
# 查找转发的正则表达式
grep("(RT|via)((?:\\b\\W*@\\w+)+)", dm_tweets,
# 哪些推文是转发推文
rt_patterns = grep("(RT|via)((?:\\b