包含关键词“生物信息学”的推文示例,最近我们被客户要求撰写关于推特twitter网络的研究报告,包括一些图形和统计输出。

相关视频:复杂网络分析CNA简介与R语言对婚礼数据聚类(社区检测)和可视化|数据分享

第1步: 加载所需的软件包

# 加载所需的软件包


library(igraph)

第2步: 收集关于“生物信息学”的推文

# 包含“生物信息学”的英语推文
dm_tweets = searchTwitter("bioinformatics", n=500,)

# 得到文本

dm_txt = sapply(dm_tweets, function(x) x$getText())

第3步:识别转发

# 查找转发的正则表达式

grep("(RT|via)((?:\\b\\W*@\\w+)+)", dm_tweets,


# 哪些推文是转发推文

rt_patterns = grep("(RT|via)((?:\\b