内容简介:正如同微博中的#标记一样,twitter中有很多#hashtag,那么出现次数越多的hashtag的内容自然也正是人们大量讨论的话题了。 而所需处理的twitter数据庞大,并且不断高速增加,自然不能以一般的方法进行分析计算。因为考虑采用hadoop。 首先需应用mapreduce分解该计算方法使得能用大量node同时独立计算。twitter采用Cassandra存储数据...
用户评论