内容简介:计划 第一提取程序照常提取推文。 推文将被清理并转储到MongoDB中。 整天进行汇总。 根据汇总,找到排名前100位的实体,并将相应的推文汇总为一个集合。 在将其转储到集合中之前,需要对它们进行情感分析。 使用100个集合中的每个集合作为单独的文档,执行LDA。 如果100个文档太少,我们可以将大文档拆分为较小的文档。 这些推文会单独进行迭代以找到其所属的主题。 ...
用户评论