关于向美国公司出售TikTok的新闻很多,由于之后可能未知原因关闭服务,因此收集TikTok视频数据的问题变得更加实际。
简而言之,TikTok现在在现实世界中具有相当大的影响力,国外大部分用户每天花费近一个小时在平台上观看视频,我们要了解TikTok用户每天受喜爱视频,就需要获取相应的数据。
GitHub上有一个TikTokApi,它非官方Api,是个人开发者Python库TikTokApi,TikTokApi主要针对收集TikTok数据的Api。
TikTokApi主要提供功能有:
1. 收集用户发布的视频
2. 收集用户喜欢的视频
3. 收集由包括hashtag视频
4. 收集热门视频
5. 收集用户列表
在开始之前,需要说明两个问题,第一,可以到github下载TikTok-Api库。第二,如果大规模或许数据,我们都知道当前ip地址会被禁用,所以可以使用代理避免这个问题。
为了方便获取数据请先注册TikTok账号。
1. 收集用户发布的视频
要从TikTok账户中抓取视频,以下是在Python中执行的操作:
user_videos对象是100个视频词典的列表,并且print(user_videos)输出将类似于以下内容:
2. 收集用户喜欢的视频
3. 收集由包括hashtag视频
我们可以通过标签来捕捉视频:比如是 kardashian
4. 收集热门视频
需要收集热门视频进行内容分析,API使事情变得非常简单:
5. 通过帐户收集用户列表
TikTok提供了大量有用的数据,可以将其转换为机器学习数据集或用于手动分析。此外,媒体研究还可以了解动态趋势,以创建最受欢迎的帐户。