关于向美国公司出售TikTok的新闻很多,由于之后可能未知原因关闭服务,因此收集TikTok视频数据的问题变得更加实际。

简而言之,TikTok现在在现实世界中具有相当大的影响力,国外大部分用户每天花费近一个小时在平台上观看视频,我们要了解TikTok用户每天受喜爱视频,就需要获取相应的数据。

GitHub上有一个TikTokApi,它非官方Api,是个人开发者Python库TikTokApi,TikTokApi主要针对收集TikTok数据的Api。

TikTokApi主要提供功能有:

1. 收集用户发布的视频

2. 收集用户喜欢的视频

3. 收集由包括hashtag视频

4. 收集热门视频

5. 收集用户列表

在开始之前,需要说明两个问题,第一,可以到github下载TikTok-Api库。第二,如果大规模或许数据,我们都知道当前ip地址会被禁用,所以可以使用代理避免这个问题。

为了方便获取数据请先注册TikTok账号。

1. 收集用户发布的视频

要从TikTok账户中抓取视频,以下是在Python中执行的操作:


user_videos对象是100个视频词典的列表,并且print(user_videos)输出将类似于以下内容:


2. 收集用户喜欢的视频


3. 收集由包括hashtag视频

我们可以通过标签来捕捉视频:比如是 kardashian


4. 收集热门视频

需要收集热门视频进行内容分析,API使事情变得非常简单:


5. 通过帐户收集用户列表


TikTok提供了大量有用的数据,可以将其转换为机器学习数据集或用于手动分析。此外,媒体研究还可以了解动态趋势,以创建最受欢迎的帐户。