一、背景介绍
滇西小哥是一位来自中国云南省的视频博主,他在YouTube上拥有超过1000万的订阅者和上亿的观看量。他的视频内容主要涵盖中国文化、美食、旅行、音乐和艺术等方面。滇西小哥通过分享自己的文化体验和独特的观点,成功地将中国文化传递到了国际社会并获得了广泛的关注。通过他的视频,许多外国人可以了解中国的文化遗产和传统习俗。滇西小哥讲解的内容既有很具代表性的中国传统文化,如风水、中医、茶艺等,也包括现代时尚的文化,如网络流行语等。通过他的视频,外国观众可以更好地了解当代中国文化,并更好地理解中国人的思维方式和价值观。并且在视频分享中传递出中国人温馨、友善、好客的传统美德。
二、爬取目标
爬取目标:滇西小哥频道TOP10热门视频的TOP2000热门评论(共计2w条)
每个视频下方的TOP2000评论,同样按热门排序。比如TOP1视频的评论如下:
(资料图片仅供参考)
也就是滇西小哥频道的10个视频,每个视频2000条评论,共2w条评论,爬取完成。(10*2000=2w)
三、结果展示
先看下我整理的滇西小哥TOP10热门视频列表:
下面看爬取到的评论数据。
共10个评论数据文件,每个文件对应一个视频,每个文件内含2000条评论。
(文件名并不是乱码,而是YouTube视频id号哦)
随便打开一个文件,比如TOP1热门视频的评论,看下内容:
包含字段:评论id、评论内容、评论时间、评论作者、作者频道、点赞数。
四、演示视频
演示视频:
五、获取方式
爱学习的小伙伴,想获取完整数据文件,移步我的微信公众号"老男孩的平凡之路",后台回复关键字"滇西小哥评论",即可获取完整数据!
我是@马哥python说 ,持续分享python干货!
关键词: