您现在的位置是:首页 >技术杂谈 >『python爬虫』21. 协程爬取一个视频需要的知识网站首页技术杂谈
『python爬虫』21. 协程爬取一个视频需要的知识
简介『python爬虫』21. 协程爬取一个视频需要的知识
欢迎关注 『python爬虫』 专栏,持续更新中
欢迎关注 『python爬虫』 专栏,持续更新中
1. 一般的视频网站播放原理与抓取思路
-
如果我们要看一部电影几个G的大小,视频网站需要支付几个G的流量费用。
问题是,如果我们只看了几分钟就不想看了,切走,那么加载了几个G流量的视频网站是不是亏死了? -
实际上,视频网站进度条颜色有区别,一般会有一个预加载的进度条,这使得哪怕你突然断网视频也能播放几分钟,视频网站其实是几分钟几分钟的切片加载内容,而不是一次性把整个视频加载给你。
-
所以我们爬虫时的思路在于找到一个个视频切片,并把他们重新组装在一起。(当然要按照顺序组装)
2. 具体操作
网站肯定有一个记录的文件记录重要信息: (文件可能的格式:M3U8 txt json => 文本)
- 视频播放顺序,
- 视频存放的路径.
视频切片格式可能是 ts等格式
想要抓取一个视频:
- 找到m3u8 (各种手段)
- 通过m3u8下载到ts文件
- 可以通过各种手段(不仅是编程手段) 把ts文件合并为一个mp4文件
3. 实现代码(代码已过期,无法使用)
放出代码可能过不了审核···本文只讲述思路
总结
大家喜欢的话,给个?,点个关注!给大家分享更多计算机专业学生的求学之路!
版权声明:
发现你走远了@mzh原创作品,转载必须标注原文链接
Copyright 2023 mzh
Crated:2023-3-1
欢迎关注 『python爬虫』 专栏,持续更新中
欢迎关注 『python爬虫』 专栏,持续更新中
『未完待续』
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。