您现在的位置是：首页 >技术杂谈 >『python爬虫』21. 协程爬取一个视频需要的知识网站首页 技术杂谈

『python爬虫』21. 协程爬取一个视频需要的知识

发现你走远了 2024-06-17 11:26:38

简介『python爬虫』21. 协程爬取一个视频需要的知识

目录

欢迎关注『python爬虫』专栏，持续更新中
欢迎关注『python爬虫』专栏，持续更新中

1. 一般的视频网站播放原理与抓取思路

如果我们要看一部电影几个G的大小，视频网站需要支付几个G的流量费用。
问题是，如果我们只看了几分钟就不想看了，切走，那么加载了几个G流量的视频网站是不是亏死了？
实际上，视频网站进度条颜色有区别，一般会有一个预加载的进度条，这使得哪怕你突然断网视频也能播放几分钟，视频网站其实是几分钟几分钟的切片加载内容，而不是一次性把整个视频加载给你。
所以我们爬虫时的思路在于找到一个个视频切片，并把他们重新组装在一起。（当然要按照顺序组装）

2. 具体操作

网站肯定有一个记录的文件记录重要信息: （文件可能的格式：M3U8 txt json => 文本）

视频播放顺序,
视频存放的路径.
视频切片格式可能是 ts等格式

想要抓取一个视频:

找到m3u8 (各种手段)
通过m3u8下载到ts文件
可以通过各种手段(不仅是编程手段) 把ts文件合并为一个mp4文件

3. 实现代码（代码已过期，无法使用）

放出代码可能过不了审核···本文只讲述思路

总结

大家喜欢的话，给个?，点个关注！给大家分享更多计算机专业学生的求学之路！

版权声明：

发现你走远了@mzh原创作品，转载必须标注原文链接

Copyright 2023 mzh

Crated：2023-3-1

欢迎关注『python爬虫』专栏，持续更新中
欢迎关注『python爬虫』专栏，持续更新中
『未完待续』

风语者！平时喜欢研究各种技术，目前在从事后端开发工作，热爱生活、热爱工作。

上一篇
Python开发之实现SG滤波

下一篇
代码训练营第6天

站长推荐

QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。
QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。...
U8W/U8W-Mini使用与常见问题解决
U8W/U8W-Mini使用与常见问题解决
stm32使用HAL库配置串口中断收发数据（保姆级教程）
stm32使用HAL库配置串口中断收发数据（保姆级教程）
分享几个国内免费的ChatGPT镜像网址(亲测有效)
分享几个国内免费的ChatGPT镜像网址(亲测有效)
Allegro16.6差分等长设置及走线总结
Allegro16.6差分等长设置及走线总结