您现在的位置是:首页 >技术杂谈 >『python爬虫』21. 协程爬取一个视频需要的知识网站首页技术杂谈

『python爬虫』21. 协程爬取一个视频需要的知识

发现你走远了 2024-06-17 11:26:38
简介『python爬虫』21. 协程爬取一个视频需要的知识


欢迎关注 『python爬虫』 专栏,持续更新中
欢迎关注 『python爬虫』 专栏,持续更新中

1. 一般的视频网站播放原理与抓取思路

  • 如果我们要看一部电影几个G的大小,视频网站需要支付几个G的流量费用。
    问题是,如果我们只看了几分钟就不想看了,切走,那么加载了几个G流量的视频网站是不是亏死了?

  • 实际上,视频网站进度条颜色有区别,一般会有一个预加载的进度条,这使得哪怕你突然断网视频也能播放几分钟,视频网站其实是几分钟几分钟的切片加载内容,而不是一次性把整个视频加载给你。

  • 所以我们爬虫时的思路在于找到一个个视频切片,并把他们重新组装在一起。(当然要按照顺序组装)


2. 具体操作

网站肯定有一个记录的文件记录重要信息: (文件可能的格式:M3U8 txt json => 文本)

  1. 视频播放顺序,
  2. 视频存放的路径.
    视频切片格式可能是 ts等格式

想要抓取一个视频:

  1. 找到m3u8 (各种手段)
  2. 通过m3u8下载到ts文件
  3. 可以通过各种手段(不仅是编程手段) 把ts文件合并为一个mp4文件

3. 实现代码(代码已过期,无法使用)

放出代码可能过不了审核···本文只讲述思路


总结

大家喜欢的话,给个?,点个关注!给大家分享更多计算机专业学生的求学之路!

版权声明:

发现你走远了@mzh原创作品,转载必须标注原文链接

Copyright 2023 mzh

Crated:2023-3-1

欢迎关注 『python爬虫』 专栏,持续更新中
欢迎关注 『python爬虫』 专栏,持续更新中
『未完待续』


风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。