您现在的位置是:首页 >技术教程 >Python 与数据科学实验(Exp10)网站首页技术教程

Python 与数据科学实验(Exp10)

秋田刀鱼 2024-06-21 12:01:03
简介Python 与数据科学实验(Exp10)

实验10 正则表达式与网络爬虫

1. 实验内容与目标

本次实验旨在了解正则表达式相关基本概念以及在网络爬虫中的应用,掌握Python正则表达式模块re的常见用法,初步学会运用基本的爬虫模块urllib,以及第三方库requests和Beautiful Soup,进行web数据的自动抓取实践。需掌握的相关知识点主要包括:

1) 正则表达式:

特殊字符的用法

2) re模块:

(a)正则表达式对象、匹配对象等概念

(b)核心函数与方法:compile、findall、finditer、match、search、group、sub、split

风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。