-
安装bs4模块
pip install bs4
-
安装lxml模块(数据解析器)
pip install lxml
-
导入BeautifulSoup类
from bs4 import BeautifulSoup
-
实例化BeautifulSoup对象
-
将本地的html文档中的数据加载到该对象中
将文件对象和解析器lxml作为构造参数实例化对象
-
将互联网上获取的页面源码添加到该对象中
将爬取到的响应数据和解析器作为构造参数实例化对象
-
-
soup对象的属性和方法