python bs4库
# 介绍
一个处理 html 的库, 可以方便地获取 tag 的相关信息, 如 content,
# 读取文件
|
|
# NavigableString
是 BeautifulSoup 各种方法通常的返回对象, 比如说下面的 find(), find_all()
- .name 最外的tag名, 如 span
- .string 这个tag 包含的内容, 一般是确定在嵌套最里才用
# 转 str
|
|
# 基础功能
# find()
|
|
# find_all()
与 find() 相比, 返回一个 list, 里面是所有符合的匹配项