1,引入
from bs4 import BeautifulSoup # 导入bs4库
2,创建解析对象
soup = BeautifulSoup(self.res_content, "html.parser") # html.parser是解析器,也可是lxml
3,获取对象中的标签对象
soup.table.tbody 直接通过.标签名来获取对象
find_all()获取所有子对象,结果是个列表
all_tds[6].text标签对象.text是获取节点下的文本内容,注意不包括子节点Tag标签本身。
for tr in soup.table.tbody:
all_tds = tr.find_all("td")
medial_title = all_tds[6].text
if any(key_w in title_ for key_w in key_words):
req = all_tds[0].text
ad_date = all_tds[1].text
ad_owner = all_tds[2].text
showid = all_tds[4].text
ad_type_ = all_tds[5].text
ad_type = TdierMap(all_tds[5].text).map_tier_name()
ad_link = all_tds[8].text