以下是一份语言模型构建的Python 代码示例,可以为大家提供参考。
import requests
import requests
import requests.exceptions
import json
import json
from bs4 import BeautifulSoup
# 导入urllib.request
from bs4 import BeautifulSoup
# 获取网页源代码
url = '网页链接'
# 将网页源代码解析为字符串
with open("./example.html", "rb") as f:
html = f.read()
# 解析HTML
soup = BeautifulSoup(html, 'html.parser')
# 提取<div>标签中的所有a标签
a_tags = soup.find_all('a')
# 将每个链接提取出来
for a in a_tags:
print(a.text)
# 使用BeautifulSoup解析HTML
# 解析网页中的所有链接
soup.find_all('a')
# 解析文本内容
a_text = 'Hello, World!'
# 打印每个链接的href
for a in a_tags:
print(a.get('href'))
# 将链接转换为字符串
for a in a_tags:
print(a.get('href'))
# 将所有链接合并为一个列表
links = [a.text for a in a_tags]
# 显示所有链接
for link in links:
print(link)