嗨,我正在使用下面的python解析器来读取html文件class MyHTMLParser(HTMLParser):
def __init__(self):
HTMLParser.__init__(self)
self.inLink = False
self.dataArray = []
self.countLanguages = 0
self.lasttag = None
self.lastname = None
self.lastvalue = None
def handle_starttag(self, tag, attrs):
self.inLink = False
if tag == 'window':
for name, value in attrs:
if name == 'mode':
#value = 0
#print(value)
self.countLanguages += 1
self.inLink = True
self.lasttag = tag
def handle_endtag(self, tag):
if tag == "window":
self.inlink = False
def handle_data(self, data):
self.data = data
#print(self.data)
print data
if data.strip():
self.inlink = False
#print data
parser = MyHTMLParser()
input_file = open('xmlfile.xml')
feed_data = input_file.read().strip()
feed_data = parser.feed(feed_data)
print(feed_data.data)
input_file.close()
然而,我似乎找不到一种方法来将html解析器返回的数据转换为字符串。在
我基本上是用html解析器修改一个属性,然后我想把数据转换成字符串-你知道怎么做吗?在
我试着添加一个“自我数据,但我似乎无法打印任何返回的数据。有没有办法只打印解析器中保存的所有内容?在