天天看點

html.parser python_HTMLParser python将資料轉換成字元串?

嗨,我正在使用下面的python解析器來讀取html檔案class MyHTMLParser(HTMLParser):

def __init__(self):

HTMLParser.__init__(self)

self.inLink = False

self.dataArray = []

self.countLanguages = 0

self.lasttag = None

self.lastname = None

self.lastvalue = None

def handle_starttag(self, tag, attrs):

self.inLink = False

if tag == 'window':

for name, value in attrs:

if name == 'mode':

#value = 0

#print(value)

self.countLanguages += 1

self.inLink = True

self.lasttag = tag

def handle_endtag(self, tag):

if tag == "window":

self.inlink = False

def handle_data(self, data):

self.data = data

#print(self.data)

print data

if data.strip():

self.inlink = False

#print data

parser = MyHTMLParser()

input_file = open('xmlfile.xml')

feed_data = input_file.read().strip()

feed_data = parser.feed(feed_data)

print(feed_data.data)

input_file.close()

然而,我似乎找不到一種方法來将html解析器傳回的資料轉換為字元串。在

我基本上是用html解析器修改一個屬性,然後我想把資料轉換成字元串-你知道怎麼做嗎?在

我試着添加一個“自我資料,但我似乎無法列印任何傳回的資料。有沒有辦法隻列印解析器中儲存的所有内容?在