嗨,我正在使用下面的python解析器來讀取html檔案class MyHTMLParser(HTMLParser):
def __init__(self):
HTMLParser.__init__(self)
self.inLink = False
self.dataArray = []
self.countLanguages = 0
self.lasttag = None
self.lastname = None
self.lastvalue = None
def handle_starttag(self, tag, attrs):
self.inLink = False
if tag == 'window':
for name, value in attrs:
if name == 'mode':
#value = 0
#print(value)
self.countLanguages += 1
self.inLink = True
self.lasttag = tag
def handle_endtag(self, tag):
if tag == "window":
self.inlink = False
def handle_data(self, data):
self.data = data
#print(self.data)
print data
if data.strip():
self.inlink = False
#print data
parser = MyHTMLParser()
input_file = open('xmlfile.xml')
feed_data = input_file.read().strip()
feed_data = parser.feed(feed_data)
print(feed_data.data)
input_file.close()
然而,我似乎找不到一種方法來将html解析器傳回的資料轉換為字元串。在
我基本上是用html解析器修改一個屬性,然後我想把資料轉換成字元串-你知道怎麼做嗎?在
我試着添加一個“自我資料,但我似乎無法列印任何傳回的資料。有沒有辦法隻列印解析器中儲存的所有内容?在