天天看點

計算機導論學習第一課筆記

第一部分、字元串學習(使用PYTHON)

1、字元串+數字的情況

print 'apple'+'!'*3
           

顯示内容:apple!!!

2、索引字元串

#顯示内容:t
print 'test'[0]

#顯示内容:末尾的‘t’
print 'test'[-1]
           

3、選擇字元串的子序列

#顯示内容:est
print 'test'[1:]

#不顯示任何内容
print 'test'[1:1]

#顯示内容:tes
print 'test'[:3]
           
#顯示内容:test,與print 'test'結果相同
print 'test'[:]
           

4、查找字元串中的字元串

#顯示内容:5
#find函數傳回'for'所在位置号5
text = 'test for you'
print text.find('for')

#顯示内容:14(第二個“for”所在位置号)
text2 = 'test for you, for me and for us!'
print text2.find('for',6)
           

第二部分、網頁的簡單抓取

1、網頁超連結的特征

<a href="http://XXX.XXXX....." target="_blank" rel="external nofollow" >
           

2、利用字元串的知識從網頁 <a href="" target="_blank" rel="external nofollow" >标簽中提取超連結資訊

page =('<div id="top_bin"><div id="top_content" class="width60">'
'<div class="float-left"><a href="http://test.com" target="_blank" rel="external nofollow" >')
start_link = page.find('<a href=')
start_quote = page.find('"',start_link)
end_quote = page.find('"',start_quote + 1)
url = page[start_quote+1:end_quote]
print url
           

顯示url内容為:http://test.com。