天天看點

2.初始爬蟲之HTML基礎知識這個書苑不太冷

1、HTML 是什麼

HTML(Hyper Text Markup Language)是用來描述網頁的一種語言,也叫超文本标記語言 。

1.1、檢視網頁的 HTML 代碼

①、顯示網頁源代碼在網頁任意地方點選滑鼠右鍵,然後點選“顯示網頁源代碼”。(Windows系統的電腦還可以使用快捷鍵ctrl+u來檢視網頁源代碼)

②、檢查windows:在網頁的空白處點選右鍵,然後選擇“檢查”(快捷方式是ctrl+shift+i);mac:在網頁的空白處點選右鍵,然後選擇“檢查”(快捷鍵 command + option + I(大寫 I ))

2、HTML 的組成

2.1、标簽和元素

(1)标簽:夾在尖括号<>中間的字母,标簽通常是成對出現的:前面的是【開始标簽】,比如;後面的是【結束标簽】,如;(2)元素:開始标簽+結束标簽+中間的所有内容組成。

注意:HTML标簽是可以嵌套标簽的,而且可以多層嵌套;這就像是在電腦中,一個硬碟可以包含數個檔案夾,檔案夾中還可以嵌套檔案夾。

一級标題

二級标題

段落文本 超連結文本 其他元素或文本,塊 2.2、網頁頭和網頁體 HTML文檔的最外層标簽一定是,裡面嵌套着元素與元素。元素代表了【網頁頭】,元素代表了【網頁體】,這是最基本的網頁結構。(1)【網頁頭】的内容不會被直接呈現在浏覽器裡的網頁正文中;(2)【網頁體】的内容是會直接顯示在網頁正文中的。

<html>
	<head>
	網頁頭的具體内容
	</head>
	<body>
	網頁體的具體内容
	</body>

</html>
           

2.3、屬性

注意:HTML的屬性和Python中的屬性不是一個東西

①、h1 标簽及其對應的屬性 style

這個書苑不太冷

②、a 标簽及其對應的屬性 href 我是一個連結,點我試試

class 為html元素定義一個或多個類名(classname)

id 定義元素的唯一id

href 用來定義連結

style 規定元素的行内樣式(inline style)