為什麼文章要添加内鍊?
1.有利于讀者
我寫内鍊文章的最初動機是讓讀者在我的部落格獲得更好的閱讀體驗,并獲得更多的價值。如果我的讀者通路了我的一篇文章,發現不僅僅回答他需要的答案,還提供了更多相關内容的資訊,讓他們能在更多的相關主題去擴充閱讀,他們遲早會喜歡并滿意我的部落格。讓讀者滿意就是我們的目标,讀者他們滿意了,通常就會再次回訪(這讓你的部落格變得有”粘性”)并和他們的朋友分享。
2.搜尋引擎優化(SEO)
另外一個在你的部落格互相連結文章的重要原因就是,搜尋引擎在檢視部落格中連結的時候,既能找到内容,又能有利于建立部落格索引和提高部落格内容的排名。從其他外部部落格建立的連結價值最高,能夠提高你在搜尋引擎的排名,内鍊雖然效果沒這麼好,但是也是對排名有幫助的。
3.提升頁面浏覽量
在文章中增加連結能夠提高讀者通路其他頁面内容的機會,這帶來許多好處,首先它可以幫助您獲得更多的通路者,如果你正在運作某種 CPM(按通路人次收費)廣告,這是非常受益的。其次大量内鍊給你的部落格浏覽者創造了一個部落格内容豐富的印象。我發現,當有人在你的部落格上看到一個以上的頁面時,他們更容易記住它,訂閱它,評論它,并成為一個經常和忠實的讀者。
而這三個好處看起來顯得作用不明顯,但是當你擁有大量内容的時候,它所能帶來的好處就是無法估量的。是以建議你從部落格建立的時候就開始建構内鍊到站内的其他文章,慢慢地這些内鍊積累下來的好處将會産生非常明顯的好處。
當然還有更多好處,請自行百度知,說着說着有點跑偏主題了,我們主要說用C#怎麼實作此功能,話不多說,上幹貨!!
第一種辦法:(string src指文本字元, IList keys 指要比對的關鍵詞庫集合)
{
Regex reg = new Regex(@"(?i)(?:^|(?<!<a\b(?>[^<>]*))>)(?>[^<>]*)(?:<|$)");
int length = 0;
string temp = string.Empty;
return reg.Replace(src, delegate (Match m)
{
temp = m.Value;
length = temp.Length;
for (int i = 0; i < keys.Count; i++)
{
string keyWordName = Regex.Escape(keys[i].KeyName);
string keyWordUrl = Regex.Escape(keys[i].PCUrl);
temp = Regex.Replace(temp, @"(?is)^((?:(?:(?!" + keyWordName + @"|</?a\b).)*<a\b(?:(?!</?a\b).)*</a>)*(?:(?!" + keyWordName +
@"|</?a\b).)*)(?<tag>" + keyWordName + @")",
@"$1<a href=""" + keyWordUrl + @""" target=""_blank"" title=""${tag}"">${tag}</a>");
if (length != temp.Length)
{
keys.Remove(keys[i]);
}
length = temp.Length;
}
return temp;
});
}
第二種辦法:(這是我自己能想到的辦法)
/// 一鍵比對内鍊,隻替換第一個比對到的字元
/// </summary>
/// <param name="content">要比對的文本字元</param>
/// <param name="type">判斷類型是否是"編輯"</param>
/// <returns></returns>
[HttpPost]
[ValidateInput(false)]
public async Task<ActionResult> ContentReplace(string content, string type)
{
try
{
if (type == "edit")
{
content = WebHelper.ReplaceStrHref(content);
}
if (string.IsNullOrEmpty(content))
{
return Content("請輸入文本資訊");
}
var list = await bll.GetAllList();
if (list != null)
{
#region 第二種辦法
// 第一次
Regex reg = null;
int n = -1;
Dictionary<string, string> dic = new Dictionary<string, string>();
for (int i = 0; i < list.Count; i++)
{
if (Regex.Match(content, list[i].KeyName).Success)
{
string pattern = $"<a href=\"{list[i].PCUrl}\" target=\"_blank\">{list[i].KeyName}</a>";
reg = new Regex(list[i].KeyName);
content = reg.Replace(content, pattern, 1);
if (Regex.Match(content, pattern).Success)
{
//如果目前關鍵字連結資訊成功,将目前的文本連結資訊提取出來添加到字典中(dic),并以唯一辨別符代替文本連結資訊作為占位符。
reg = new Regex(pattern);
n++;
content = reg.Replace(content, "{" + n + "}", 1);
dic.Add("{" + n + "}", pattern);
}
}
}
//将比對到的文本連結資訊format
if (dic.Count != 0)
{
int m = -1;
foreach (string key in dic.Keys)
{
m++;
if (content.Contains("{" + m + "}"))
{
content = content.Replace("{" + m + "}", dic[key]);
}
}
}
#endregion
content = WebHelper.RemoveStrImgAlt(content);
return Content(content);
}
else
{
throw new Exception("關鍵字庫中沒有資料,檢查集合是否抛異常了");
}
}
catch (Exception ex)
{
throw ex;
}
}
此處也貼出上面WebHelper中的兩個方法:(關于作用方法都有注釋)
/// 移除文本字元的a标簽
/// </summary>
public static string ReplaceStrHref(string content)
{
var r = new Regex(@"<a\s+(?:(?!</a>).)*?>|</a>", RegexOptions.IgnoreCase);
Match m;
for (m = r.Match(content); m.Success; m = m.NextMatch())
{
content = content.Replace(m.Groups[0].ToString(), "");
}
return content;
}
/// <summary>
/// 移除字元文本Img裡面Alt關鍵字包裹的内鍊
/// </summary>
public static string RemoveStrImgAlt(string content)
{
Regex rg2 = new Regex("(?<=alt=\"<a[^<]*)</a>\"");
if (rg2.Match(content).Success)
{
content = rg2.Replace(content, "");
}
Regex rg = new Regex("(?<=alt=\")<a href=\"[^>]*>");
if (rg.Match(content).Success)
{
content = rg.Replace(content, "");
}
return content;
}