何问起收藏夹增加一个功能,根据url获取文档的标题,分两步,第一步根据url获取文档html的内容,第二步使用正则表达式获取html文档中的标题。以下为第二部的实现代码。
代码如下:
using System.Text.RegularExpressions;
namespace HoverTree.HoverTreeFrame.HtText
{
public class HtHtml
{
/// <summary>
/// 获取html文档的标题(Title) by 何问起
/// </summary>
/// <param name="html"></param>
/// <returns></returns>
public static string GetTitle(string html)
{
string h_title = "";
string pattern = @"(?si)<title(?:\s+(?:""[^""]*""|'[^']*'|[^""'>])*)?>(?<title>.*?)</title>";
h_title= Regex.Match(html, pattern).Groups["title"].Value.Trim();
return h_title;
}
}
}