您的位置:首页 - 教程 - HoverTreeSCJ - 正文
C#正则表达式获取HTML文档Title
何问起收藏夹增加一个功能,根据url获取文档的标题,分两步,第一步根据url获取文档html的内容,第二步使用正则表达式获取html文档中的标题。以下为第二部的实现代码。

代码如下:
using System.Text.RegularExpressions;

namespace HoverTree.HoverTreeFrame.HtText
{
public class HtHtml
{

/// <summary>
/// 获取html文档的标题(Title) by 何问起
/// </summary>
/// <param name="html"></param>
/// <returns></returns>
public static string GetTitle(string html)
{
string h_title = "";

string pattern = @"(?si)<title(?:\s+(?:""[^""]*""|'[^']*'|[^""'>])*)?>(?<title>.*?)</title>";
h_title= Regex.Match(html, pattern).Groups["title"].Value.Trim();

return h_title;
}
}
}

评论: