程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> C# >> C#基礎知識 >> C#根據url網址獲取htm文檔的title標題

C#根據url網址獲取htm文檔的title標題

編輯:C#基礎知識
提供一個URL網址,
例如 http://hovertree.net,
怎樣把這個網址頁面的標題(title)給提取出來?
下面的代碼就實現了這個功能。

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Net;

namespace test_for_title
{
class Program
{
static string GetHtml(string url, Encoding encoding)
{
byte[] buf = new WebClient().DownloadData(url);
if (encoding != null) return encoding.GetString(buf);
string html = Encoding.UTF8.GetString(buf);
if (encoding == null || encoding == Encoding.UTF8)
return html;
return encoding.GetString(buf);
}

static string GetTitle(string html)
{
string pattern = @"(?si)<title(?:\s+(?:""[^""]*""|'[^']*'|[^""'>])*)?>(?<title>.*?)</title>";
return Regex.Match(html, pattern).Groups["title"].Value.Trim();
}

static void PrintTitle(string url)
{
string html = GetHtml(url, null);
Console.WriteLine("頁面的title為:\n"+GetTitle(html));
}

static void Main(string[] args)
{
PrintTitle("http://hovertree.net");
Console.Read();
}
}
}
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved