程式師世界 >> 編程語言 >> .NET網頁編程 >> ASP.NET >> ASP.NET基礎 >> asp.net中C#獲取字符串中漢字的個數的具體實現方法

asp.net中C#獲取字符串中漢字的個數的具體實現方法

編輯：ASP.NET基礎

符串可以包括數字，字母，漢字或者其他的字符。使用Char類型的IsDigit靜態方法可以判斷字符串中的字符是否為數字，使用Char類型中的IsLetter靜態方法可以判斷字符串中是否為字母。我們來實現一種方法來實現判斷字符串中是否為漢字，通過此方法可以計算字符串中漢字的個數，運行效果如圖：

首先根據效果圖設置好Form的界面和內容，Box1.Text為輸入的字符串，我們對該字符串的處理，來計算漢字的個數，雙擊Buton控件，編輯其單擊事件代碼。

我們看下漢字的Unicode范圍，普遍給出了0x4E00到0x9FA5，只要我們接受到的字符的16進制編碼在此范圍，我們就認為此字符為漢字（label4.Text顯示漢字的個數）

復制代碼代碼如下:
string a=Box1.Text;
int K = 0;
for (int i = 0; i < a.Length;i++ )
{
char j=a[i];
ushort s = j;
if (s >= 0x4E00&&s<=0x9FA5)
{
K++;
}
label4.Text = “” + K;

後再再整理了一些函數 C#中使用正則表達式來從字符串中判斷出漢字

復制代碼代碼如下:
//首先引用命名空間
using System.Text.RegularExpressions;

//定義一個函數，返回字符串中的漢字個數
public static int GetHanNumFromString(string str)
{
int count = 0;
Regex regex = new Regex(@"^[u4E00-u9FA5]{0,}$");

    for (int i = 0; i < str.Length; i++)
    {
        if (regex.IsMatch(str[i].ToString()))
        {
            count++;
        }
    }

return count;
}

代碼說明：

1、Unicode字符的u4E00到u9FA5之間為漢字編碼，所以使用它來表示漢字的正則匹配范圍。
2、字符串可以直接進行索引，索引得到的值的數據類型為char，所以str[i].ToString()是為了把char再度轉換為字符串。
3、使用Regex的IsMatch方法，可以判斷字符串是否與給定的正則表達式匹配，如果匹配成功則返回True，否則為False。

例，獲取一個字符串中的漢字的個數 C#獲取字符串全角的個數
復制代碼代碼如下:
static void Main(string[] args)
        {
            while (true)
            {

　　　　　 Console.WriteLine("輸入一串字符");
                string str = Console.ReadLine();//定義一個變量str用來存儲輸入的字符串
                int num= Encoding.Default.GetByteCount(str);//Encoding.Default.GetByteCount(str)在系統默認下計算對字符進行編碼是所產生的字節數
                int len = str.Length;//獲取字符串的長度
                Console.WriteLine("有{0}漢字",num-len);//num-len就是字符串中的漢字個數
            }
}

例，這個也是正常的

復制代碼代碼如下:
ArrayList itemList = new ArrayList();
CharEnumerator CEnumerator = textBox1.Text.GetEnumerator();
Regex regex = new Regex("^[/u4E00-/u9FA5]{0,}$");
while (CEnumerator.MoveNext())
{
     if(regex.IsMatch(CEnumerator.Current.ToString(),0))
         itemList.Add(CEnumerator.Current.ToString());
     textBox2.Text = itemList.Count.ToString();
}

原理是:獲得字符串中漢字的個數時，可以首先定義一個與漢字相匹配的正則表達式，然後使用CharEnumerator對象的MoveNext方法循環訪問字符串中的每個字符，如果訪問的字符與定義的正則表達式相匹配，則將其添加到一個數組中，最後獲得該數組的項數即為字符串中漢字的個數。獲得字符串中漢字個數