顧名思義,在這種模式下,所有的字符都只用一個字節表示,常見的如,ASCII
在Windows中MBCS包含兩種字符類型,單字節字符和雙字節字符.由於windows使用的多字節字符絕大部分是兩個字節長,所以MBCS常被DBCS代替。
Unicode是一種所有的字符都使用兩個字節編碼的編碼模式。Unicode字符有時也被稱作寬字符,因為它比單子節字符寬(使用了更多的存儲空間)。
常見的為utf-8,還有一個比較少用的是utf-16
在浏覽器中或某些文本編輯器中會給utf-8 文本 加上bom頭。在程序讀取的過程中需要去掉BOM頭否則會出現亂碼。
BOM 格式為: EF BB BF,10進制格式為:-17 -69 -65
Utf8去BOM頭的方法:
string Utf8DeBOM(string s) { int c1 = s[0]; int c2 = s[1]; int c3 = s[2]; if (c1 == -17 && c2 == -69 && c3 == -65) { s = s.substr(3, s.length()); } return s; }
C語言中, 沒有字符串的數據類型,使用一個以NULL('\0')字符結尾的字符數組來保存字符串。
char* p = "Hello world";
char* p = (char*)malloc (100 * sizeof(char));
char p[100] = "hello world";
C++ 語言中有單獨字符串類型,在string頭文件中,還有對應的寬字符串wstring.
string iStr = "Hello world";
wstring wStr = "Hello world";
在學Window是開發過程中最頭疼的莫過於一堆字符串宏。
類型 MBCS 中含義 Unicode 中含義
TCHAR char wchar_t
WCHAR wchar _twchar_t
LPSTR char* char*
LPCWSTR const wchar_t* const wchar_t*
LPCSTR const char* const char*
LPWSTR wchar_t* wchar_t*
LPTSTR TCHAR* TCHAR*
LPCTSTR const TCHAR* const TCHAR*
char 標准c的字符類型(1Byte)
wchar_t 保存UNICODE字符集的類型(2Byte)
TCHAR的定義如下:
#ifdef UNICODE typedef wchar_t TCHAR; #else typedef char TCHAR; #endif
再了解一個宏_T(),使用宏_T(),使代碼有了unicode的意識。
#ifdef UNICODE #define _T(x) L##x #else #define _T(x) x
string(const char *s); //用c字符串s初始化
string(int n,char c); //用n個字符c初始化
此外,string類還支持默認構造函數和復制構造函數,如string s1;string s2="hello";都是正確的寫法。當構造的string太長而無法表達時會拋出length_error異常
const char &operator[](int n)const; // 索引操作,取單個字符
const char &at(int n)const;// 同上
char &operator[](int n);//同上
char &at(int n);//同上
operator[]和at()均返回當前字符串中第n個字符的位置,但at函數提供范圍檢查,當越界時會拋出out_of_range異常,下標運算符[]不提供檢查訪問。
const char *data()const;//返回一個非null終止的c字符數組
const char *c_str()const;//返回一個以null終止的c字符串
int copy(char *s, int n, int pos = 0) const;//把當前串中以pos開始的n個字符拷貝到以s為起始位置的字符數組中,返回實際拷貝的數目
int capacity()const; //返回當前容量(即string中不必增加內存即可存放的元素個數)
int max_size()const; //返回string對象中可存放的最大字符串的長度
int size()const; //返回當前字符串的大小
int length()const; //返回當前字符串的長度
bool empty()const; //當前字符串是否為空
void resize(int len,char c);//把字符串當前大小置為len,並用字符c填充不足的部分
string類重載運算符operator>>用於輸入,同樣重載運算符operator<<用於輸出操作。
函數getline(istream &in,string &s);用於從輸入流in中讀取字符串到s中,以換行符'\n'分開。
string &operator=(const string &s);//把字符串s賦給當前字符串
string &assign(const char *s);//用c類型字符串s賦值
string &assign(const char *s,int n);//用c字符串s開始的n個字符賦值
string &assign(const string &s);//把字符串s賦給當前字符串
string &assign(int n,char c);//用n個字符c賦值給當前字符串
string &assign(const string &s,int start,int n);//把字符串s中從start開始的n個字符賦給當前字符串
string &assign(const_iterator first,const_itertor last);//把first和last迭代器之間的部分賦給字符串
string &operator+=(const string &s);//把字符串s連接到當前字符串的結尾
string &append(const char *s); //把c類型字符串s連接到當前字符串結尾
string &append(const char *s,int n);//把c類型字符串s的前n個字符連接到當前字符串結尾
string &append(const string &s); //同operator+=()
string &append(const string &s,int pos,int n);//把字符串s中從pos開始的n個字符連接到當前字符串的結尾
string &append(int n,char c); //在當前字符串結尾添加n個字符c
string &append(const_iterator first,const_iterator last);//把迭代器first和last之間的部分連接到當前字符串的結尾
bool operator==(const string &s1,const string &s2)const;//比較兩個字符串是否相等
運算符">","<",">=","<=","!="均被重載用於字符串的比較;
int compare(const string &s) const;//比較當前字符串和s的大小
int compare(int pos, int n,const string &s)const;//比較當前字符串從pos開始的n個字符組成的字符串與s的大小
int compare(int pos, int n,const string &s,int pos2,int n2)const;//比較當前字符串從pos開始的n個字符組成的字符串與s中pos2開始的n2個字符組成的字符串的大小
int compare(const char *s) const;
int compare(int pos, int n,const char *s) const;
int compare(int pos, int n,const char *s, int pos2) const;
compare函數在>時返回1,<時返回-1,==時返回0
string substr(int pos = 0,int n = npos) const;//返回pos開始的n個字符組成的字符串
void swap(string &s2); //交換當前字符串與s2的值
int find(char c, int pos = 0) const;//從pos開始查找字符c在當前字符串的位置
int find(const char *s, int pos = 0) const;//從pos開始查找字符串s在當前串中的位置
int find(const char *s, int pos, int n) const;//從pos開始查找字符串s中前n個字符在當前串中的位置
int find(const string &s, int pos = 0) const;//從pos開始查找字符串s在當前串中的位置
//查找成功時返回所在位置,失敗返回string::npos的值
int rfind(char c, int pos = npos) const;//從pos開始從後向前查找字符c在當前串中的位置
int rfind(const char *s, int pos = npos) const;
int rfind(const char *s, int pos, int n = npos) const;
int rfind(const string &s,int pos = npos) const;
//從pos開始從後向前查找字符串s中前n個字符組成的字符串在當前串中的位置,成功返回所在位置,失敗時返回string::npos的值
int find_first_of(char c, int pos = 0) const;//從pos開始查找字符c第一次出現的位置
int find_first_of(const char *s, int pos = 0) const;
int find_first_of(const char *s, int pos, int n) const;
int find_first_of(const string &s,int pos = 0) const;
//從pos開始查找當前串中第一個在s的前n個字符組成的數組裡的字符的位置。查找失敗返回string::npos
int find_first_not_of(char c, int pos = 0) const;
int find_first_not_of(const char *s, int pos = 0) const;
int find_first_not_of(const char *s, int pos,int n) const;
int find_first_not_of(const string &s,int pos = 0) const;
//從當前串中查找第一個不在串s中的字符出現的位置,失敗返回string::npos
int find_last_of(char c, int pos = npos) const;
int find_last_of(const char *s, int pos = npos) const;
int find_last_of(const char *s, int pos, int n = npos) const;
int find_last_of(const string &s,int pos = npos) const;
int find_last_not_of(char c, int pos = npos) const;
int find_last_not_of(const char *s, int pos = npos) const;
int find_last_not_of(const char *s, int pos, int n) const;
int find_last_not_of(const string &s,int pos = npos) const;
//find_last_of和find_last_not_of與find_first_of和find_first_not_of相似,只不過是從後向前查找
string &replace(int p0, int n0,const char *s);//刪除從p0開始的n0個字符,然後在p0處插入串s
string &replace(int p0, int n0,const char *s, int n);//刪除p0開始的n0個字符,然後在p0處插入字符串s的前n個字符
string &replace(int p0, int n0,const string &s);//刪除從p0開始的n0個字符,然後在p0處插入串s
string &replace(int p0, int n0,const string &s, int pos, int n);//刪除p0開始的n0個字符,然後在p0處插入串s中從pos開始的n個字符
string &replace(int p0, int n0,int n, char c);//刪除p0開始的n0個字符,然後在p0處插入n個字符c
string &replace(iterator first0, iterator last0,const char *s);//把[first0,last0)之間的部分替換為字符串s
string &replace(iterator first0, iterator last0,const char *s, int n);//把[first0,last0)之間的部分替換為s的前n個字符
string &replace(iterator first0, iterator last0,const string &s);//把[first0,last0)之間的部分替換為串s
string &replace(iterator first0, iterator last0,int n, char c);//把[first0,last0)之間的部分替換為n個字符c
string &replace(iterator first0, iterator last0,const_iterator first, const_iterator last);//把[first0,last0)之間的部分替換成[first,last)之間的字符串
string &insert(int p0, const char *s);
string &insert(int p0, const char *s, int n);
string &insert(int p0,const string &s);
string &insert(int p0,const string &s, int pos, int n);
//前4個函數在p0位置插入字符串s中pos開始的前n個字符
string &insert(int p0, int n, char c);//此函數在p0處插入n個字符c
iterator insert(iterator it, char c);//在it處插入字符c,返回插入後迭代器的位置
void insert(iterator it, const_iterator first, const_iterator last);//在it處插入[first,last)之間的字符
void insert(iterator it, int n, char c);//在it處插入n個字符c
iterator erase(iterator first, iterator last);//刪除[first,last)之間的所有字符,返回刪除後迭代器的位置
iterator erase(iterator it);//刪除it指向的字符,返回刪除後迭代器的位置
string &erase(int pos = 0, int n = npos);//刪除pos開始的n個字符,返回修改後的字符串
通過定義ostringstream和istringstream變量實現,
例如:
string input("hello,this is a test"); istringstream is(input); string s1,s2,s3,s4; is>>s1>>s2>>s3>>s4;//s1="hello,this",s2="is",s3="a",s4="test" ostringstream os; os<3.2.15 字符串分割函數
vectorsplit(string& str,const char* c) { char * p; vector res; p = strtok(const_cast (str.c_str()),c); while(p!=NULL) { res.push_back(p); p = strtok(NULL,c); } return res; } 3.2.16 字符串替換函數
void Replace(std::string&srcstr,const std::string&oldstr,const std::string&newstr) { string::size_type pos=0; string::size_type a=oldstr.size(); string::size_type b=newstr.size(); while((pos=srcstr.find(oldstr,pos))!=string::npos) { srcstr.replace(pos,a,newstr); pos+=b; } }3.2.17 字符串的Trim方法
std::string TrimLeft(const std::string& str) { std::string t = str; for (std::string::iterator i = t.begin(); i != t.end(); i++) { if (!isspace(*i)) { t.erase(t.begin(), i); break; } } return t; } std::string TrimRight(const std::string& str) { if (str.begin() == str.end()) { return str; } std::string t = str; for (std::string::iterator i = t.end() - 1; i != t.begin(); i--) { if (!isspace(*i)) { t.erase(i + 1, t.end()); break; } } return t; } std::string Trim(const std::string& str) { std::string t = str; std::string::iterator i; for (i = t.begin(); i != t.end(); i++) { if (!isspace(*i)) { t.erase(t.begin(), i); break; } } if (i == t.end()) { return t; } for (i = t.end() - 1; i != t.begin(); i--) { if (!isspace(*i)) { t.erase(i + 1, t.end()); break; } } return t; }4 字符串轉換
4.1 string, char* , const char* 相互轉化
char * s = "hello world"; const char * cs = "world"; string str; str = s; // char* -> string s = const_cast(cs); // const char* -> char* cs = s;// char* -> const char* s = const_cast (str.c_str());// string -> const char* -> char*
4.1 整形和字符串相互轉化
// unsigned int to string 。用以取代atoi static inline string Int2Str(unsigned int value) { string result; stringstream buffer; buffer << std::dec << value; buffer >> result; return result; } // string to unsigned int static inline unsigned int Str2Int(string value) { unsigned int result; stringstream buffer; buffer << std::dec << value; buffer >> result; return result; }
4.1 16進制 數字和字符串相互轉化
// unsigned int to hex string static inline string Uint2StrHex(unsigned int value) { string result; stringstream buffer; buffer << hex << value; buffer >> result; return result; } // hex string to unsigned int static inline unsigned int StrHex2Uint(string value) { unsigned int result; stringstream buffer; buffer << hex << value; buffer >> result; return result; }5 參考資料
http://www.cnblogs.com/fdyang/archive/2012/06/01/2858741.html
http://www.cnblogs.com/sexybear/p/Cpp_stringplus.html
http://www.cnblogs.com/Frandy/archive/2012/04/18/cpp_str_split.html
http://blog.csdn.net/beyondhaven/article/details/6679206
http://www.cnblogs.com/ider/archive/2011/07/22/cpp_cast_operator_part2.html