2012年1月7日 星期六

string.h 字串操作

網路上別人寫好的文章,寫的很詳細!很適合作備忘錄! 

附上原文網址:http://pydoing.blogspot.com/2010/07/c-stdstring.html

C 語言標準函數庫分類導覽 - 字串處理 string.h

標頭檔 string.h 宣告許多字串處理相關的函數,包括拷貝、相接、搜尋、測試相等、計算長度等。


以 str 起頭的函數作為處理字串之用,另有以 mem 起頭的函數,這些函數則可以進行記憶體區塊的操作。 size_t 作為 sizeof 運算子的回傳型態,實際上可能為 unsigned int 或 unsigned long 。


以下函數可以拷貝字串
函數名稱功能函數原型
strcpy將字串 s2 拷貝到 s1char *strcpy(char *s1, const char *s2);
strncpy將字串 s2 最多 n 個字元拷貝到 s1char *strncpy(char *s1, const char *s2, size_t n);


以下函數可以將字串相接
函數名稱功能函數原型
strcat將字串 s2 接到 s1 的尾端char *strcat(char *s1, const char *s2);
strncat將字串 s2 最多 n 個字元接到 s1 的尾端char *strncat(char *s1, const char *s2, size_t);


以下函數測試兩個字串是否相等
函數名稱功能函數原型
strcmp比較 s1 與 s2 兩個字串是否相等int strcmp(const char *s1, const char *s2);
strncmp比較 s1 與 s2 兩個字串前 n 個字元是否相等int strncmp(const char *s1, const char *s2, size_t n);


以下函數作為字串的搜尋處理之用
函數名稱功能函數原型
strchr回傳在字串 s 中,字元 c 第一次出現位置的指標char *strchr(const char *s, int c);
strcspn計算經過幾個字元會在字串 s1 中遇到屬於 s2 中的字元size_t strcspn(const char *s1, const char *s2);
strspn計算經過幾個字元會在字串 s1 中遇到不屬於 s2 中的字元size_t strspn(const char *s1, const char *s2);
strpbrk回傳在字串 s2 中的任何字元在 s1 第一次出現位置的指標char *strpbrk(const char *s1, const char *s2);
strrchr回傳在字串 s 中,字元 c 最後一次出現位置的指標char *strrchr(const char *s, int c);
strstr回傳在字串 s2 在 s1 第一次出現位置的指標char *strstr(const char *s1, const char *s2);
strtok以字串 s2 的內容切割 s1char *strtok(char *s1, const char *s2);


以下函數計算字串的長度
函數名稱功能函數原型
strlen計算字串的長度size_t strlen(const char *s);


以下函數為進行記憶體區塊操作之用
函數名稱功能函數原型
memcpy從 s2 所指向的資料複製 n 個字元到 s1void *memcpy(void *s1, const void *s2, size_t n);
memmove從 s2 所指向的資料複製 n 個字元到 s1void *memmove(void *s1, const void *s2, size_t n);
memcmp比較 s1 與 s2 前 n 個字元的資料int memcmp(const void *s1, const void *s2, size_t n);
memchr找出字元 c 在 s 前 n 個字元第一次出現的位置void *memchr(const void *s, int c, size_t n);
memset將 s 中前 n 個字元全部設定為 cvoid *memset(void *s, int c, size_t n);


字串的宣告
  一般只要是用 " 符號所包起來的字元就是字串,如下的宣告
  char s[5]="abcd";
  字串"abcd"除了四個字元所佔的空間外還包含一個'\0'字元在最後面當字串結束符號
  所以總字元數是5
  字串就是一連續字元的最末端以一個'\0'字符做為結束的連續字元
  編譯器對字串的處理以及字串相關的函式,都是依照這個規格在處理字串,這也是字串與一般字元陣列不一樣的地方
  你也可以這樣子來宣告char s[]="abcd";
  雖沒有指明陣列索引值,但編譯器會自動幫你補上,所以陣列 s 將會是一個索引值為 5 的陣列

字串與char*
  以下是一個最簡單的應用
  char s[]="abcd";
  char* p=s;
  p 就相當於是一個指著 s 的指標

  char* str="abcd";
  指標str相當於是一個字串,編譯器會自動配置一塊空間擺放"abcd"這個字串,然後讓str指標指向
  但他和char s[]是不一樣的地方,是你不能修改那塊空間裡的值,像這樣 *str='z';
  但你能再讓他指向別的地方

字串的處理
  C裡頭有一組現成的專用拿來處理字串的函式,需引入 string.h 這個標頭檔
  以下簡單的介紹這些常用的函式

  size_t strlen(const char* source)
    取得字串長度
   
  char* strcpy(char* destn,const char* source)
    拷貝字串,將source字串拷貝至destn的空間,回傳值其實就是destn的位置
   
  char* strncpy(char* destn,const char* source,size_t n)
    拷貝字串,將source字串的前n個字元拷貝至destn的空間,回傳值為destn的位置
   
  char* strcat(char* destn,const char* source)
     拷貝字串,將source字串串接至destn字串後面,回傳值為destn的位置,請確定destn的空間足夠儲放串接後的字串
   
  char* strncat(char* destn,const char* source,,size_t n)
    串接兩字串,將source的前n個字串串接至destn字串後面,回傳值為destn的位置,請確定destn的空間足夠儲放串接後的字串
   
  int strcmp(const char* str1,const char* str2)
    比對字串,若完全相等則回傳0,若有差異,回傳其字元值差
   
  int strncmp(const char* str1,const char* str2,size_t n)
    比對字串只比對前n個字元,若完全相等則回傳0,若有差異,回傳其字元值差
   
  int strcasecmp(const char* str1,const char* str2)
    忽略大小寫比對字串,比對字串,若完全相等則回傳0,若有差異,回傳其字元值差
   
  int strncasecmp(const char* str1,const char* str2,size_t n)
    忽略大小寫比對字串只比對前n個字元,若完全相等則回傳0,若有差異,回傳其字元值差

  char* strchr(const char* str,int ch)
    找出字串中第一個指定字元的位置,若找不到傳回0
   
  char* strrchr(const char* str,char ch)
    找出str字串中,最後一個出現ch字元的字元,回傳該字元位址
    char str[]="123123";
    strrchr(str,'1');
    回傳值將會是&str[3]
   
  size_t strcspn(const char* str,const char* reject)
    傳回str字串中第一個不含reject字串中字元的前字元數
    char str[]="ABCD123456789";
    strcspn(str,"4321");
    將會得到4
   
  char* strdup(const char* string)
    複製字串,其字串空間是使用molloc()所配置,事後也能用free()釋放掉,失敗回傳NULL
   
  char* strfry(char* string)
    隨機重組字串內的字元
   
  char* strpbrk(const char* str,const char* accept)
    找出str字串中,有accept字串中字元的字元,回傳該字元的位址
    char str[]="ABCD123456789";
    strpbrk(str,"4321");
    回傳值將會是&str[4]
   
  char* strrchr(const char* str,char ch)
    找出str字串中,最後一個出現ch字元的字元,回傳該字元位址
    char str[]="123123";
    strrchr(str,'1');
    回傳值將會是&str[3]
   
  size_t strspn(const char* str,const char* accept)
    傳回str字串中前面含有accept字串中字元的字元數
    char str[]="ABCD123456789";
    strspn(str,"BA");
    將會得到2
   
  char* strstr(const char* str1,const char* str2)
    搜尋字串,在str1的字串搜尋str2字串,傳回搜尋到的子字串位址
   
  char* strtok(char* str,const char* delimit)
    分解字串,str字串為要被分解的字串,delimit為要做為分解依據的字串
    找到了要分解依據的字元便將其設為='\0',即回傳該字串
    第一次使用strtok()引數str必須指定,往後可設為NULL,如此將持續一直分解下去,直到回傳值為NULL,便不能再分解下去
    char str[]="abc def:ghi-xyz try"
    char* p;
    printf("%s=",strtok(str," :-"));
    while(p=strtok(NULL," :-"))printf("%s=",p);
    將印出 abc=def=ghi=xyz=try
 
  以上所例函式從較常用者先列出string.h不只有專用處理字串的函式,也有專門用來處理記憶體的相關函式
  它們的差別在於字串函式處理的對象是字串,也就是'\0'符號做為結尾的一串字元,所傳入的char*型別的參數都必須要是字串
  而記憶體函式是不管內容是什麼字元,都一視同仁處理

沒有留言:

張貼留言