字符串的输入

字符串的输入的主流函数:

一、scanf();  二、cin;  三、gets();  四、getline();          五、sscanf() 重点!!!!


一、scanf("%s",str);

遇见空格或换行就停止。

#include<stdio.h>
int main()
{
        char str[100];
        while(true)
        {
               scanf("%s",str);
               printf("%s\n",str);
        }
        return 0;
}
输入:123 456

输出:123

         456

 

二、cin>>str;与scanf();

相似遇见空格或换行就停止;以文件结束。

 

三、gets(str);

gets(str)函数与 scanf("%s",&str) 相似,但不完全相同,使用scanf("%s",&s) 函数输入字符串时存在一个问题,

就是如果输入了空格会认为字符串结束,空格后的字符将作为下一个输入项处理,但gets()函数将接收输入的整个字符串直到遇到换行为止或文件结束

 

四、getline(cin,str);

需要加头文件#include<stdlib.h> ;而且str 必须是 string类型;

读入一行以文件或换行结束。

 

五、sscanf();

1、sscanf与scanf类似,都是用于输入的,只是后者以键盘(stdin)为输入源,前者以固定字符串为输入源。

2、 %[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)

  %[aB'] 匹配a、B、'中一员,贪婪性

  %[^a] 匹配非a的任意字符,贪婪性

3、用法例子

      a. 常见用法。

  char buf[512] ;

  sscanf("123456 ", "%s", buf);//此处buf是数组名,它的意思是将123456以%s的形式存入buf中!

  printf("%s\n", buf);

  结果为:123456

  b. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。

  sscanf("123456 ", "%4s", buf);

  printf("%s\n", buf);

  结果为:1234

  c. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。

  sscanf("123456 abcdedf", "%[^ ]", buf);

  printf("%s\n", buf);

  结果为:123456

  d. 取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。

  sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf);

  printf("%s\n", buf);

     结果为:123456abcdedf

  当输入:

  sscanf("123456abcdedfBCDEF","%[1-9A-Z]",buf);

  printf("%s\n",buf);

   结果为:123456

  e. 取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。

   sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf);

   printf("%s\n", buf);

   结果为:123456abcdedf 

  f、给定一个字符串iios/12DDWDFF@122,获取 / 和 @ 之间的字符串,先将 "iios/"过滤掉,再将非'@'的一串内容送到buf中 

  sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);

  printf("%s\n", buf);

  结果为:12DDWDFF

  g、给定一个字符串"hello, world",仅保留world。(注意:","之后有一空格,%s遇空格停止,加 则是忽略第一个读到的字符串)

   sscanf("hello, world", "%*s%s", buf);

   printf("%s\n", buf);

   结果为:world

  %*s表示第一个匹配到的%s被过滤掉,即hello被过滤了

  如果没有空格则结果为NULL

 

  sscanf函数的用法

头文件 #include <stdio.h>

            定义函数 :  int sscanf (const char *str,const char * format,........);

            函数说明 :   sscanf()会将参数str的字符串根据参数format字符串来转换并格式化数据。格式转换形式请参考scanf()。转换后的结果存于对应的参数内。

            返回值 :  成功则返回参数数目,失败则返回-1,错误原因存于errno中。 返回0表示失败    否则,表示正确格式化数据的个数    例如:sscanf(str,"%d%d%s", &i,&i2, &s);    如果三个变成都读入成功会返回3。    如果只读入了第一个整数到i则会返回1。证明无法从str读入第二个整数。  

            范例

 #include <stdio.h>
   main() 
   { 
            int i; 
            unsigned int j; 
            char input[ ]=”10 0x1b aaaaaaaa bbbbbbbb”; 
            char s[5]; 
            sscanf(input,”%d %x %5[a-z] %*s %f”,&i,&j,s,s); 
            printf(“%d %d %s ”,i,j,s); 
   }
//输出: 10 27 aaaaa


            sscanf(stringBuf.c_str(), "%20[^#]#%20[^ ]",......)语句中""中的内容含义为:

            “%[ ]”符号用于声明字符串,它比“%s”更具体,可以用于设置读取的样式。例如“%[a-z]”只读取小写字母,读到其它字符就结束。注意,方括号中如果有“^”,代表一直读到某字符为止。例如:
            “%[^#]”:读取字符串,一直到出现“#”号为止。

            “%20[^#]”:读取20个字节的字符串,出现“#”号时结束。

            所以,“%20[^#]#%20[^ ]”的意义就是,

            读取两个20字节大小的字符串,第一个字符串可以用#结束,第二个字符串可以用回车符结束。

            它们的具体阐述,参见MSDN:“scanf Type Field Characters”章节,和“scanf Width  Specification”章节。

*********************************************************************************************************************************************

大家都知道sscanf是一个很好用的函数,利用它可以从字符串中取出整数、浮点数和字符串等等。它的使用方法简单,特别对于整数和浮点数来说。但新手可能并不知道处理字符串时的一些高级用法,这里做个简要说明吧。

1. 常见用法。

以下是引用片段:
  charstr[512]={0};
  sscanf("123456","%s",str);
  printf("str=%s",str);

  2. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。

以下是引用片段:
  sscanf("123456","%4s",str);
  printf("str=%s",str);

  3. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。

以下是引用片段:
  sscanf("123456abcdedf","%[^]",str);
  printf("str=%s",str);

  4. 取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。

以下是引用片段:
  sscanf("123456abcdedfBCDEF","%[1-9a-z]",str);
  printf("str=%s",str);

  5. 取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。

以下是引用片段:
  sscanf("123456abcdedfBCDEF","%[^A-Z]",str);
  printf("str=%s",str);

*********************************************************************************************************************************************

名称: sscanf() - 从一个字符串中读进与指定格式相符的数据.

语法: int sscanf( string str, string fmt, mixed var1, mixed var2 ... );

整数 sscanf( 字符串 str, 字符串 fmt, 混合 var1, 混合 var2 ... );

用法: 以指定的格式 fmt 去解读字符串 str. fmt 中除了 %d 和 %s 以外, 亦可包含其他的字符串作为格式. 每一个 %d 或 %s 都对应一个参数, 按顺序为 var1, var2 ... %d 读入一个整数到参数中, 而 %s 读入一个字符串. * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中) LPC 的 sscanf() 与 C 的 sscanf() 虽然相似, 但仍有不同之处. LPC 的 sscanf() 不需要 (也不可) 提供变量的内存位址给 sscanf(), 只需要给予变量的名字. 另一个不同点是, LPC 的 sscanf() 对于: sscanf( str, "%s %s", str1, str2 ); 的语法, 将会把 str 中的第一个英文单字 (即第一个空白字符以前的内容) 读入 str1, 后面其余的内容读入 str2.

sscanf() 会返回符合格式的 %d 和 %s 总数.

以前曾经编写过这样的小程序:一个文本文件,每行是一条记录,每条记录中包含多个字段,每个字段之间以某种定界符分开,举例如下:

Notebook,IBM,ThinkPad X32,6,12000

(各字段以逗号分隔,内容依次是:物品名称,生产厂家,型号,数量,价格)

如果要对这样的一行记录进行处理,提取出各个字段,怎么做比较好呢?

我以前的做法是在一个循环中用strtok函数每次取一个字段,然后将内容保存到一个字符串数组中。这样做虽然可行,但我总感觉写出的代码有些啰嗦。

最近看到一段代码,用C的标准库函数sscanf,处理这样的数据,只需一行就可以了。我把代码整理了一下,去掉了无关的部分,核心部分如下:

float price;
int quantity;
char category[21], name[21];
char vendor[21], sku[21];
char buf[201];
fp = fopen(filename, "r");
fgets(buf, 200, fp);
sscanf(buf,"%20[^#]#%20[^#]#%f#%i#%20[^#]#%20[^\n]",name, sku, &price, &quantity, category, vendor);


下面简单做些解说:

%20[^#]# 最多读入20个字符,直到遇见定界符#,但不包含定界符

%f# 读入一个浮点数,直到遇见定界符#

%i# 读入一个整数,直到遇见定界符#

%20[^\n] 最多读入20个字符,忽略行尾的回车符

是不是很简洁明了呢?

#include <stdio.h>
int main()
{

char log[]="<14>2002-11-11 12:12:12 11.22.33.44 3 3 aaaa aaaaaa";
//char log[]="<1>2002-11-11 12:12:12 11.22.33.44 3 aaaa aaaaaa";
char test[]="<1111> 22";
char log2[200];
char str1[20],str2[20],str3[20],str4[20],str5[20],str6[20],char str7[20];
int a1,a2,a3,a4,a5,a6;
sscanf(log,"<%d>%s %s %s %d %d %s",&a1,str2,str3,str4,&a5,&a6,str7);
printf("%d\n",a1);
printf("%s\n",str2);
printf("%s\n",str3);
printf("%s\n",str4);
printf("%d\n",a5);
printf("%d\n",a6);
printf("%s\n",str7);
sscanf(test,"<%d> %d",&a5,&a6);
printf("%d\n",a5);
printf("%d\n",a6);
sscanf(log,"<%[^>]>%[^ ] %[^ ] %[^ ] %[^ ] %[^ ] %[^$]",str1,str2,str3,str4,str5,str6,str7);
printf("%s\n",str1);
printf("%s\n",str2);
printf("%s\n",str3);
printf("%s\n",str4);
printf("%s\n",str5);
printf("%s\n",str6);
printf("%s\n",str7);
return 1;

}


const char *str = "drw-rw-rw- 1 user group 0 Oct 28 2003";

上面是源串,我要分别得到drw-rw-rw-,group字段

注意:因为这几个字段的值会变化,所以我要用格式化输入,分别存入下面的a b c中,高手帮忙!

下面这个是我没成功的尝试

char a[20];
char b[50];
char c[20];
//int ret = sscanf(str, "%[^'' '']* %[''u''] %[^'' '']", a, b, c);
int ret = sscanf(str, "%s%*s%*s%s%*s%*s%*s%*s%s", a, b, c);



这样就可以了,不要的东西都抛弃掉了



今天看到一个奇怪的scanf。其实这只是用了正则表达式。

sscanf(user, "%127[^:]:%127[^ ]", user_name, password);

"%127[^:]:%127[^ ]",是正则表达式

用scanf或者printf,可以在%后面跟%d,%s等东西,也可以跟一个正则表达式。

这里,127表示最多可以接受127个字符,[^:]是正则表达式,表示非":",到":"结束

后面,%127[^ ],同样,其中[^ ]是正则表达式,表示非" ",到" "结束

所以,如果user是"wpc:123456"的字符串,那么经过上面的sscanf后,

user_name是wpc,而password是123456