*Description
在当前目录中存在文件名为"case1.in"(其中case后为数字1,不是字母l,写错提交后会判错)的文本文件,
其内容为一篇英文文章(以EOF作为结束标志)。现要求读取该文本文件内容,统计文章中每个单词出现的次数,
并输出出现次数最多的前5个单词及其出现次数(按出现次数由多到少的顺序输出,次数相同时按字典顺序输出,
不足5个单词时,按序输出全部单词)。程序中注意如下细节:
(1) 空格、标点符号与回车符起到分隔单词的作用。
(2) 文章一行的末尾可能有连字符,出现连字符时,该行最末的字符串与下行最先出现的字符串构一个单词;
(3) 名词缩写算一个单词;
(4) 数字不算单词;
(5) 单词不区分大小写;
(6) 输出时单词全使用小写;
//代码片段。
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <string.h>
//定义结构体。
struct list
{
int time;
char words[21];
}word[10001];
int main()
{
//声明变量。
FILE *fp;
fp=fopen("case1.in","r");
int count=0,num=0,q=0,i;
char ch,temp[21];
//初始化结构体数组
for(num=0;num<10001;num++)
{
word[num].time=1;//次数归一
memset(word[num].words,0,sizeof(word[num].words));
}
//重做文件读取操作。更简!更简!更简!!!!
while((ch=fgetc(fp))!=EOF)
{
if(ch>='a'&&ch<='z')
word[count].words[q++]=ch;
//大小写转换
else if(ch>='A'&&ch<='Z')
word[count].words[q++]=ch+32;
//分页符转换
else if(ch=='-')
{
ch=fgetc(fp);
if(ch=='\n')
continue;
else
{
count++;
q=0;
if(ch>='a'&&ch<='z')
word[count].words[q++]=ch;
else if(ch>='A'&&ch<='Z')
word[count].words[q++]=ch+32;
}
}
else
{
count++;
q=0;
}
}
//对比相同 加次数 清同串。
for(num=0;num<count;num++)
{
for(i=num+1;i<count;i++)
if(!strcmp(word[num].words,word[i].words))
{
word[num].time++;
memset(word[i].words,0,sizeof(word[i].words));
}
}
//清其他字符干扰。
for(i=0;i<count;i++)
{
if(word[i].words[0]<'a'||word[i].words[0]>'z')
{
word[i].time=0;
}
}
//重做排序 更快!更快!更快!!!!
for(i=1;i<count;i++)
for(num=0;num<count-i;num++)
{
if(word[num].time<word[num+1].time)
{
//次数排序
int t=word[num].time;
word[num].time=word[num+1].time;
word[num+1].time=t;
strcpy(temp,word[num].words);
strcpy(word[num].words,word[num+1].words);
strcpy(word[num+1].words,temp);
}
else if(word[num].time==word[num+1].time)
{
//字母顺序
if(strcmp(word[num].words,word[num+1].words)>0)
{
strcpy(temp,word[num].words);
strcpy(word[num].words,word[num+1].words);
strcpy(word[num+1].words,temp);
}
}
}
//输出方法。
for(i=0;i<5;i++)
{
printf("%s %d\n",word[i].words,word[i].time);
}
//关闭文件
fclose(fp);
return 0;
}