201671010439-词频统计软件项目报告

一,需求分析

1.程序可读入任意英文文本文件,该文件中英文词数大于等于1个。

2.程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。

3.指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。

4.高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。

5.统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。

二,功能设计

1.用户输入任意多个英文单词,显示对应单词在文本中出现的次数和柱状图。

2.用户从键盘输入高频词输出的个数k,按文本中词频数降序显示前k个单词的词频及单词。

3.统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。

三,设计实现

说明每个部分的算法设计说明(可以是描述算法的流程图)、每个程序中使用的存储结构设计说明(如果指定存储结构写出该存储结构的定义),面向对象的方法,应该给出类中成员变量和成员函数原型声明

四、测试运行

部分代码

whilefscanffp,”%s”,st)!=EOF)

{   found=0;

fori=0;i<wordnum;i++)

   { ifstrcmpwl[i].word,st)==0)    //字符串的读取  

  {

wl[i].num++;    

found=1; 

    break; }

}   if!found)  

{

strcpywl[i].word,st);  

  wl[i].num=1;  

  wordnum++; }

}  fclosefp); 

  iffp=fopen”14220105.txt”,”r”))==NULL) 

exit1);

  whilec=fgetcfp))!=EOF)

{

ifc==’ ‘)

 ++n;

else ifc>=’0’&&c<=’9′)

++j;

else ifc>=’a’&&c<=’z’)||c>=’A’&&c<=’Z’))

++k;

else ++m

}

fclosefp)

printf”读取完毕,结果如下:
“)

printf”数字%d
字母%d
空格%d
其他%d
);//输出结果

}

void shuru)

{char str[100]

char letter[52]

int count[52]={0}

int i;

int lc=0;

cout<<“输入字符串:”<<endl;

scanf”%s”,str);

//初始字母表

fori=0;i<26;i++)

letter[i]=’A’+i;

fori=26;i<52;i++)

letter[i]=’a’+i-26;

i=0;

whilestr[i]!=”)

{

ifstr[i]!=”)//字符串未结束

{

if(str[i]>=’A’&&str[i]<=’Z’)

count[str[i]-65]++;

lc++;

}

i++;

}fori=0,i<52;i++)

{ifcount[i]!=0)

printf%c-%d-%3.2f%
“,letter[i],count[i],float)count[i]/lc*100);

}

}

五、运行结果

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注