【对比Python】WordCount
任务:统计某文档的单词数量
Python
1 | data=pd.read_csv(file,sep="\n",header=None) |
2 | tmp=[] |
3 | data=data.iloc[:,0].apply(lambda x:tmp.extend(x.split())) |
4 | pd.Series(1,tmp).groupby(level=0).count() |
这里只是对文档按空字符分割,如果要去掉其他无统计意义的标点符号则会非常麻烦。
集算器
A | ||
1 | =lower(file(“T.txt”).read()).words().groups(~:word;count(1):count) |
集算器提供了words()函数将串拆分成单词,只要一句就可以完成这个运算。