如何统计一个文本中单词频次最高的10个单词?【面试题详解】

今天爱分享给大家带来如何统计一个文本中单词频次最高的10个单词?【面试题详解】,希望能够帮助到大家。



import re

def test(filepath):

    distone = {}
    numTen = []

    with open(filepath,"r",encoding="utf-8") as f:
        for line in f:
            line = re.sub("\W","",line)
            lineone = line.split()
            for keyone in lineone:
                if not distone.get(keyone):
                    distone[keyone]=1
                else:
                    distone[keyone]+=1
    numTen = sorted(distone.items(),key=lambda x:x[1],reverse=True)[:10]
    numTen =[x[0]for x in numTen]
    return numTen

原文链接:https://blog.itblood.com/4065.html,转载请注明出处。
0
魔物娘小镇 官方中文版[新作][电脑/100M]魔物娘小镇 官方中文版(Monster Girl Town) [像素ACT/中文/动态]
魔物娘小镇 官方中文版[新作][电脑/100M]魔物娘小镇 官方中文版(Monster Girl Town) [像素ACT/中文/动态]
刚刚 有人购买 去瞅瞅看

站点公告

显示验证码
没有账号?注册  忘记密码?