中英文统计

中英文统计

news/2024/7/7 18:34:10

第一种方法：

fo=open("sunstr.txt","r",encoding="utf-8")
sunstr=fo.read().lower()
for ch in ",.":sunstr.replace(ch," ")
sunstr = sunstr.split();
sunstrset = set(sunstr)dic = {}
for i in sunstrset:dic[i] = sunstr.count(i)
print(dic)for key in dic:print(key,dic[key]);wcList = list(dic.items())def tskeSecond(elem):return elem[1]wcList.sort(key=tskeSecond,reverse=True)
print(wcList)

　　

第二种方法：

def getTxt():txt = open("sunstr.txt").read()txt = txt.lower()for ch in '!"@#$%^&*()+,-./:;<=>?@[\\]_`~{|}':txt.replace(ch," ")return txt
# sunstr = sunstr.replace(","," ")sunstr = getTxt().split()
sunstrset = set(sunstr)dic = {}
for i in sunstrset:dic[i] = sunstr.count(i)
print(dic)for key in dic:print(key,dic[key]);wcList = list(dic.items())def tskeSecond(elem):return elem[1]wcList.sort(key=tskeSecond,reverse=True)
print(wcList)

　　

中文统计：

import jieba
word =open("123.txt","r",encoding="utf-8").read()for ch in "，。“”":word = word.replace(ch,"")word = jieba.cut(word)
word = list(word)
print(word)wordset =set(word)
worddic ={}for i in wordset:worddic[i]= word.count(i)
print(worddic)wcList = list(worddic.items())
wcList.sort(key=lambda x:x[1],reverse=True)
print(wcList)

　　

转载于:https://www.cnblogs.com/sunyubin/p/9790019.html

http://lihuaxi.xjx100.cn/news/236922.html

相关文章

spring体系

spring体系

2019独角兽企业重金招聘Python工程师标准>>> 一、spring从体系架构上分为 1. 基本组件框架组合：Spring Framework 2.专项领域应用组件：Spring Portfolio 这个Spring Portfolio主要应用满足于特定的的应用场合：包括了spring Securi…

阅读更多...

简单粗暴告诉你什么是区块链

简单粗暴告诉你什么是区块链

链客，专为开发者而生，有问必答！ 此文章来自区块链技术社区，未经允许拒绝转载。区块链是什么？它是如何工作的？ 比特币已经成为现代互联网的潮流 - 随之而来的是区块链。人们说区块链技术将导致互联网运作…

阅读更多...

Mybait缓存机制

Mybait缓存机制

MyBatis同大多数ORM框架一样，提供了一级缓存和二级缓存的支持。一级缓存：其作用域为session范围内，当session执行flush或close方法后，一级缓存会被清空。二级缓存：二级缓存和一级缓存机制相同，但是可以自…

阅读更多...

ES6基础之Array.fill函数

ES6基础之Array.fill函数

引子关注「时事」的同学都会注意到，ES6和TypeScript是时下「投资」的热门。作为一位老同学，我也注意到这一点，不断收集一些小东东，以备不时之需。正题本文中记录的是ES6为Array增加的fill()函数。其功能是，用户可以…

阅读更多...

Java堆内存分配与回收策略

Java堆内存分配与回收策略

java主要在堆上分配内存，而Java堆又分为新生代(YoungGen)和老年代(OldGen)两个部分，新生代又再分为Eden区和Survivor区两部分，本文根据java堆的划分，描述hotspot的内存分配策略。 GC垃圾收集分类 Minor GC: 发生在新生代中的垃圾…

阅读更多...

“区块链”究竟是什么

“区块链”究竟是什么

链客，专为开发者而生，有问必答！ 此文章来自区块链技术社区，未经允许拒绝转载。什么是区块链？ 说到区块链，就不得不说比特币。　　2008年底，比特币之父中本聪发表了一个关于他研究的电子现金…

阅读更多...

sass的继承，混合宏，占位符的用法总结

sass的继承，混合宏，占位符的用法总结

SCSS中混合宏使用 mixin mt($var){ margin-top: $var; }.block { include mt(5px);span { display:block; include mt(5px); } }extend如何工作 .icon {transition: background-color ease .2s;margin: 0 .5em;}.error-icon {extend .icon;/*错误图标指定的样式... */}.info-i…

阅读更多...

首例利用智能路由网关犯罪嫌疑人被捕:罪名流量劫持

首例利用智能路由网关犯罪嫌疑人被捕:罪名流量劫持

首例利用智能路由网关犯罪嫌疑人被捕:罪名流量劫持 https://tech.sina.cn/digi/nb/2018-05-15/detail-ihapkuvm0295695.d.html 上海市徐汇区人民检察院依法以破坏计算机信息系统罪对全市首例利用智能路由网关设备进行流量劫持的犯罪嫌疑人章某批准逮捕。经查，2018年…

阅读更多...

最新文章