python统计文本字符串里单词出现频率的方法

 更新时间:2015年05月26日 16:45:49   作者:依山带水  
这篇文章主要介绍了python统计文本字符串里单词出现频率的方法,涉及Python字符串操作的相关技巧,需要的朋友可以参考下

本文实例讲述了python统计文本字符串里单词出现频率的方法。分享给大家供大家参考。具体实现方法如下:

# word frequency in a text
# tested with Python24  vegaseat  25aug2005
# Chinese wisdom ...
str1 = """Man who run in front of car, get tired.
Man who run behind car, get exhausted."""
print "Original string:"
print str1
print
# create a list of words separated at whitespaces
wordList1 = str1.split(None)
# strip any punctuation marks and build modified word list
# start with an empty list
wordList2 = []
for word1 in wordList1:
  # last character of each word
  lastchar = word1[-1:]
  # use a list of punctuation marks
  if lastchar in [",", ".", "!", "?", ";"]:
    word2 = word1.rstrip(lastchar)
  else:
    word2 = word1
  # build a wordList of lower case modified words
  wordList2.append(word2.lower())
print "Word list created from modified string:"
print wordList2
print
# create a wordfrequency dictionary
# start with an empty dictionary
freqD2 = {}
for word2 in wordList2:
  freqD2[word2] = freqD2.get(word2, 0) + 1
# create a list of keys and sort the list
# all words are lower case already
keyList = freqD2.keys()
keyList.sort()
print "Frequency of each word in the word list (sorted):"
for key2 in keyList:
 print "%-10s %d" % (key2, freqD2[key2])

希望本文所述对大家的Python程序设计有所帮助。

相关文章

  • python中zip()方法应用实例分析

    python中zip()方法应用实例分析

    这篇文章主要介绍了python中zip()方法的应用,实例分析了使用zip()方法创建字典的相关技巧,需要的朋友可以参考下
    2016-04-04
  • Python 将Matrix、Dict保存到文件的方法

    Python 将Matrix、Dict保存到文件的方法

    今天小编就为大家分享一篇Python 将Matrix、Dict保存到文件的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • 简单谈谈Python中的反转字符串问题

    简单谈谈Python中的反转字符串问题

    本文给大家总结了5种可以实现python中反转字符串的方法,非常的实用,有需要的小伙伴可以参考下
    2016-10-10
  • python 如何对Series中的每一个数据做运算

    python 如何对Series中的每一个数据做运算

    这篇文章主要介绍了python 实现对Series中的每一个数据做运算操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • Python模拟百度自动输入搜索功能的实例

    Python模拟百度自动输入搜索功能的实例

    今天小编就为大家分享一篇Python模拟百度自动输入搜索功能的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • 树莓派安装OpenCV3完整过程的实现

    树莓派安装OpenCV3完整过程的实现

    这篇文章主要介绍了树莓派安装OpenCV3完整过程的实现,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-10-10
  • python+selenium实现自动抢票功能实例代码

    python+selenium实现自动抢票功能实例代码

    Selenium是ThoughtWorks公司的一个强大的开源Web功能测试工具系列,采用Javascript来管理整个测试过程,包括读入测试套件、执行测试和记录测试结果。这篇文章主要介绍了python+selenium实现自动抢票,需要的朋友可以参考下
    2018-11-11
  • tensorflow如何继续训练之前保存的模型实例

    tensorflow如何继续训练之前保存的模型实例

    今天小编就为大家分享一篇tensorflow如何继续训练之前保存的模型实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • Python数据获取实现图片数据提取

    Python数据获取实现图片数据提取

    本文主要介绍了Python数据获取实现图片数据提取,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-05-05
  • python自动生成model文件过程详解

    python自动生成model文件过程详解

    这篇文章主要介绍了python自动生成model文件过程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值
    2019-11-11

最新评论