详解python数据结构和算法
1.删除序列相同元素并保持顺序
如果仅仅就是想消除重复元素,通常可以简单的构造一个集合,利用集合之间元素互不相同的特性就可以消除重复,但是这种方法生成的结果中元素的位置会被打乱。下面是我们的解决方案:
def dedupe(items, key=None): seen = set() for item in items: val = item if key is None else key(item) if val not in seen: yield item seen.add(val)
主要思想就是构造一个集合,然后遍历该列表,如果当前元素不存在集合中就将该元素返回。
yiled时python中构造生成器的关键字。碰到yiled就返回该变量,下一次则从yiled之后的语句开始执行。
使用示例:
注:我们构造的dedupe函数返回的是生成器对象,需要用list转化成可直接输出的列表。
该函数也可以用来文件去除重复行:
with open('my.log','r') as f: for item in dedupe(f): print(item)
2.过滤元素序列
问题--------你有一个数据序列,想利用一些规则从中提取出需要的值或者是缩短序列
方法一:最简单的过滤序列元素的方法就是使用列表推导。比如我们想从下列列表中提取正数:
mylist = [1, 4, -5, 10, -7, 2, 3, -1] newlist = [n for n in mylist if n > 0] print(newlist)
方法二:生成器迭代
使用列表推导的一个潜在缺陷就是如果输入非常大的时候会产生一个非常大的结果集,占用大量内存。 如果你对内存比较敏感,那么你可以使用生成器表达式迭代产生过滤的元素。
mylist = [1, 4, -5, 10, -7, 2, 3, -1] pos = (n for n in mylist if n > 0) print(pos) print(list(pos)) #迭代器不可以直接输出,需要转换成list才可以看到结果
运行结果:
方法三:过滤规则比较复杂,不能简单的在列表推导或者生成器表达式中表达出来时需要考虑使用内建的filter函数。这时候你可以将过滤代码放到一个函数中, 然后使用内建的 filter() 函数。示例如下:
values = ['1', '2', '-3', '-', '4', 'N/A', '5'] def is_int(val): try: x = int(val) return True except ValueError: return False ivals = list(filter(is_int, values)) print(ivals) # Outputs ['1', '2', '-3', '4', '5']
以上所述是小编给大家介绍的python数据结构和算法详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
相关文章
Python Numpy运行报错:IndexError: too many in
在使用Numpy进行数组操作时,经常会遇到各种错误,其中,IndexError: too many indices for array是一种常见的错误,它通常发生在尝试使用一个过多维度的索引来访问一个较低维度的数组时,本文介绍了Python Numpy报错的解决办法,需要的朋友可以参考下2024-07-07Python中staticmethod和classmethod的作用与区别
今天小编就为大家分享一篇关于Python中staticmethod和classmethod的作用与区别,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧2018-10-10
最新评论