python幼功——filter函数

作者:编程技术
  1. Python内建的filter()函数用于过滤序列。

    map()类似(可参考 Python 高阶函数 -- map/reduce),filter()也接收一个函数和一个序列。和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。

    例如,在一个list中,删掉偶数,只保留奇数,可以这么写:

    def is_odd(n):
        return n % 2 == 1
    
    list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
    # 结果: [1, 5, 9, 15]
    

     

  2. 用filter求素数

    计算素数的一个方法是埃氏筛法,它的算法理解起来非常简单:

    首先,列出从2开始的所有自然数,构造一个序列:

    2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

    取序列的第一个数2,它一定是素数,然后用2把序列的2的倍数筛掉:

    3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

    取新序列的第一个数3,它一定是素数,然后用3把序列的3的倍数筛掉:

    5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

    取新序列的第一个数5,然后用5把序列的5的倍数筛掉:

    7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

    不断筛下去,就可以得到所有的素数。

    用Python来实现这个算法,可以先构造一个从3开始的奇数序列:

    def _odd_iter():
        n = 1
        while True:
            n = n   2
            yield n
    

    注意这是一个生成器,并且是一个无限序列。(关于生成器,请参考廖雪峰的另一篇文章)

    然后定义一个筛选函数:

    def _not_divisible(n):
        return lambda x: x % n > 0
    

    最后,定义一个生成器,不断返回下一个素数:

    def primes():
        yield 2
        it = _odd_iter() # 初始序列
        while True:
            n = next(it) # 返回序列的第一个数
            yield n
            it = filter(_not_divisible(n), it) # 构造新序列
    

    这个生成器先返回第一个素数2,然后,利用filter()不断产生筛选后的新的序列。

    由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件:

    # 打印1000以内的素数:
    for n in primes():
        if n < 1000:
            print(n)
        else:
            break
    

    注意到Iterator是惰性计算的序列,所以我们可以用Python表示“全体自然数”,“全体素数”这样的序列,而代码非常简洁。

  3. 练习
    回数是指从左向右读和从右向左读都是一样的数,例如12321909。请利用filter()筛选出回数:

    # -*- coding: utf-8 -*-
    def is_palindrome(n):
        s = str(n)
        count = 0
        length = len(s)
        half = int(length/2) #eg. 1234321 ->half num:3
        flag = True
        while count< half:
            if s[count] == s[length-count-1] :
                count  =1
                continue
            else:
                flag=False
                break
        return flag
    

小结

filter()的作用是从一个序列中筛出符合条件的元素。由于filter()使用了惰性计算,所以只有在取filter()结果的时候,才会真正筛选并每次返回下一个筛出的元素。

  1. 利用map()函数,把用户输入的不规范的英文名字,变为首字母大写,其他小写的规范名字。输入:['adam', 'LISA', 'barT'],输出:['Adam', 'Lisa', 'Bart']: 

    list(map(lambda x: x.capitalize(), ['adam', 'LISA', 'barT'])) ['Adam', 'Lisa', 'Bart']

详细内容请参考廖雪峰官网,此处只是一些摘抄,心得与练习的coding。

 

小练习:

    # 测试:
    output = filter(is_palindrome, range(1, 1000))
    print('1~1000:', list(output))
    if list(filter(is_palindrome, range(1, 200))) == [1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 22, 33,
                                                      44, 55, 66, 77, 88, 99, 101, 111, 121,
                                                      131, 141, 151, 161, 171, 181, 191]:
        print('测试成功!')
    else:
        print('测试失败!')

 

用filter求素数

  计算素数的一个方法是埃氏筛法,它的算法理解起来非常简单:

   首先,列出从2开始的所有自然数,构造一个序列:

    2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

   取序列的第一个数2,它一定是素数,然后用2把序列的2的倍数筛掉:

    3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

   取新序列的第一个数3,它一定是素数,然后用3把序列的3的倍数筛掉:

    5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

   取新序列的第一个数5,然后用5把序列的5的倍数筛掉:

    7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

   不断筛下去,就可以得到所有的素数。

     用Python来实现这个算法,可以先构造一个从3开始的奇数序列:

#用filter求素数
#可以先构造一个从3开始的奇数序列:(从3开始的偶数序列都不是素数)

def _odd_iter():
    n=1
    while True:
        n =2
        yield n         #构造一个生成器,并且是一个无限序列

 

  注意这是一个生成器,并且是一个无限序列

   然后定义一个筛选函数:

#定义一个筛选函数
def _not_divisible(n):
    return lambda x:x%n >0 

#Lambda表示生成一个匿名函数
#带有一个参数的Lambda表达式和对应的非匿名函数:

#举例:
#    def f(n):  
#        return lambda x: x / n  
#print ( f(1)(2) )   # n=1; x=2  

 

  最后,定义一个生成器,不断返回下一个素数:

#最后,定义一个生成器,不断返回下一个素数
def primes():
    yield 2            #先返回第一个素数2,然后利用filter()函数不断产生筛选后的新序列
    it=_odd_iter()
    while True:
        n=next(it)    #取出序列的第一个数
        yield n        #返回序列的第一个数

        it=filter(_not_divisible,it)    #此处用_not_divisible()函数去作用it列表中的每一个数(设为x),
        #则函数实际的模样为_not_divisible(n)(x),函数所执行的操作为:x%n >0,当可以整除时,丢弃,当不能整除时,筛选出来

  

  这个生成器先返回第一个素数2,然后,利用filter()不断产生筛选后的新的序列。

   由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件

#打印1000以内的素数:        
def main():
    for n in primes():
        if n<1000:
            print(n)
        else:
            break


if __name__=='__main__':
    main()

'''
如果我们是直接执行某个.py文件的时候,该文件中那么”__name__ == '__main__'“是True,
但是我们如果从另外一个.py文件通过import导入该文件的时候,
这时__name__的值就是我们这个py文件的名字而不是__main__。

这个功能还有一个用处:调试代码的时候,在”if __name__ == '__main__'“中加入一些我们的调试代码,
我们可以让外部模块调用的时候不执行我们的调试代码,但是如果我们想排查问题的时候,
直接执行该模块文件,调试代码能够正常运行
'''    

  

  注意到Iterator是惰性计算的序列,所以我们可以用Python表示“全体自然数”,“全体素数”这样的序列,而代码非常简洁。

reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)

练习

  回数是指从左向右读和从右向左读都是一样的数,例如12321909。请利用filter()滤掉非回数:

#练习
'''
回数是指从左向右读和从右向左读都是一样的数,例如12321,909。
请利用filter()滤掉非回数:
'''

def is_palindrome(n):
    return str(n)==str(n)[::-1]        #将输入的数字转为字符串,将翻转前和翻转后的进行比较,如果一致,表示满足回数

print('1-15000的回数有:')    
print(list(filter(is_palindrome,range(1,15000))))

  运行结果:

  图片 1

 

  1. 函数逻辑更加清晰,参数‘f’就表明了对元素的操作
  2. map是高阶函数,可以执行抽象度更高的运算  

 

map()作为高阶函数,事实上它把运算规则抽象了,因此,我们不但可以计算简单的f(x)=x2,还可以计算任意复杂的函数,比如,把这个list所有数字转为字符串:

python基础——filter函数

  

  Python内建的filter()函数用于过滤序列。

  map()类似,filter()也接收一个函数和一个序列。和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素

  例如,在一个list中,删掉偶数,只保留奇数,可以这么写:

#在一个list中,删掉偶数,只保留奇数

def is_odd(n):
    return n%2==1

L1=filter(is_odd,[1,2,3,4,5,6,7,8,9,10,15])
print(list(L1))
#输出:[1,3,5,7,9,15]

  把一个序列中的空字符串删掉,可以这么写:

#把一个序列的空字符串删掉
def not_empty(s):
    return s.strip()

L2=filter(not_empty, ['A', '', 'B', 'C', '  '])
print(list(L2))
#输出结果:['A','B','C']

'''
strip()函数说明:
----------------------------------------------------------------------
s.strip(rm)        删除s字符串中开头、结尾处,位于 rm删除序列的字符
s.lstrip(rm)       删除s字符串中开头处,位于 rm删除序列的字符
s.rstrip(rm)      删除s字符串中结尾处,位于 rm删除序列的字符
注意:
1. 当rm为空时,默认删除空白符(包括'n', 'r',  't',  ' ')
-----------------------------------------------------------------------
'''

 

   可见用filter()这个高阶函数,关键在于正确实现一个“筛选”函数。

  注意到filter()函数返回的是一个Iterator,也就是一个惰性序列,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list

reduce把一个函数作用在一个序列[x1, x2, x3, ...]上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算,其效果就是:  

 

reduce(lambda x, y: x * 10   y, [1, 3, 5, 7, 9])
13579

  2. Python提供的sum()函数可以接受一个list并求和,请编写一个prod()函数,可以接受一个list并利用reduce()求积:

二、 reduce

def f(x):
    return x * x
r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
list(r)
[1, 4, 9, 16, 25, 36, 49, 64, 81]

比方说对一个序列求和,就可以用reduce实现:

图片 2

class filter(object):
    """
    filter(function or None, iterable) --> filter object

    Return an iterator yielding those items of iterable for which function(item)
    is true. If function is None, return the items that are true.
    """

 

举例说明,比如我们有一个函数f(x)=x2,要把这个函数作用在一个list [1, 2, 3, 4, 5, 6, 7, 8, 9]上,就可以用map()实现如下:

from functools import reduce

def str2int(s):
    def fn(x, y):
        return x * 10   y
    def char2num(s):
        return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
    return reduce(fn, map(char2num, s))
#使用lambda匿名函数
list(map(lambda x: x * x, [1, 2, 3, 4, 5, 6, 7, 8, 9]))    
[1, 4, 9, 16, 25, 36, 49, 64, 81]

Python内建的filter()函数用于过滤序列。

 

map()类似,filter()也接收一个函数和一个序列。和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。

def is_odd(n):
    return n % 2 == 1
list(filter(is_odd, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
[1, 3, 5, 7, 9]

  

匿名函数实现:

from functools import reduce
def add(x, y):
    return x   y
reduce(add, [1, 3, 5, 7, 9])
25

用filter求素数

计算素数的一个方法是埃氏筛法,它的算法理解起来非常简单:

首先,列出从2开始的所有自然数,构造一个序列:

2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取序列的第一个数2,它一定是素数,然后用2把序列的2的倍数筛掉:

3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取新序列的第一个数3,它一定是素数,然后用3把序列的3的倍数筛掉:

5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取新序列的第一个数5,然后用5把序列的5的倍数筛掉:

7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

不断筛下去,就可以得到所有的素数。

用Python来实现这个算法,可以先构造一个从3开始的奇数序列:

def _odd_iter():
    n = 1
    while True:
        n = n   2
        yield n

注意这是一个生成器,并且是一个无限序列。

然后定义一个筛选函数:

def _not_divisible(n):
    return lambda x: x % n > 0

最后,定义一个生成器,不断返回下一个素数:

def primes():
    yield 2
    it = _odd_iter()    #初始序列
    while True:
        n = next(it)    #返回序列的第一个数
        yield n
        it = filter(_n

这个生成器先返回第一个素数2,然后,利用filter()不断产生筛选后的新的序列。

由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件:

#打印100以内的素数
for n in primes():
    if n < 100:
        print(n)
    else:
        break

2
3
5
7
11
13
17
19
23
29
31
37
41
43
47
53
59
61
67
71
73
79
83
89
97

注意到Iterator是惰性计算的序列,所以我们可以用Python表示“全体自然数”,“全体素数”这样的序列,而代码非常简洁。

小练习:

  1. 回数是指从左向右读和从右向左读都是一样的数,例如12321909。请利用filter()滤掉非回数:

    list(filter(lambda x: str(x) == str(x)[::-1], range(1,1000))) [1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 22, 33, 44, 55, 66, 77, 88, 99, 101, 111, 121, 131, 141, 151, 161, 171, 181, 191, 202, 212, 222, 232, 242, 252, 262, 272, 282, 292, 303, 313, 323, 333, 343, 353, 363, 373, 383, 393, 404, 414, 424, 434, 444, 454, 464, 474, 484, 494, 505, 515, 525, 535, 545, 555, 565, 575, 585, 595, 606, 616, 626, 636, 646, 656, 666, 676, 686, 696, 707, 717, 727, 737, 747, 757, 767, 777, 787, 797, 808, 818, 828, 838, 848, 858, 868, 878, 888, 898, 909, 919, 929, 939, 949, 959, 969, 979, 989, 999]

  思路:先将int数字类型转换为str字符串类型,然后比较原字符串和取反后的字符串是否相等来返回值。

  

  

参考资料:

廖雪峰的官方网站

帮助很大,非常感谢!

  

  

  

  

  

  

  

  

  

  

  

实例:

from functools import reduce
def fn(x, y):
    return x * 10   y
def char2num(s):
    return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
reduce(fn, map(char2num, '13579'))
13579

匿名函数实现:

from functools import reduce

def char2num(s):
    return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]

def str2int(s):
    return reduce(lambda x, y: x * 10   y, map(char2num, s))
def prod(l):
    return reduce(lambda x, y: x * y, l)
l = [1, 2 ,3, 4, 5]
print(prod(l))
120

注意到filter()函数返回的是一个Iterator,也就是一个惰性序列,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list。

from functools import reduce
def char2num(s):
    return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
def str_split(s):
    s1, s2 = s.split('.')
    return s1, s2
def str2int_1(s1):
    return reduce(lambda x, y: x * 10   y, map(char2num, s1))
def str2int_2(s2):
    return (reduce(lambda x, y: x * 10   y, map(char2num, s2)))/pow(10, len(s2))
def str2float(s):
    s1, s2 = str_split(s)
    res = str2int_1(s1)   str2int_2(s2)
    return res
a = str2float('123.456')
print(a)
123.456

把一个序列中的空字符串删掉,可以这么写:

同样可以加入匿名函数:

匿名函数的形式:

map函数的优点:

map()传入的第一个参数是f,即函数对象本身。由于结果r是一个IteratorIterator是惰性序列,因此通过list()函数让它把整个序列都计算出来并返回一个list。

def reduce(function, sequence, initial=None): # real signature unknown; restored from __doc__
    """
    reduce(function, sequence[, initial]) -> value

    Apply a function of two arguments cumulatively to the items of a sequence,
    from left to right, so as to reduce the sequence to a single value.
    For example, reduce(lambda x, y: x y, [1, 2, 3, 4, 5]) calculates
    ((((1 2) 3) 4) 5).  If initial is present, it is placed before the items
    of the sequence in the calculation, and serves as a default when the
    sequence is empty.
    """
    pass

整理成一个str2int的函数就是:

reduce(lambda x, y : x   y, [1, 3, 5, 7, 9])
25

当然求和运算可以直接用Python内建函数sum(),没必要动用reduce

map()函数接收两个参数,一个是函数,一个是Iterablemap将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回。  

但是如果要把序列[1, 3, 5, 7, 9]变换成整数13579reduce就可以派上用场:

 三、filter

  3. 利用mapreduce编写一个str2float函数,把字符串'123.456'转换成浮点数123.456:  

Python内置函数,用法及说明如下:

class map(object):
    """
    map(func, *iterables) --> map object

    Make an iterator that computes the function using arguments from
    each of the iterables.  Stops when the shortest iterable is exhausted.
    """

可见用filter()这个高阶函数,关键在于正确实现一个“筛选”函数。

一、map

例如,在一个list中,删掉偶数,只保留奇数,可以这么写:

这个例子本身没多大用处,但是,如果考虑到字符串str也是一个序列,对上面的例子稍加改动,配合map(),我们就可以写出把str转换为int的函数:

reduce(lambda x, y: x * y, [1, 2, 3, 4, 5])
120
list(filter(lambda x: x % 2 == 1, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
[1, 3, 5, 7, 9]

 

  

list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
['1', '2', '3', '4', '5', '6', '7', '8', '9']

还可以用lambda函数进一步简化成:

  匿名函数实现:

from functools import reduce
def fn(x, y):
    return x * 10   y
reduce(fn, [1, 3, 5, 7, 9])
13579
def not_empty(s):
    return s and s.strip()
list(filter(not_empty, ['A', '', 'B', None, 'C', ' ']))
['A', 'B', 'C']
list(filter(lambda x: x and x.strip(), ['A', '', 'B', None, 'C', ' ']))
['A', 'B', 'C']

 

本文由分分快三计划发布,转载请注明来源

关键词: 分分快三计划 python filter()函数