极简Python代码

[TOC]

重复元素判定

以下方法可以检查给定列表是不是存在重复元素,它会使用 set() 函数来移除所有重复元素

1
2
3
4
5
6
7
8
def all_unique(lst):
return len(lst) == len(set(lst))
x = [1, 1, 2, 2, 3, 2, 3, 4, 5, 6]
y = [1, 2, 3, 4, 5]
all_unique(x) ## False
all_unique(y) ## True

字符元素组成判定

检查两个字符串的组成元素是不是一样的

1
2
3
4
def anagram(first, second):
return Counter(first) == Counter(second)
anagram("abcd3", "3acdb") ## True

内存占用

下面的代码块可以检查变量 variable 所占用的内存

1
2
variable = 30
print(sys.getsizeof(variable)) ## 24

字节占用

下面的代码块可以检查字符串占用的字节数

1
2
3
4
5
def byte_size(string):
return len(string.encode('utf-8'))
byte_size('') ## 4
byte_size('Hello World') ## 11

打印 N 次字符串

该代码块不需要循环语句就能打印 N 次字符串

1
2
3
4
n = 2
s = "Programming"
print(s * n)
## ProgrammingProgramming

大写第一个字母

以下代码块会使用 title() 方法,从而大写字符串中每一个单词的首字母

1
2
3
s = "programming is awesome"
print(s.title())
## Programming Is Awesome

分块

给定具体的大小,定义一个函数以按照这个大小切割列表

1
2
3
4
5
6
7
def chunk(lst, size):
return list(
map(lambda x: lst[x * size:x * size + size],
list(range(0, ceil(len(lst) / size)))))
chunk([1, 2, 3, 4, 5], 2)
## [[1,2],[3,4],5]

压缩

这个方法可以将布尔型的值去掉,例如(False,None,0,“”),它使用 filter() 函数

1
2
3
4
5
def compact(lst):
return list(filter(bool, lst))
compact([0, 1, False, 2, '', 3, 'a', 's', 34])
## [ 1, 2, 3, 'a', 's', 34 ]

解包

如下代码段可以将打包好的成对列表解开成两组不同的元组

1
2
3
4
array = [['a', 'b'], ['c', 'd'], ['e', 'f']]
transposed = zip(*array)
print(transposed)
## [('a', 'c', 'e'), ('b', 'd', 'f')]

链式对比

我们可以在一行代码中使用不同的运算符对比多个不同的元素

1
2
3
a = 3
print(2 < a < 8) ## True
print(1 == a < 2) ## False

逗号连接

下面的代码可以将列表连接成单个字符串,且每一个元素间的分隔方式设置为了逗号

1
2
3
hobbies = ["basketball", "football", "swimming"]
print("My hobbies are: " + ", ".join(hobbies))
## My hobbies are: basketball, football, swimming

元音统计

以下方法将统计字符串中的元音 (‘a’, ‘e’, ‘i’, ‘o’, ‘u’) 的个数,它是通过正则表达式做的

1
2
3
4
5
def count_vowels(str):
return len(len(re.findall(r'[aeiou]', str, re.IGNORECASE)))
count_vowels('foobar') ## 3
count_vowels('gym') ## 0

首字母小写

如下方法将令给定字符串的第一个字符统一为小写

1
2
3
4
5
def decapitalize(string):
return str[:1].lower() + str[1:]
decapitalize('FooBar') ## 'fooBar'
decapitalize('FooBar') ## 'fooBar'

展开列表

该方法将通过递归的方式将列表的嵌套展开为单个列表

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def spread(arg):
ret = []
for i in arg:
if isinstance(i, list):
ret.extend(i)
else:
ret.append(i)
return ret
def deep_flatten(lst):
result = []
result.extend(
spread(list(map(lambda x: deep_flatten(x) if type(x) == list else x, lst))))
return result
deep_flatten([1, [2], [[3], 4], 5]) ## [1,2,3,4,5]

列表的差

该方法将返回第一个列表的元素,其不在第二个列表内。如果同时要反馈第二个列表独有的元素,还需要加一句 set_b.difference(set_a)

1
2
3
4
5
6
7
def difference(a, b):
set_a = set(a)
set_b = set(b)
comparison = set_a.difference(set_b)
return list(comparison)
difference([1, 2, 3], [1, 2, 4]) ## [3]

通过函数取差

如下方法首先会应用一个给定的函数,然后再返回应用函数后结果有差别的列表元素

1
2
3
4
5
6
7
def difference_by(a, b, fn):
b = set(map(fn, b))
return [item for item in a if fn(item) not in b]
difference_by([2.1, 1.2], [2.3, 3.4], floor) ## [1.2]
difference_by([{'x': 2}, {'x': 1}], [{'x': 1}], lambda v: v['x'])
## [ { x: 2 } ]

链式函数调用

你可以在一行代码内调用多个函数

1
2
3
4
5
6
7
8
def add(a, b):
return a + b
def subtract(a, b):
return a - b
a, b = 4, 5
print((subtract if a > b else add)(a, b)) ## 9

检查重复项

如下代码将检查两个列表是不是有重复项

1
2
3
4
5
6
7
def has_duplicates(lst):
return len(lst) != len(set(lst))
x = [1, 2, 3, 4, 5, 5]
y = [1, 2, 3, 4, 5]
has_duplicates(x) ## True
has_duplicates(y) ## False

合并两个字典

下面的方法将用于合并两个字典

1
2
3
4
5
6
7
8
9
def merge_two_dicts(a, b):
c = a.copy() ## make a copy of a
c.update(b) ## modify keys and values of a with the ones from b
return c
a = {'x': 1, 'y': 2}
b = {'y': 3, 'z': 4}
print(merge_two_dicts(a, b))
## {'y': 3, 'x': 1, 'z': 4}

在 Python 3.5 或更高版本中,我们也可以用以下方式合并字典

1
2
3
4
5
6
7
def merge_dictionaries(a, b):
return {**a, **b}
a = {'x': 1, 'y': 2}
b = {'y': 3, 'z': 4}
print(merge_dictionaries(a, b))
## {'y': 3, 'x': 1, 'z': 4}

将两个列表转化为字典

如下方法将会把两个列表转化为单个字典

1
2
3
4
5
6
7
def to_dictionary(keys, values):
return dict(zip(keys, values))
keys = ["a", "b", "c"]
values = [2, 3, 4]
print(to_dictionary(keys, values))
## {'a': 2, 'c': 4, 'b': 3}

使用枚举

我们常用 For 循环来遍历某个列表,同样我们也能枚举列表的索引与值

1
2
3
4
5
6
7
list = ["a", "b", "c", "d"]
for index, element in enumerate(list):
print("Value", element, "Index ", index, )
## ('Value', 'a', 'Index ', 0)
## ('Value', 'b', 'Index ', 1)
## ('Value', 'c', 'Index ', 2)
## ('Value', 'd', 'Index ', 3)

执行时间

如下代码块可以用来计算执行特定代码所花费的时间

1
2
3
4
5
6
7
8
9
start_time = time.time()
a = 1
b = 2
c = a + b
print(c) ## 3
end_time = time.time()
total_time = end_time - start_time
print("Time: ", total_time)
## ('Time: ', 1.1205673217773438e-05)

Try else

我们在使用 try/except 语句的时候也可以加一个 else 子句,如果没有触发错误的话,这个子句就会被运行

1
2
3
4
5
6
7
8
try:
2 * 3
except TypeError:
print("An exception was raised")
else:
print("Thank God, no exceptions were raised.")
## Thank God, no exceptions were raised.

元素频率

下面的方法会根据元素频率取列表中最常见的元素

1
2
3
4
5
def most_frequent(list):
return max(set(list), key=list.count)
list = [1, 2, 1, 2, 3, 2, 1, 4, 2]
most_frequent(list)

回文序列

以下方法会检查给定的字符串是不是回文序列,它首先会把所有字母转化为小写,并移除非英文字母符号。最后,它会对比字符串与反向字符串是否相等,相等则表示为回文序列。

1
2
3
4
5
6
def palindrome(string):
from re import sub
s = sub('[\W_]', '', string.lower())
return s == s[::-1]
palindrome('taco cat') ## True

不使用 if-else 的计算子

这一段代码可以不使用条件语句就实现加减乘除、求幂操作,它通过字典这一数据结构实现:

1
2
3
4
5
6
7
8
9
10
import operator
action = {
"+": operator.add,
"-": operator.sub,
"/": operator.truediv,
"*": operator.mul,
"**": pow
}
print(action['-'](50, 25)) ## 25

Shuffle

该算法会打乱列表元素的顺序,它主要会通过 Fisher-Yates 算法对新列表进行排序:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
from copy import deepcopy
from random import randint
def shuffle(lst):
temp_lst = deepcopy(lst)
m = len(temp_lst)
while (m):
m -= 1
i = randint(0, m)
temp_lst[m], temp_lst[i] = temp_lst[i], temp_lst[m]
return temp_lst
foo = [1, 2, 3]
shuffle(foo) ## [2,3,1] , foo = [1,2,3]

展开列表

将列表内的所有元素,包括子列表,都展开成一个列表

1
2
3
4
5
6
7
8
9
10
def spread(arg):
ret = []
for i in arg:
if isinstance(i, list):
ret.extend(i)
else:
ret.append(i)
return ret
spread([1, 2, 3, [4, 5, 6], [7], 8, 9]) ## [1,2,3,4,5,6,7,8,9]

交换值

不需要额外的操作就能交换两个变量的值

1
2
3
4
5
6
def swap(a, b):
return b, a
a, b = -1, 14
swap(a, b) ## (14, -1)
spread([1, 2, 3, [4, 5, 6], [7], 8, 9]) ## [1,2,3,4,5,6,7,8,9]

字典默认值

通过 Key 取对应的 Value 值,可以通过以下方式设置默认值。如果 get() 方法没有设置默认值,那么如果遇到不存在的 Key,则会返回 None

1
2
d = {'a': 1, 'b': 2}
print(d.get('c', 3)) ## 3

参考:
towardsdatascience