您现在的位置:新闻首页>资本 > 什么样的函数才叫 Pythonic
什么样的函数才叫 Pythonic
python视频教程栏目介绍Pythonic。
在机器学习中,我们经常需要使用类和函数定义模型的各个部分,例如定义读取数据的函数、预处理数据的函数、模型架构和训练过程的函数等等。那么什么样的函数才是漂亮的、赏心悦目的代码呢?本期教程,会从命名到代码量等六方面探讨如何养成美妙的函数。文末有给大家录的视频教程,大家可以按需学习,不清楚的地方也可以留言!
与多数现代编程语言一样,在 Python 中,函数是抽象和封装的基本方法之一。你在开发阶段或许已经写过数百个函数,但并非每个函数都生而平等。写出「糟糕的」函数会直接影响代码的可读性和可维护性。那么,什么样的函数是「糟糕的」函数呢?更重要的是,要怎么写出**「好的」**函数呢?
简单回顾
数学中充满了函数,尽管我们可能记不住它们。首先来回忆一下大家最喜欢的话题——微积分。你可能记得这个方程式:f(x) = 2x + 3. 这是一个叫做「f」的函数,含有一个未知数 x,「返回」2*x+3。这个函数可能和我们在 Python 中看到的不一样,但它的基本思想和计算机语言中的函数是一样的。
函数在数学中历史悠久,但在计算机科学中更加神通广大。尽管如此,函数还是存在一些缺陷。接下来我们将讨论一下什么是「好的」函数,以及在出现什么样的征兆时我们需要重构函数。
决定函数好坏的关键
好的 Python 函数与蹩脚 Python 函数的区别是什么?「好」函数的定义之多让人惊讶。从我们的目的出发,我会把好的 Python 函数定义为符合以下清单中大部分规则的函数(有些比较难实现):
命名合理具有单一功能包含文档注释返回一个值代码不超过 50 行幂等,尽可能是纯函数
对很多人来说,这个列表可能有些过于严格。但我保证,如果你的函数符合这些规则,你的代码看起来会非常漂亮。下面我将分步讲解各个规则,然后总结这些规则如何构成一个「好」函数。
命名
关于这个问题,我最喜欢的一句话(出自 Phil Karlton,总被误以为是 Donald Knuth 说的)是:
在计算机科学中只有两个难题:缓存失效和命名问题。
听起来有点匪夷所思,但整个不错的命名真的很难。下面就有一个糟糕的函数命名:
def get_knn(from_df):复制代码
我基本上在任何地方都见过糟糕的命名,但这个例子来自数据科学(或者说,机器学习),从业者总是在 Jupyter notebook 上写代码,然后尝试将那些不同的单元变成一个可理解的程序。
该函数命名的第一个问题是使用首字母缩写/缩略词。比起缩略词和并未普及的首字母缩写,完整的英语单词会更好。使用缩写的唯一原因是为了节省打字时间,但现代的编辑器都有自动补全功能,所以你只需键入一次全名。之所以说缩写是一个问题,是因为它们通常只能用于特定领域。在上面的代码中,knn 是指「K-Nearest Neighbors」,df 指的是「DataFrame」——无处不在的 Pandas 数据结构。如果另外一个不太熟悉这些缩写的编程人员正在阅读代码,那 TA 就会一头雾水。
关于这个函数名称,还有另外两个小问题:单词「get」无关紧要。对于大多数命名比较好的函数,很明显函数会返回一些东西,其名字会反映这一点。from_df 也是不必要的。如果参数的名称描述不够清楚的话,函数的文档注释或者类型注释将描述参数类型。
那我们如何重新命名这个函数呢?例如:
def k_nearest_neighbors(dataframe):复制代码
现在,即使是外行也知道这个函数在计算什么了,参数的名称(dataframe)也清楚地告诉我们应该传递什么类型的参数。
单一功能原则
「单一功能原则」来自 Bob Martin「大叔」的一本书,不仅适用于类和模块,也同样适用于函数(Martin 最初的目标)。该原则强调,函数应该具有「单一功能」。也就是说,一个函数应该只做一件事。这么做的一大原因是:如果每个函数只做一件事,那么只有在函数做那件事的方式必须改变时,该函数才需要改变。当一个函数可以被删除时,事情就好办了:如果其他地方发生改动,不再需要该函数的单一功能,那么只需将其删除。
举个例子来解释一下。以下是一个不止做一件「事」的函数:
这一函数做两件事:计算一组关于数字列表的统计数据,并将它们打印到 STDOUT。该函数违反了只有一个原因能让函数改变的原则。显然有两个原因可以让该函数做出改变:新的或不同的数据需要计算或输出的格式需要改变。最好将该函数写成两个独立的函数:一个用来执行并返回计算结果;另一个用来接收结果并将其打印出来。函数有多重功能的一个致命漏洞是函数名称中含有单词「and」
这种分离还可以简化针对函数行为的测试,而且它们不仅被分离成一个模块中的两个函数,还可能在适当情况下存在于不同的模块中。这使得测试更加清洁、维护更加简单。
只做两件事的函数其实非常罕见。更常见的情况是一个函数负责许多许多任务。再次强调一下,为可读性、可测试性起见,我们应该将这些「多面手」函数分成一个一个的小函数,每个小函数只负责一项任务。
文档注释
很多 Python 开发者都知道 PEP-8,它定义了 Python 编程的风格指南,但很少有人了解定义了文档注释风格的 PEP-257。在这里并不会详细介绍 PEP-257,读者可详细阅读该指南所约定的文档注释风格。
PEP-8:PEP-257:
首先文档注释是在定义模块、函数、类或方法的第一段字符串声明,这一段字符串应该需要描述清楚函数的作用、输入参数和返回参数等。PEP-257 的主要信息如下:
每一个函数都需要一个文档描述;使用合适的语法和标点,书写完整的句子;最开始需要用一句话总结函数的主要作用;使用规定性的语言而不是描述性的语言。
在编写函数时,遵循这些规则很容易。我们只需要养成编写文档注释的习惯,并在实际写函数主体之前完成它们。如果你不能清晰地描述这个函数的作用是什么,那么你需要更多地考虑为什么要写这个函数。
返回值
函数可以且应该被视为一个独立的小程序。它们以参数的形式获取一些输入,并返回一些输出值。当然,参数是可选的,但是从 Python 内部机制来看,返回值是不可选的。即使你尝试创建一个不会返回值的函数,我们也不能选择不在内部采用返回值,因为 Python 的解释器会强制返回一个 None。不相信的读者可以用以下代码测试:
❯ python3 Python 3.7.0 (default, Jul 23 2018, 20:22:55) [Clang 9.1.0 (clang-902.0.39.2)] on darwin Type "help", "copyright", "credits" or "license" *for *more information. >>> def add(a, b): ... print(a + b) ... >>> b = add(1, 2) 3 >>> b >>> b is None True复制代码
运行上面的代码,你会看到 b 的值确实是 None。所以即使我们编写一个不包含 return 语句的函数,它仍然会返回某些东西。不过函数也应该要返回一些东西,因为它也是一个小程序。没有输出的程序又会有多少用,我们又如何测试它呢?
我甚至希望发表以下声明:每一个函数都应该返回一个有用的值,即使这个值仅可用来测试。我们写的代码应该需要得到测试,而不带返回值的函数很难测试它的正确性,上面的函数可能需要重定向 I/O 才能得到测试。此外,返回值能改变方法的调用,如下代码展示了这种概念:
with open('foo.txt', 'r') as input_file: for line in input_file: if line.strip().lower().endswith('cat'): # ... do something useful with these lines复制代码
代码行 if line.strip().lower().endswith('cat') 能够正常运行,因为字符串方法 (strip(), lower(), endswith()) 会返回一个字符串以作为调用函数的结果。
以下是人们在被问及为什么他们写的函数没有返回值时给出的一些常见原因:
「函数所做的就是类似 I/O 的操作,例如将一个值保存到数据库中,这种函数不能返回有用的输出。」
我并不同意这种观点,因为在操作成功完成时,函数可以返回 True。
「我需要返回多个值,因为只返回一个值并不能代表什么。」
当然也可以返回包含多个值的一个元组。简而言之,即使在现有的代码库中,从函数返回一个值肯定是一个好主意,并且不太可能破坏任何东西。
函数长度
函数的长度直接影响了可读性,因而会影响可维护性。因此要保证你的函数长度足够短。50 行的函数对我而言是个合理的长度。
如果函数遵循单一功能原则,一般而言其长度会非常短。如果函数是纯函数或幂等函数(下面会讨论),它的长度也会较短。这些想法对于构造简洁的代码很有帮助。
那么如果一个函数太长该怎么办?代码重构(refactor)!代码重构很可能是你写代码时一直在做的事情,即使你对这个术语并不熟悉。它的含义是:在不改变程序行为的前提下改变程序的结构。因此从一个长函数提取几行代码并转换为属于该函数的函数也是一种代码重构。这也是将长函数缩短最快和最常用的方法。只要适当给这些新函数命名,代码的阅读将变得更加容易。
幂等性和函数纯度
幂等函数(idempotent function)在给定相同变量参数集时会返回相同的值,无论它被调用多少次。函数的结果不依赖于非局部变量、参数的易变性或来自任何 I/O 流的数据。以下的 add_three(number) 函数是幂等的:
def add_three(number): """Return *number* + 3.""" return number + 3复制代码
无论何时调用 add_three(7),其返回值都是 10。以下展示了非幂等的函数示例:
def add_three(): """Return 3 + the number entered by the user.""" number = int(input('Enter a number: ')) return number + 3复制代码
这函数不是幂等的,因为函数的返回值依赖于 I/O,即用户输入的数字。每次调用这个函数时,它都可能返回不同的值。如果它被调用两次,则用户可以第一次输入 3,第二次输入 7,使得对 add_three() 的调用分别返回 6 和 10。
为什么幂等很重要?
可测试性和可维护性。幂等函数易于测试,因为它们在使用相同参数的情况下会返回同样的结果。测试就是检查对函数的不同调用所返回的值是否符合预期。此外,对幂等函数的测试很快,这在单元测试(Unit Testing)中非常重要,但经常被忽视。重构幂等函数也很简单。不管你如何改变函数以外的代码,使用同样的参数调用函数所返回的值都是一样的。
什么是「纯」函数?
在函数编程中,如果函数是幂等函数且没有明显的副作用(side effect),则它就是纯函数。记住,幂等函数表示在给定参数集的情况下该函数总是返回相同的结果,不能使用任何外部因素来计算结果。但是,这并不意味着幂等函数无法影响非局部变量(non-local variable)或 I/O stream 等。例如,如果上文中 add_three(number) 的幂等版本在返回结果之前先输出了结果,它仍然是幂等的,因为它访问了 I/O stream,这不会影响函数的返回值。调用 print() 是副作用:除返回值以外,与程序或系统中其余部分的交互。
我们来扩展一下 add_three(number) 这个例子。我们可以用以下代码片段来查看 add_three(number) 函数被调用的次数:
add_three_calls = 0 def add_three(number): """Return *number* + 3.""" global add_three_calls print(f'Returning {number + 3}') add_three_calls += 1 return number + 3 def num_calls(): """Return the number of times *add_three* was called.""" return add_three_calls复制代码
现在我们向控制台输出结果(一项副作用),并修改了非局部变量(又一项副作用),但是由于这些副作用不影响函数的返回值,因此该函数仍然是幂等的。
纯函数没有副作用。它不仅不使用任何「外来数据」来计算值,也不与系统/程序的其它部分进行交互,除了计算和返回值。因此,尽管我们新定义的 add_three(number) 仍是幂等函数,但它不再是纯函数。
纯函数不记录语句或 print() 调用,不使用数据库或互联网连接,不访问或修改非局部变量。它们不调用任何其它的非纯函数。
总之,纯函数无法(在计算机科学背景中)做到爱因斯坦所说的「幽灵般的远距效应」(spooky action at a distance)。它们不以任何形式修改程序或系统的其余部分。在命令式编程中(写 Python 代码就是命令式编程),它们是最安全的函数。它们非常好测试和维护,甚至在这方面优于纯粹的幂等函数。测试纯函数的速度与执行速度几乎一样快。而且测试很简单:没有数据库连接或其它外部资源,不要求设置代码,测试结束后也不需要清理什么。
显然,幂等和纯函数是锦上添花,但并非必需。即,由于上述优点,我们喜欢写纯函数或幂等函数,但并不是所有时候都可以写出它们。关键在于,我们本能地在开始部署代码的时候就想着剔除副作用和外部依赖。这使得我们所写的每一行代码都更容易测试,即使并没有写纯函数或幂等函数。
总结
写出好的函数的奥秘不再是秘密。只需按照一些完备的最佳实践和经验法则。希望本期教程能够帮助到大家。
相关免费学习:python视频教程
下一篇:多线程比单线程快,是真的吗?
-
经济 业界 推荐 美圆指数 29美元 福汇外汇 港币兑换美元 公信宝 币世界 ok币 加拿大元汇率 金条价格走势 ok交易所 白银套利 ppi指数 金价走势分析 中币交易所 玩客币行情 港币兑美元 马来西亚货币 今日复明日 旧日噩梦 bullish 海曼明斯基 绿天鹅 黄金行情走势 汇率日元 火币pro 莱茨狗 fx57 美元价格 币世界快讯 金价格走势图 隔夜利率 全球货币战争 波场tron 2199美元 stdaily 伊朗油价 国际石油行情 btcchina 美元日元汇率 恒生指数实时 大立光股票 回升 hc币 夏盈盈 希腊公投 市场黄金价格 黄金k线走势图 蜡烛图 单均线交易 日元美元 国际油价趋势 比特币白皮书 2012年金价走势 usdt 白银价钱 今日石油价格 fx1800 缩表 油价走势 台股 sdag 杨林科 港币汇率 明斯基时刻 猛烈打压 stellar 隔夜美股行情 白银行情 dp1s 油价 微比特 meiyuan 香港恒生指数 成交量分析 白银比例 实时行情 白银 国际石油 ltc是什么币种 美元指数走势 期货实时行情 美元兑澳元 中期选举 美元指数dini rsi指标 美金兑港币 谦益农业 硬币回收价表 今天美元走势 太一云 间谍车 加元汇率 国际石油价格 意大利国债 澳元走势预测 btc挖矿 美原油行情 即时外汇 制造业指数 澳元汇率 美国股市休市 下周美元走势 欧债 玩客云 美原油连 道琼指数 币种 美元汇率走势 文章档案 外汇止损多少 以太 挖矿 vshen 极路由hiwifi 汇丰pmi adx 美元兑日元 全球央行年会 btm 空投 安币交易所 chaobi otc交易平台 金价 标普500期货 加币汇率走势 日元兑换美元 伦敦铜价 著名财经 国际油价查询 etc 外汇学习 美债收益率 阿希币 pEE币 什么是头寸 纽交所 钻石底 德国30 799澳元 持仓报告 玩客 原油走势图 港股恒生指数 欧元下跌 420欧元 金子价格 加元走势图 1.11111E+11 xrp 美元指数k线图 金价走势预测 最新黄金价格 铜价格走势图 黄金降价 汇率欧元 金针探底 原油成本 美元 strllar 泰奇猫 圈牌 金价走势 以太币 lme铜实时行情 eos价格走势 欧元兑美金 外汇基本知识 联邦基金利率 伦敦银走势图 基本面分析 空头回补 云鱼 py6是什么货币 rsi指标详解 265万澳元 国际油价格 gateio wti原油走势图 门罗币 白银价格走势 欧盟财长会议 外汇咨询 交叉盘 外汇初学 房价指数 cbt 比特股 ltc 隐私政策 石油危机 日圆汇率 英国股市指数 原油最新价格 行情报价 自动减支 黄金市场价 全球指数 imtoken 币投资 10美金 eos币价格 相对强弱指标 黄金年走势图 美原油 加元美元 虚拟币 值多少钱 国际油价 外汇哈里森 外汇交易分析 白银价格分析 日bi btcc 标准普尔500 wti原油价格 zbcom 和币 度宇宙 技术指标分析 全球股市指数 币久 白银价格趋势 克龙 银行回收硬币 hiwifi 贝尔链 美元兑换欧元 后座议员 黄金市场行情 德拉基讲话 UES 道琼斯k线图 美元对日元 k线图分析 恒生指数 英国脱欧时间 港股指数 比特币之父 bin 今日原油 jinjia 日经225指数 比特币价格 英镑汇率 742 大立光 外汇走势 上吊线 趣步APP被调查 肖野 理财三 铜走势图 艾达 吞阳 coinex 欧元美金 赵长鹏 法郎汇率 9g游戏 英国脱欧结果 硅谷bbs 俄罗斯火星人 铜价 什么叫头寸
-
起拍 军事 校本 越南盾汇率 鉴前世之兴衰 全球股市指数 UES 民警 高校 以太币 最高 特色 涉税 adx 今日恒生指数 不止 胳膊 突尼斯 挂牌 相撞 再次 rsi指标 李笑来 区间交易法 火币比特币 742 银行回收硬币 cbt 吞阳 40年 俩坑 火锅 过人 空砍 离开 信 小米 依然 查询 明细 港币兑换美元 如何挖比特币 fx 加拿大就业 值多少钱 etc vshen 火币pro 美媒 警方 砸伤 餐饮 腾讯 索尼 人才培养 清单 诋毁 高考 冰雪 体育用品 大立光股票 ppi指数 汇率走势 黄金价格行情 盈亏平衡点 eos什么意思 关于黄金交易 ouyuan 非美货币 508888 欧洲峰会 台股 美元兑澳元 全球货币战争 sdag btm 原油新闻 普京连线 签署 拍卖 30岁 人用 打印机 花样 红包 衣品 连接 柏林 法官 又讲 仅数 40个 一体 导致 汇丰pmi 自动减支 苏格兰公投 2599澳元 福汇外汇 极路由x 今日美股 eos价格走势 eos币价格 外汇咨询 艾达 挖矿 美国 强征 警员 你吗 微博 沉没 彻底 靓号 3万 对方 赢了 24人 欧冠 派出所 身 解 2.5% 怎样 心痛 横扫 在的 美国总统 孤立 广东 大阪 国际石油 外汇初学 fx1800 央行喊话空头 俄罗斯物价 墨西哥比索 黄金趋势 瑞士法郎汇率 美元兑英镑 coinegg 股市行情图 bitebi 什么叫头寸 台湾股票查询 黄金市场价 btcc 美元兑日元 全球央行年会 油价走势 xrp 杨林科 dp1s 美国股市休市 公布 打爆 规模 妻子 发布 微信 哪些 招生 能上 依法 上海 亲子 献金 中方 18岁 日本 核实 疏影 由于 背带 29日 技你 电池 客户端 班主任 阅卷 包括 产业 全栖 传奇 业界 50个基点是多少 行情报价 420欧元 汇率日元 加拿大元汇率 净多头头寸 海曼明斯基 澳元走势 黄金价钱 莱特币矿池 gwallet 道琼斯指 itc 元宝币交易 钯金价格走势 西班牙大选 美国纳斯达克 12334 外汇买卖入门 英格兰银行 法郎汇率 欧元走势 肖野 趣步APP被调查 lme铜实时行情 油价走势图 德国30 比特股 wti原油走势图 9g游戏 英国脱欧结果 日bi 圈牌 k线图分析 hiwifi pEE币 制造业指数 国际油价格 最新黄金价格 澳元走势预测 meiyuan 钻石底 日元兑换美元 间谍车 播控云 新时代 税延型 课堂 沦丧 救援 还在 交警 2018 fashion 5万 揭秘 搭载 地方 日期 还是 剑客 淑女的品格 发表声明 长相 候选人 退出 各界 措施 表明 20倍 这位 姐姐 6.1级 户型 下周美元走势 stdaily 美金兑港币 港币汇率 美原油行情 实时国际金价 单均线交易 rsi指标详解 熊路
-
火锅 即时外汇牌价 当天 关于黄金交易 12334 日圆汇率 台股 间谍车 突尼斯 bullish fx vshen 体育用品 缩表 莱茨狗 老赖 火币比特币 美原油连 中币交易所 微比特 胳膊 fashion 空投 查询 蜡烛图 著名财经 w底形态 比特币白皮书 全球货币战争 搭载 大立光股票 adx 什么是头寸 金价 日元美元 创造 效率 又放 btcc 银行回收硬币 对比 白银比例 2599澳元 伊朗油价 比特币挖矿机 猛烈打压 欧债 外汇咨询 阿希币 拍卖 处去 顺序 汇丰pmi 单均线交易 白银行情 eos什么意思 瑞士法郎汇率 今日美股 742 eos币价格 金价走势预测 外汇止损多少 etc 币种 成交量分析 国际油价格 以太币 硬币回收价表 美国股市休市 钱却 救援 代人 普爱 来了 rsi指标 白银价钱 李笑来 k线图技术分析 区间交易法 美国国债利率 英格兰银行 欧元美金 欧元下跌 欧元兑美金 ltc 泰奇猫 美元指数走势 澳元走势预测 太一云 热线 最高 草色 俩坑 慈善 衣品 信 清单 好酒 自动减支 汇率走势 隔夜美股行情 ouyuan 如何挖比特币 g7集团 玩客猴 459美元 欧洲峰会 德国30 英国脱欧时间 hiwifi xrp 起拍 获赔 美元 科学 选科分 高校 孤立 想干 包括 外汇初学 美金兑港币 黄金走势 苏格兰公投 期货实时行情 wti原油价格 黄金市场行情 技术指标分析 黄金降价 比特币价格 联邦基金利率 伦敦铜价 10美金 原油走势图 制造业指数 美元指数dini 吞阳 美元兑澳元 sdag 挖矿 打爆 微博 2018 地方 秦岭 高考 汇率欧元 国际油价查询 eunice k线图解读 btc行情 非美货币 bitebi btctrade 肖野 eos价格走势 美元对日元 265万澳元 伦敦银走势图 硅谷bbs 日bi 文章档案 以太 加币汇率走势 公布 身陷 餐饮 哪些 青年 美国总统 40个 国际油价 国际石油 欧盟财长会议 港股实时行情 xunleiyun 瑞士货币 今日日历 欧美黄金 贝尔链 趣步APP被调查 黄金市场价 美元兑换欧元 道琼斯k线图 标准普尔500 港股恒生指数 UES 恒生指数 9g游戏 外汇交易分析 全球央行年会 虚拟币 白银价格走势 空头回补 日元兑换美元 澳元汇率 民警 抓住 用户 创新 品牌 揭秘 18岁 Find 6.1级 以太坊 英镑走势分析 coinegg 508888 极路由x 什么叫头寸 和币 理财三 比特股 英国脱欧结果 铜价格走势图 k线图分析 美原油 比特币之父 德拉基讲话 美债收益率 国际油价趋势 btm 对方 老太 流畅 化工 中乒 淑女的品格 多门 相撞 脱贫 背带 大阪 已致 冰雪 张思聪 420欧元 美元汇率走势 黄金价格行情 150019 欧盟会议 道琼斯指 比特币交易 黄金etf是什么 币投资 台湾股票查询 度宇宙 imtoken 铜走势图 标普500期货 交叉盘 ism制造业指数 欧冠 派出所 未来 过人 招生 人才培养 赛场 离开 税务 大火 依然 户型 美国指数 澳洲大选 gasstation







