我希望你能够协助我理解什么是“monkey patching”或者说“monkey patch”?
它类似于方法/运算符重载或委托吗?
它与这些概念有何共同之处吗?
我希望你能够协助我理解什么是“monkey patching”或者说“monkey patch”?
它类似于方法/运算符重载或委托吗?
它与这些概念有何共同之处吗?
get_data
的类。这个方法对外部查找(例如数据库或Web API)进行操作,类中的其他各种方法都会调用它。但是,在单元测试中,您不希望依赖于外部数据源——因此,您可以动态地将get_data
方法替换为返回一些固定数据的存根。get_data
,它也会调用您的猴子补丁替换而不是原始版本,这可能是好事或坏事。只要小心即可。get_data
函数,那么在您替换它时,这个别名将不会改变其含义,并将继续指向原始的get_data
。(为什么?Python只会重新绑定您类中的名称get_data
到某个其他函数对象;其他名称绑定则不受任何影响。)get_data
"时,你是将名称get_data
重新绑定到模拟函数上。如果程序中的其他某个名称绑定到了之前被称为“get_data”的函数形式,在该名称处不会发生任何变化。 - Lutz Prechelt猴子补丁是一段 Python 代码,它在运行时(通常在启动时)扩展或修改其他代码。
一个简单的例子如下:
from SomeOtherProduct.SomeModule import SomeClass
def speak(self):
return "ook ook eee eee eee!"
SomeClass.speak = speak
来源:Zope wiki上的MonkeyPatch页面。
什么是猴子补丁?
简单来说,猴子补丁是在程序运行时对模块或类进行更改。
Pandas文档中有一个猴子补丁的例子:
import pandas as pd
def just_foo_cols(self):
"""Get a list of column names containing the string 'foo'
"""
return [x for x in self.columns if 'foo' in x]
pd.DataFrame.just_foo_cols = just_foo_cols # monkey-patch the DataFrame class
df = pd.DataFrame([list(range(4))], columns=["A","foo","foozball","bar"])
df.just_foo_cols()
del pd.DataFrame.just_foo_cols # you can also remove the new method
为了解释清楚,首先我们需要导入这个模块:import pandas as pd
接下来,我们创建一个方法定义,它存在于任何类定义的范围之外,并且是自由的(由于函数和未绑定方法之间的区别在Python 3中相当无意义,因此取消了未绑定方法):
def just_foo_cols(self):
"""Get a list of column names containing the string 'foo'
"""
return [x for x in self.columns if 'foo' in x]
接下来,我们只需将该方法附加到我们想要在其上使用它的类即可:
pd.DataFrame.just_foo_cols = just_foo_cols # monkey-patch the DataFrame class
然后我们可以在类的实例上使用这个方法,在完成后删除这个方法:
df = pd.DataFrame([list(range(4))], columns=["A","foo","foozball","bar"])
df.just_foo_cols()
del pd.DataFrame.just_foo_cols # you can also remove the new method
如果您使用名称混淆(使用双下划线前缀属性,改变名称,我不建议这样做),则如果这样做,您将不得不手动进行名称混淆。由于我不建议名称混淆,因此我不会在此处进行演示。
例如,我们如何在测试中使用这些知识呢?
假设我们需要模拟对外部数据源的数据检索调用,结果出现错误,因为我们想确保在这种情况下正确的行为。我们可以使用猴子补丁来确保这种行为。(所以使用与Daniel Roseman建议的相似的方法名:)
import datasource
def get_data(self):
'''monkey patch datasource.Structure with this to simulate error'''
raise datasource.DataRetrievalError
datasource.Structure.get_data = get_data
如果我们测试一个依赖于该方法引发错误的行为,那么如果实现正确,我们将在测试结果中获得该行为。
仅仅执行上述操作将会改变进程的整个生命周期中的Structure
对象,因此你需要在你的单元测试中使用设置和清除操作来避免这种情况,例如:
def setUp(self):
# retain a pointer to the actual real method:
self.real_get_data = datasource.Structure.get_data
# monkey patch it:
datasource.Structure.get_data = get_data
def tearDown(self):
# give the real method back to the Structure object:
datasource.Structure.get_data = self.real_get_data
虽然上述方法有效,但使用mock
库来修补代码可能是更好的选择。mock
的patch
装饰器比上述方法更不容易出错,因为它需要更少的代码行,从而减少了引入错误的机会。我还没有审查mock
中的代码,但我想它以类似的方式使用Monkey-Patching。
首先:在我看来,猴子补丁是一种不好的黑客技巧。
它通常用于替换模块或类级别上的方法,使用自定义实现。
最常见的用例是在您无法替换原始代码时,为模块或类中的错误添加解决方法。在这种情况下,您可以通过猴子补丁将“错误”的代码替换为您自己模块/包内部的实现。
猴子补丁只能在动态语言中实现,其中Python是一个很好的例子。在运行时改变方法而不是更新对象定义是一个例子;同样,在运行时添加属性(无论是方法还是变量)也被视为猴子补丁。通常在使用没有源代码的模块时进行这些操作,以便对象定义不能轻松地更改。
这被认为是不好的,因为它意味着对象的定义并不完全或准确地描述其真正的行为。
Monkey patching是在运行时重新打开现有类或类中的方法并更改其行为,应该谨慎使用,或者只有在真正需要时才使用。
由于Python是一种动态编程语言,类是可变的,因此可以重新打开它们并进行修改,甚至替换它们。
什么是猴子补丁? 猴子补丁是一种在运行时动态更新代码行为的技术。
为什么使用猴子补丁? 它允许我们在运行时修改或扩展库、模块、类或方法的行为,而不必实际修改源代码。
结论 猴子补丁是一种很酷的技术,现在我们已经学会了如何在Python中实现。但是,正如我们讨论过的那样,它也有自己的缺点,应该谨慎使用。