为什么在使用polyfit函数时会出现“ValueError:data type <class 'numpy.object_'> not inexact.”的错误?

7

我正在尝试为我的数据绘制趋势线,但是出现了错误。

ValueError: data type <class 'numpy.object_'> not inexact.  

有人能解释一下为什么吗?

我的数据帧是Us_corr3;

enter image description here
这是我的代码:

data5 = Us_corr3[['US GDP', 'US Unemployment']]

x = data5['US GDP']

y = data5['US Unemployment']

plt.scatter(x, y)


z = np.polyfit(x, y, 1)

p = np.poly1d(z)

plt.plot(x,p(x),"r--")

plt.show()

同时它还指出:

ValueError: data type <class 'numpy.object_'> not inexact.

请提供更多信息!data5.dtypes,完整的错误tracebackx是一个Seriesx.to_numpy()呢?shapedtype呢? - hpaulj
2个回答

5
如果从您的Series中派生的数组是“object” dtype,它会产生错误:
In [67]: np.polyfit(np.arange(3).astype(object),np.arange(3),1)                                      
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-67-787351a47e03> in <module>
----> 1 np.polyfit(np.arange(3).astype(object),np.arange(3),1)

<__array_function__ internals> in polyfit(*args, **kwargs)

/usr/local/lib/python3.6/dist-packages/numpy/lib/polynomial.py in polyfit(x, y, deg, rcond, full, w, cov)
    605     # set rcond
    606     if rcond is None:
--> 607         rcond = len(x)*finfo(x.dtype).eps
    608 
    609     # set up least squares equation for powers of x

/usr/local/lib/python3.6/dist-packages/numpy/core/getlimits.py in __new__(cls, dtype)
    380             dtype = newdtype
    381         if not issubclass(dtype, numeric.inexact):
--> 382             raise ValueError("data type %r not inexact" % (dtype))
    383         obj = cls._finfo_cache.get(dtype, None)
    384         if obj is not None:

ValueError: data type <class 'numpy.object_'> not inexact

这样的函数需要数值类型的数组。先清理一下你的数据框吧!


2
在您的回复后,我将数据从对象转换为浮点数。我使用了“x = data5 ['US GDP'] .astype(str).astype(float)”来处理x和y。它起作用了。非常感谢。 - Yunus Emre Kocabey
我的数据格式化为 Int32 而不是 int - 感谢您的提示。 - Nate

3
您可以使用x = list(x)将数据从numpy.object转换为float类型。
data5 = Us_corr3[['US GDP', 'US Unemployment']]
x = list(data5['US GDP'])
y = list(data5['US Unemployment'])

plt.scatter(x, y)
z = np.polyfit(x, y, 1)

p = np.poly1d(z)

plt.plot(x,p(x),"r--")

plt.show()

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接