如何使用连续值为`matplotlib`散点图上色[使用`seaborn`颜色调色板]?

22

我有一个散点图并希望根据另一个值(在本例中天真地分配给np.random.random())对其进行着色。

是否有一种使用seaborn将每个点的连续值(与正在绘制的数据直接关联)映射到连续渐变中的值的方法?

这是生成数据的代码:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
from sklearn import decomposition
import seaborn as sns; sns.set_style("whitegrid", {'axes.grid' : False})

%matplotlib inline
np.random.seed(0)

# Iris dataset
DF_data = pd.DataFrame(load_iris().data, 
                       index = ["iris_%d" % i for i in range(load_iris().data.shape[0])],
                       columns = load_iris().feature_names)

Se_targets = pd.Series(load_iris().target, 
                       index = ["iris_%d" % i for i in range(load_iris().data.shape[0])], 
                       name = "Species")

# Scaling mean = 0, var = 1
DF_standard = pd.DataFrame(StandardScaler().fit_transform(DF_data), 
                           index = DF_data.index,
                           columns = DF_data.columns)

# Sklearn for Principal Componenet Analysis
# Dims
m = DF_standard.shape[1]
K = 2

# PCA (How I tend to set it up)
Mod_PCA = decomposition.PCA(n_components=m)
DF_PCA = pd.DataFrame(Mod_PCA.fit_transform(DF_standard), 
                      columns=["PC%d" % k for k in range(1,m + 1)]).iloc[:,:K]
# Plot
fig, ax = plt.subplots()
ax.scatter(x=DF_PCA["PC1"], y=DF_PCA["PC2"], color="k")
ax.set_title("No Coloring")

输入图像描述

理想情况下,我希望能做到这样:

# Color classes
cmap = {obsv_id:np.random.random() for obsv_id in DF_PCA.index}

# Plot



fig, ax = plt.subplots()
ax.scatter(x=DF_PCA["PC1"], y=DF_PCA["PC2"], color=[cmap[obsv_id] for obsv_id in DF_PCA.index])
ax.set_title("With Coloring")

# ValueError: to_rgba: Invalid rgba arg "0.2965562650640299"
# to_rgb: Invalid rgb arg "0.2965562650640299"
# cannot convert argument to rgb sequence

但是它不喜欢连续的值。

我想使用如下的调色板:

sns.palplot(sns.cubehelix_palette(8))

输入图像描述

我也尝试过像下面这样的操作,但它没有意义,因为它不知道我在上面的字典中使用了哪些值:

ax.scatter(x=DF_PCA["PC1"], y=DF_PCA["PC2"],cmap=sns.cubehelix_palette(as_cmap=True)
2个回答

50
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

x, y, z = np.random.rand(3, 100)
cmap = sns.cubehelix_palette(as_cmap=True)

f, ax = plt.subplots()
points = ax.scatter(x, y, c=z, s=50, cmap=cmap)
f.colorbar(points)

输入图像简介


带有颜色条!是的,这正是我一直在寻找的。非常感谢 @mwaskom ヾ(⌐■_■)ノ♪ - O.rka
7
好的,谢谢。通过seaborn的hue参数有没有合理的方法来做到这一点呢?我尝试了一下,但是结果的图例并不太清晰,因为hue参数好像将连续变量的每个值都视为分类级别。 - user2428107

6
from matplotlib.cm import ScalarMappable
from matplotlib.colors import Normalize


cmap = {obsv_id:np.random.random() for obsv_id in DF_PCA.index}
sm = ScalarMappable(norm=Normalize(vmin=min(list(cmap.values())), vmax=max(list(cmap.values()))), cmap=sns.cubehelix_palette(as_cmap=True))

# Plot
fig, ax = plt.subplots()
ax.scatter(x=DF_PCA["PC1"], y=DF_PCA["PC2"], color=[sm.to_rgba(cmap[obsv_id]) for obsv_id in DF_PCA.index])
ax.set_title("With Coloring")

enter image description here


如果有更简单的方法,不需要导入“ScalarMappable”和“Normalize”,那么我一定会选择它作为正确答案。 - O.rka

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接