在绘图中为多条线指定颜色

4

Pandas dataframe groupby plot

我有一个类似于上述问题的数据框,但它有大约8个股票代码。我定义了一个名为“colors”的颜色列表与这些股票对应,但当我执行以下操作时:

df.groupby('ticker')['adj_close'].plot(color=colors)

每个股票在图表上的所有线条颜色都相同(即列表“colors”中的第一种颜色)。

我想知道如何指定每个股票的线条颜色为列表“colors”中对应的颜色?

1个回答

2
  • 如果你不需要聚合计算,例如 mean,那么就不需要使用 pandas.groupby
  • 不要使用 .groupby,而是使用带有参数 hue='ticker'seaborn.lineplot
  • Seaborn 是一个基于 matplotlib 的 Python 数据可视化库,提供了高级接口以绘制具有吸引力和信息性的统计图形。
  • Seaborn: 选择颜色调色板
    • 此图使用的是 husl 调色板。
    • 可以在seaborn.husl_palette找到 husl 调色板的其他选项。
  • 重复答案之间的差异:
    • 重复答案更改了所有图形的颜色。
    • 这里创建了一个字典,将特定的颜色映射到特定的类别。

导入和示例数据

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import pandas_datareader.data as web  # for getting stock data

# get test stock data
tickers = ['msft', 'aapl', 'twtr', 'intc', 'tsm', 'goog', 'amzn', 'fb', 'nvda']
df = pd.concat((web.DataReader(ticker, data_source='yahoo', start='2019-01-31', end='2020-07-21').assign(ticker=ticker) for ticker in tickers), ignore_index=False).reset_index()

选项1

  • 根据唯一的'ticker'值数量来映射颜色
# create color mapping based on all unique values of ticker
ticker = df.ticker.unique()
colors = sns.color_palette('husl', n_colors=len(ticker))  # get a number of colors
cmap = dict(zip(ticker, colors))  # zip values to colors

# plot
plt.figure(figsize=(16, 10))
sns.lineplot(x='Date', y='Adj Close', hue='ticker', data=df, palette=cmap)

在此输入图片描述

选项 2

  • 使用具体的颜色
colors = ['r', 'b', 'g', 'y', 'orange', 'purple', 'k', 'm', 'w']

plt.figure(figsize=(16, 10))
sns.lineplot(x='Date', y='Adj Close', hue='ticker', data=df, palette=colors)

enter image description here

df.head()

|    | Date                |   High |    Low |   Open |   Close |      Volume |   Adj Close | ticker   |
|---:|:--------------------|-------:|-------:|-------:|--------:|------------:|------------:|:---------|
|  0 | 2019-01-31 00:00:00 | 105.22 | 103.18 | 103.8  |  104.43 | 5.56364e+07 |     102.343 | msft     |
|  1 | 2019-02-01 00:00:00 | 104.1  | 102.35 | 103.78 |  102.78 | 3.55357e+07 |     100.726 | msft     |
|  2 | 2019-02-04 00:00:00 | 105.8  | 102.77 | 102.87 |  105.74 | 3.13151e+07 |     103.627 | msft     |
|  3 | 2019-02-05 00:00:00 | 107.27 | 105.96 | 106.06 |  107.22 | 2.73254e+07 |     105.077 | msft     |
|  4 | 2019-02-06 00:00:00 | 107    | 105.53 | 107    |  106.03 | 2.06098e+07 |     103.911 | msft     |

df.tail()

|      | Date                |   High |    Low |   Open |   Close |      Volume |   Adj Close | ticker   |
|-----:|:--------------------|-------:|-------:|-------:|--------:|------------:|------------:|:---------|
| 3334 | 2020-07-15 00:00:00 | 417.32 | 402.23 | 416.57 |  409.09 | 1.00996e+07 |      409.09 | nvda     |
| 3335 | 2020-07-16 00:00:00 | 408.27 | 395.82 | 400.6  |  405.39 | 8.6241e+06  |      405.39 | nvda     |
| 3336 | 2020-07-17 00:00:00 | 409.94 | 403.51 | 409.02 |  408.06 | 6.6571e+06  |      408.06 | nvda     |
| 3337 | 2020-07-20 00:00:00 | 421.25 | 406.27 | 410.97 |  420.43 | 7.1213e+06  |      420.43 | nvda     |
| 3338 | 2020-07-21 00:00:00 | 422.4  | 411.47 | 420.52 |  413.14 | 6.9417e+06  |      413.14 | nvda     |

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接