cout << setw 不与 åäö 正确对齐

13
以下代码重现了我的问题:
#include <iostream>
#include <iomanip>
#include <string>

void p(std::string s, int w)
{
   std::cout << std::left << std::setw(w) << s;
}

int main(int argc, char const *argv[])
{
   p("COL_A", 7);
   p("COL_B", 7);
   p("COL_C", 5);
   std::cout << std::endl;
   p("ABC", 7);
   p("ÅÄÖ", 7);
   p("ABC", 5);
   std::cout << std::endl;
   return 0;
}

这将产生以下输出:

COL_A  COL_B  COL_C
ABC    ÅÄÖ ABC

如果我在代码中将“ÅÄÖ”更改为例如“ABC”,那么它就可以工作:

COL_A  COL_B  COL_C
ABC    ABC    ABC  

为什么会发生这种情况?


2
尝试打印您字符串的长度。 - user1084944
5个回答

7

除了为std::wcout赋予适当的语言环境外,您可能还需要切换到宽字符串。例如:

void p(std::wstring s, int w)
{
   std::wcout << std::left << std::setw(w) << s;
}

int main(int argc, char const *argv[])
{
   setlocale(LC_ALL, "en_US.utf8");
   std::locale loc("en_US.UTF-8");
   std::wcout.imbue(loc);

   p(L"COL_A", 7);
   p(L"COL_B", 7);
   p(L"COL_C", 5);
   std::wcout << std::endl;
   p(L"ABC", 7);
   p(L"ÅÄÖ", 7);
   p(L"ABC", 5);
   std::wcout << std::endl;
   return 0;
}

Demo


6

这是因为那些字符(Ä,Ö,...)是Unicode字符,很可能被编码为UTF-8。这意味着每个字符占用多个字节(在您的情况下为两个字节,在一般情况下最高可达四个字节)。然而setw不知道UTF-8——它只计算并对齐字节。


4

C++20中的std::format将正确处理此内容。

  std::cout << std::format("{:7}{:7}{:5}\n", "COL_A", "COL_B", "COL_C");
  std::cout << std::format("{:7}{:7}{:5}\n", "ABC", "ÅÄÖ", "ABC");

输出:

COL_A  COL_B  COL_C
ABC    ÅÄÖ    ABC  

与此同时,您可以使用基于{fmt}库std::format。{fmt}还提供了print函数,使这个过程更加轻松和高效(godbolt):

#include <fmt/core.h>

int main() {
  fmt::print("{:7}{:7}{:5}\n", "COL_A", "COL_B", "COL_C");
  fmt::print("{:7}{:7}{:5}\n", "ABC", "ÅÄÖ", "ABC");
}

免责声明:我是{fmt}和C++20 std::format的作者。


2

问题在于您的源代码肯定是存储在UTF8中,这意味着ÅÄÖ的每个字母需要2个字节,并且cout的区域设置没有相应设置。

因此,您的cout认为它输出3x2=6个字符,并仅添加一个空格以达到预期的7个字符。使用imbue()更改区域设置以将其设置为UTF8。


0

这适用于带重音的拉丁字母和CJK字符:

#include <iomanip>
#include <iostream>
#include <string>
#include <wchar.h>

typedef decltype(std::setw(0)) setw_type;

setw_type
setww(int w, std::wstring s)
{
  auto delta = wcswidth(s.c_str(), s.length()) - s.length();
  return std::setw(w - delta);
}

void
print_wstring(std::wstring s, int w)
{
  std::wcout << setww(w, s) << s;
}

int
main(int argc, char * argv[])
{
  auto locale_string = "zh_CN.utf8";
  setlocale(LC_ALL, locale_string);
  std::locale loc(locale_string);
  std::wcout.imbue(loc);
  print_wstring(L"|一二三四", 9);
  print_wstring(L"|一二三四", 9);
  std::wcout << std::endl;
  print_wstring(L"公道", 9);
  print_wstring(L"自在人心", 9);
  std::wcout << std::endl;
}

结果:

g++ test01.cpp -o test01.exe  && ./test01.exe
|一二三四|一二三四
    公道 自在人心

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接