


setlocale(LC_ALL, "");
wchar_t txt = L'\u2080';
wcout << txt << endl;
myfile << txt << endl;

setlocale(LC_ALL, "");
wcout << L"x₀₁" << endl;
myfile << L"x₀₁" << endl;

setlocale(LC_ALL, "");
wcout << "x₀₁" << endl;
myfile << "x₀₁" << endl;


字符/字符串编码和格式问题并不容易解决。祝玩得愉快。 - Jesper Juhl
在C++源代码中将非ASCII字符放置在双引号内是有风险的。你可能能够在键盘上输入并放置在双引号之间,但在运行时得到的可能不是你想要的结果。 - PaulMcKenzie
如果使用VStudio,Unicode是您项目设置中“字符集”字段的一个选项。另一个可能性是您使用的终端不支持Unicode,这将使您无法获得所需的结果。可能这个问题是一个重复 - alteredinstance
尝试使用UTF16BE(大端)。看起来下标字符是UTF-16,而不是32。我的参考资料 - alteredinstance
结果表明,涉及到读取源文件的设置似乎并没有太大帮助。 - Michael Luger

我发现这些事情很棘手,我从来不确定它是否适用于每个 Windows 版本和语言环境,但对我来说这样做很管用:
#include <Windows.h>
#include <io.h>     // _setmode
#include <fcntl.h>  // _O_U16TEXT

#include <clocale>  // std::setlocale 
#include <iostream>

// Unicode UTF-16, little endian byte order (BMP of ISO 10646)
constexpr char CP_UTF_16LE[] = ".1200";

constexpr wchar_t superscript(int v) {
    constexpr wchar_t offset = 0x2070;       // superscript zero as offset
    if (v == 1) return 0x00B9;               // special case
    if (v == 2 || v == 3) return 0x00B0 + v; // special case 2
    return offset + v;

constexpr wchar_t subscript(int v) {
    constexpr wchar_t offset = 0x2080; // subscript zero as offset
    return offset + v;

int main() {
    // set these before doing any other output:
    setlocale(LC_ALL, CP_UTF_16LE);
    _setmode(_fileno(stdout), _O_U16TEXT);

    // subscript
    for (int i = 0; i < 10; ++i)
        std::wcout << L'X' << subscript(i) << L' ';
    std::wcout << L'\n';

    // superscript
    for (int i = 0; i < 10; ++i)
        std::wcout << L'X' << superscript(i) << L' ';
    std::wcout << L'\n';    


X₀ X₁ X₂ X₃ X₄ X₅ X₆ X₇ X₈ X₉
X⁰ X¹ X² X³ X⁴ X⁵ X⁶ X⁷ X⁸ X⁹


#include <Windows.h>
#include <io.h>      // _setmode
#include <fcntl.h>   // _O_U16TEXT

#include <algorithm> // std::transform
#include <clocale>   // std::setlocale 
#include <iostream>

// Unicode UTF-16, little endian byte order (BMP of ISO 10646)
constexpr char CP_UTF_16LE[] = ".1200";

std::wstring wsup(const std::wstring& in) {
    std::wstring rv = in;

    std::transform(rv.begin(), rv.end(), rv.begin(),
        [](wchar_t ch) -> wchar_t {
            // 1, 2 and 3 can be put in any order you like
            // as long as you keep them in the top section
            if (ch == L'1') return 0x00B9;
            if (ch == L'2') return 0x00B2;
            if (ch == L'3') return 0x00B3;

            // ...but this must be here in the middle:
            if (ch >= '0' && ch <= '9') return 0x2070 + (ch - L'0');

            // put the below in any order you like,
            // in the bottom section
            if (ch == L'i') return 0x2071;
            if (ch == L'+') return 0x207A;
            if (ch == L'-') return 0x207B;
            if (ch == L'=') return 0x207C;
            if (ch == L'(') return 0x207D;
            if (ch == L')') return 0x207E;
            if (ch == L'n') return 0x207F;

            return ch; // no change
    return rv;

std::wstring wsub(const std::wstring& in) {
    std::wstring rv = in;

    std::transform(rv.begin(), rv.end(), rv.begin(),
        [](wchar_t ch) -> wchar_t {
            if (ch >= '0' && ch <= '9') return 0x2080 + (ch - L'0');
            if (ch == L'+') return 0x208A;
            if (ch == L'-') return 0x208B;
            if (ch == L'=') return 0x208C;
            if (ch == L'(') return 0x208D;
            if (ch == L')') return 0x208E;
            if (ch == L'a') return 0x2090;
            if (ch == L'e') return 0x2091;
            if (ch == L'o') return 0x2092;
            if (ch == L'x') return 0x2093;
            if (ch == 0x0259) return 0x2094; // small letter schwa: ə
            if (ch == L'h') return 0x2095;
            if (ch >= 'k' && ch <= 'n') return 0x2096 + (ch - 'k');
            if (ch == L'p') return 0x209A;
            if (ch == L's') return 0x209B;
            if (ch == L't') return 0x209C;

            return ch; // no change
    return rv;

int main() {
    std::setlocale(LC_ALL, CP_UTF_16LE);
    if (_setmode(_fileno(stdout), _O_U16TEXT) == -1) return 1;

    auto pstr = wsup(L"0123456789 +-=() ni");
    auto bstr = wsub(L"0123456789 +-=() aeoxə hklmnpst");

    std::wcout << L"superscript:   " << pstr << L'\n';
    std::wcout << L"subscript:     " << bstr << L'\n';

    std::wcout << L"an expression: x" << wsup(L"(n-1)") << L'\n';


superscript:   ⁰¹²³⁴⁵⁶⁷⁸⁹ ⁺⁻⁼⁽⁾ ⁿⁱ
subscript:     ₀₁₂₃₄₅₆₇₈₉ ₊₋₌₍₎ ₐₑₒₓₔ ₕₖₗₘₙₚₛₜ
an expression: x⁽ⁿ⁻¹⁾

我的控制台无法显示hklmnpst的下标版本 - 但显然转换是正确的,因为在复制/粘贴后它在这里正常显示。

经过修改,这个工作得非常好!对于那些事后发现这个问题的人来说,我的C++标准确实需要我将constexpr函数重写为单行返回语句。我还必须将wmain声明为extern "C",并且在编译器构建中添加“-municode”标志。谢谢! - Michael Luger
@MichaelLuger 不用谢!你可以从函数中删除 constexpr 部分。我只是认为,如果有人想要通过一些编译时生成的“好东西”来扩展它,将它们设为 constexpr 是很好的选择。- 将 wmain 重命名为 main 应该也没问题。我现在无法验证,但实际上我留下 wmain 只是出于错误。 - Ted Lyngmo
我刚刚检查了一下,wmain()或者main()都无所谓,就像我之前想的那样。另外,请注意有一个错误修复。我的旧版superscript返回了一个上标的i而不是1 - 但是我的眼睛太差没有发现它。 :) - Ted Lyngmo
是的,我已经编辑过了,修复了那个bug。但是我注意到代码无法输出到文件。我可以打印出字符,但是从上标或下标函数中得到的任何输出都会产生意外的结果:superscript(1) 会产生一个下标为1的1。superscript(2) 打印出了预期的字符。superscript(3) 则产生了 ł。我不确定具体发生了什么。subscript(2) 不会打印任何其他文本,只会让文件保持为空白。 - Michael Luger
我正在使用 wofstream - Michael Luger



例如,在Windows中,您可以使用SetConsoleOutputCP函数设置控制台代码页。 要查看不同编码的文件,您可以将文件添加到vs解决方案中,右键单击/使用编码打开源代码(文本),然后选择您的编码。

看起来这个字符是UTF-16,只需要做一个小修正。 - alteredinstance
我的注册表不幸没有UTF-8或-16的代码页。 - Michael Luger

