Namensräume
Varianten
Aktionen

std::c32rtomb

Von cppreference.com
< cpp‎ | string‎ | multibyte
 
 
 
 
Definiert in Header <cuchar>
std::size_t c32rtomb( char* s, char32_t c32, std::mbstate_t* ps );
(seit C++11)

Konvertiert ein UTF-32-Zeichen in seine schmale Multibyte-Repräsentation.

Wenn s kein Nullzeiger ist, ermittelt die Funktion die Anzahl der Bytes, die zur Speicherung der Multibyte-Zeichenrepräsentation von c32 erforderlich sind (einschließlich aller Verschiebesequenzen und unter Berücksichtigung des aktuellen Multibyte-Konvertierungsstatus *ps), und speichert die Multibyte-Zeichenrepräsentation im Zeichenarray, dessen erstes Element von s gezeigt wird, wobei *ps bei Bedarf aktualisiert wird. Maximal MB_CUR_MAX Bytes können von dieser Funktion geschrieben werden.

Wenn s ein Nullzeiger ist, ist der Aufruf äquivalent zu std::c32rtomb(buf, U'\0', ps) für einen internen Puffer `buf`.

Wenn c32 das Null-Breitzeichen U'\0' ist, wird ein Null-Byte gespeichert, dem jede Verschiebesequenz vorangestellt ist, die erforderlich ist, um den anfänglichen Verschiebezustand wiederherzustellen, und der Konvertierungsstatusparameter *ps wird aktualisiert, um den anfänglichen Verschiebezustand darzustellen.

Die von dieser Funktion verwendete Multibyte-Kodierung wird durch die aktuell aktive C-Locale bestimmt.

Inhalt

[bearbeiten] Parameter

s - Zeiger auf das schmale Zeichenarray, in dem das Multibyte-Zeichen gespeichert wird
c32 - das zu konvertierende 32-Bit-Zeichen
ps - Zeiger auf das Konvertierungszustandsobjekt, das bei der Interpretation des Multibyte-Strings verwendet wird

[bearbeiten] Rückgabewert

Bei Erfolg gibt die Anzahl der Bytes (einschließlich aller Verschiebesequenzen) zurück, die in das Zeichenarray geschrieben wurden, dessen erstes Element von s gezeigt wird. Dieser Wert kann 0 sein, z. B. bei der Verarbeitung des ersten char32_t in einer Multi-char32_t-Zeichensequenz (tritt in UTF-32 nicht auf).

Bei einem Fehler (wenn c32 kein gültiges 32-Bit-Zeichen ist) wird -1 zurückgegeben, EILSEQ in errno gespeichert und *ps in einem nicht spezifizierten Zustand belassen.

[bearbeiten] Beispiel

#include <climits>
#include <clocale>
#include <cuchar>
#include <iomanip>
#include <iostream>
#include <string_view>
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    std::u32string_view strv = U"zß水🍌"; // or z\u00df\u6c34\U0001F34C
    std::cout << "Processing " << strv.size() << " UTF-32 code units: [ ";
    for (char32_t c : strv)
        std::cout << std::showbase << std::hex << static_cast<int>(c) << ' ';
    std::cout << "]\n";
 
    std::mbstate_t state{};
    char out[MB_LEN_MAX]{};
    for (char32_t c : strv)
    {
        std::size_t rc = std::c32rtomb(out, c, &state);
        std::cout << static_cast<int>(c) << " converted to [ ";
        if (rc != (std::size_t) - 1)
            for (unsigned char c8 : std::string_view{out, rc})
                std::cout << +c8 << ' ';
        std::cout << "]\n";
    }
}

Ausgabe

Processing 4 UTF-32 code units: [ 0x7a 0xdf 0x6c34 0x1f34c ]
0x7a converted to [ 0x7a ]
0xdf converted to [ 0xc3 0x9f ]
0x6c34 converted to [ 0xe6 0xb0 0xb4 ]
0x1f34c converted to [ 0xf0 0x9f 0x8d 0x8c ]

[bearbeiten] Siehe auch

(C++11)
konvertiert ein schmales Multibyte-Zeichen in UTF-32-Kodierung
(Funktion) [bearbeiten]
[virtuell]
konvertiert eine Zeichenkette von InternT nach ExternT, z. B. beim Schreiben in eine Datei
(virtual protected member function of std::codecvt<InternT,ExternT,StateT>) [edit]
C-Dokumentation für c32rtomb