Namensräume
Varianten
Aktionen

std::mbrtowc

Von cppreference.com
< cpp‎ | string‎ | multibyte
 
 
 
 
Definiert in Header <cwchar>
std::size_t mbrtowc( wchar_t* pwc,

                     const char* s,
                     std::size_t n,

                     std::mbstate_t* ps );

Konvertiert ein schmales Multibyte-Zeichen in ein breites Zeichen.

Wenn s kein Null-Zeiger ist, werden höchstens n Bytes des Multibyte-Zeichenstrings inspiziert, beginnend mit dem Byte, auf das s zeigt, um die Anzahl der Bytes zu ermitteln, die zur Vervollständigung des nächsten Multibyte-Zeichens (einschließlich etwaiger Verschiebesequenzen) erforderlich sind. Wenn die Funktion feststellt, dass das nächste Multibyte-Zeichen in s vollständig und gültig ist, konvertiert sie es in das entsprechende breite Zeichen und speichert es in *pwc (falls pwc nicht null ist).

Wenn s ein Null-Zeiger ist, werden die Werte von n und pwc ignoriert und der Aufruf ist äquivalent zu std::mbrtowc(nullptr, "", 1, ps).

Wenn das erzeugte breite Zeichen das Nullzeichen ist, ist der in *ps gespeicherte Konvertierungszustand der initiale Verschiebezustand.

Inhalt

[bearbeiten] Parameter

pwc - Zeiger auf die Stelle, an der das resultierende breite Zeichen geschrieben wird
s - Zeiger auf den Mehrbyte-Zeichenstring, der als Eingabe verwendet wird
n - Grenze für die Anzahl der Bytes in s, die untersucht werden können
ps - Zeiger auf den Konvertierungszustand, der bei der Interpretation des Multibyte-Strings verwendet wird

[bearbeiten] Rückgabewert

Das erste der folgenden zutreffenden Elemente

  • 0, wenn das aus s konvertierte Zeichen (und, falls nicht null, in pwc gespeichert) das Nullzeichen war.
  • Die Anzahl der Bytes [1...n] des Mehrbyte-Zeichens, das erfolgreich aus s konvertiert wurde.
  • static_cast<std::size_t>(-2), wenn die nächsten n Bytes ein unvollständiges, aber bisher gültiges Multibyte-Zeichen darstellen. Es wird nichts in *pwc geschrieben.
  • static_cast<std::size_t>(-1), wenn ein Kodierungsfehler auftritt. Es wird nichts in *pwc geschrieben, der Wert EILSEQ wird in errno gespeichert und der Wert von *ps bleibt undefiniert.

[bearbeiten] Beispiel

#include <clocale>
#include <cstring>
#include <cwchar>
#include <iostream>
 
void print_mb(const char* ptr)
{
    std::mbstate_t state = std::mbstate_t(); // initial state
    const char* end = ptr + std::strlen(ptr);
    int len;
    wchar_t wc;
    while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0)
    {
        std::wcout << "Next " << len << " bytes are the character " << wc << '\n';
        ptr += len;
    }
}
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 narrow multibyte encoding
    const char* str = "z\u00df\u6c34\U0001d10b"; // or u8"zß水𝄋"
                      // or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
    print_mb(str);
}

Ausgabe

Next 1 bytes are the character z
Next 2 bytes are the character ß
Next 3 bytes are the character 水
Next 4 bytes are the character 𝄋

[bearbeiten] Siehe auch

konvertiert das nächste Multibyte-Zeichen in ein Wide-Zeichen
(Funktion) [bearbeiten]
konvertiert ein Wide-Zeichen in seine Multibyte-Darstellung, gegeben den Zustand
(Funktion) [bearbeiten]
[virtuell]
konvertiert eine Zeichenkette von ExternT nach InternT, z. B. beim Lesen aus einer Datei
(virtual protected member function of std::codecvt<InternT,ExternT,StateT>) [edit]
C-Dokumentation für mbrtowc