std::mbrtowc
| Definiert in Header <cwchar> |
||
| std::size_t mbrtowc( wchar_t* pwc, const char* s, |
||
Konvertiert ein schmales Multibyte-Zeichen in ein breites Zeichen.
Wenn s kein Null-Zeiger ist, werden höchstens n Bytes des Multibyte-Zeichenstrings inspiziert, beginnend mit dem Byte, auf das s zeigt, um die Anzahl der Bytes zu ermitteln, die zur Vervollständigung des nächsten Multibyte-Zeichens (einschließlich etwaiger Verschiebesequenzen) erforderlich sind. Wenn die Funktion feststellt, dass das nächste Multibyte-Zeichen in s vollständig und gültig ist, konvertiert sie es in das entsprechende breite Zeichen und speichert es in *pwc (falls pwc nicht null ist).
Wenn s ein Null-Zeiger ist, werden die Werte von n und pwc ignoriert und der Aufruf ist äquivalent zu std::mbrtowc(nullptr, "", 1, ps).
Wenn das erzeugte breite Zeichen das Nullzeichen ist, ist der in *ps gespeicherte Konvertierungszustand der initiale Verschiebezustand.
Inhalt |
[bearbeiten] Parameter
| pwc | - | Zeiger auf die Stelle, an der das resultierende breite Zeichen geschrieben wird |
| s | - | Zeiger auf den Mehrbyte-Zeichenstring, der als Eingabe verwendet wird |
| n | - | Grenze für die Anzahl der Bytes in s, die untersucht werden können |
| ps | - | Zeiger auf den Konvertierungszustand, der bei der Interpretation des Multibyte-Strings verwendet wird |
[bearbeiten] Rückgabewert
Das erste der folgenden zutreffenden Elemente
- 0, wenn das aus s konvertierte Zeichen (und, falls nicht null, in pwc gespeichert) das Nullzeichen war.
- Die Anzahl der Bytes [1...n] des Mehrbyte-Zeichens, das erfolgreich aus s konvertiert wurde.
- static_cast<std::size_t>(-2), wenn die nächsten n Bytes ein unvollständiges, aber bisher gültiges Multibyte-Zeichen darstellen. Es wird nichts in *pwc geschrieben.
- static_cast<std::size_t>(-1), wenn ein Kodierungsfehler auftritt. Es wird nichts in *pwc geschrieben, der Wert EILSEQ wird in errno gespeichert und der Wert von *ps bleibt undefiniert.
[bearbeiten] Beispiel
#include <clocale> #include <cstring> #include <cwchar> #include <iostream> void print_mb(const char* ptr) { std::mbstate_t state = std::mbstate_t(); // initial state const char* end = ptr + std::strlen(ptr); int len; wchar_t wc; while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0) { std::wcout << "Next " << len << " bytes are the character " << wc << '\n'; ptr += len; } } int main() { std::setlocale(LC_ALL, "en_US.utf8"); // UTF-8 narrow multibyte encoding const char* str = "z\u00df\u6c34\U0001d10b"; // or u8"zß水𝄋" // or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b"; print_mb(str); }
Ausgabe
Next 1 bytes are the character z Next 2 bytes are the character ß Next 3 bytes are the character 水 Next 4 bytes are the character 𝄋
[bearbeiten] Siehe auch
| konvertiert das nächste Multibyte-Zeichen in ein Wide-Zeichen (Funktion) | |
| konvertiert ein Wide-Zeichen in seine Multibyte-Darstellung, gegeben den Zustand (Funktion) | |
| [virtuell] |
konvertiert eine Zeichenkette von ExternT nach InternT, z. B. beim Lesen aus einer Datei(virtual protected member function of std::codecvt<InternT,ExternT,StateT>) |
| C-Dokumentation für mbrtowc
| |