Namensräume
Varianten
Aktionen

std::regex_traits<CharT>::isctype

Von cppreference.com
< cpp‎ | regex‎ | regex traits
 
 
 
Bibliothek für reguläre Ausdrücke
Klassen
(C++11)
Algorithmen
Iteratoren
Ausnahmen
Traits
Konstanten
(C++11)
Reguläre Ausdrucksgrammatiken
 
 
bool isctype( CharT c, char_class_type f ) const;

Bestimmt, ob das Zeichen c zur durch f identifizierten Zeichenklasse gehört, wobei f ein von lookup_classname() zurückgegebener Wert oder eine bitweise OR-Verknüpfung mehrerer solcher Werte ist.

Die in den Standardbibliotheks-Spezialisierungen von std::regex_traits bereitgestellte Version dieser Funktion führt Folgendes aus:

1) Zuerst wird f in einen Wert m vom Typ std::ctype_base::mask konvertiert.
Für jede in der Tabelle auf der Seite lookup_classname() aufgeführte std::ctype-Kategorie werden die entsprechenden Bits in m gesetzt, wenn die Bits in f, die der Kategorie entsprechen, gesetzt sind.
2) Dann wird versucht, das Zeichen in der eingebetteten Locale zu klassifizieren, indem std::use_facet<std::ctype<CharT>>(getloc()).is(m, c) aufgerufen wird.
  • Wenn dies true zurückgibt, gibt `isctype()` ebenfalls true zurück.
  • Andernfalls, wenn c gleich '_' ist und f das Ergebnis des Aufrufs von lookup_classname() für die Zeichenklasse [:w:] enthält, wird true zurückgegeben, andernfalls false.

Inhalt

[bearbeiten] Parameter

c - das zu klassifizierende Zeichen
f - die Bitmaske, die aus einem oder mehreren Aufrufen von lookup_classname() erhalten wurde

[bearbeiten] Rückgabewert

true, wenn c von f klassifiziert wird, andernfalls false.

[bearbeiten] Beispiel

#include <iostream>
#include <regex>
#include <string>
 
int main()
{
    std::regex_traits<char> t;
    std::string str_alnum = "alnum";
    auto a = t.lookup_classname(str_alnum.begin(), str_alnum.end());
    std::string str_w = "w"; // [:w:] is [:alnum:] plus '_'
    auto w = t.lookup_classname(str_w.begin(), str_w.end());
    std::cout << std::boolalpha
              << t.isctype('A', w) << ' ' << t.isctype('A', a) << '\n'
              << t.isctype('_', w) << ' ' << t.isctype('_', a) << '\n'
              << t.isctype(' ', w) << ' ' << t.isctype(' ', a) << '\n';
}

Ausgabe

true true
true false
false false

Demonstriert eine benutzerdefinierte Implementierung von `regex_traits` für lookup_classname() / `isctype()`

#include <cwctype>
#include <iostream>
#include <locale>
#include <regex>
 
// This custom regex traits uses wctype/iswctype to implement lookup_classname/isctype.
struct wctype_traits : std::regex_traits<wchar_t>
{
    using char_class_type = std::wctype_t;
 
    template<class It>
    char_class_type lookup_classname(It first, It last, bool = false) const
    {
        return std::wctype(std::string(first, last).c_str());
    }
 
    bool isctype(wchar_t c, char_class_type f) const
    {
        return std::iswctype(c, f);
    }
};
 
int main()
{
    std::locale::global(std::locale("ja_JP.utf8"));
    std::wcout.sync_with_stdio(false);
    std::wcout.imbue(std::locale());
 
    std::wsmatch m;
    std::wstring in = L"風の谷のナウシカ";
    // matches all characters (they are classified as alnum)
    std::regex_search(in, m, std::wregex(L"([[:alnum:]]+)"));
    std::wcout << "alnums: " << m[1] << '\n'; // prints "風の谷のナウシカ"
    // matches only the katakana
    std::regex_search(in, m,
                      std::basic_regex<wchar_t, wctype_traits>(L"([[:jkata:]]+)"));
    std::wcout << "katakana: " << m[1] << '\n'; // prints "ナウシカ"
}

Ausgabe

alnums: 風の谷のナウシカ
katakana: ナウシカ

[bearbeiten] Fehlerberichte

Die folgenden Verhaltensändernden Fehlerberichte wurden rückwirkend auf zuvor veröffentlichte C++-Standards angewendet.

DR angewendet auf Verhalten wie veröffentlicht Korrigiertes Verhalten
LWG 2018 C++11 Der Wert von m war nicht spezifiziert Entspricht der minimalen Unterstützung von lookup_classname()

[bearbeiten] Siehe auch

Ruft eine Zeichenklasse anhand ihres Namens ab
(public member function) [bearbeiten]
[virtuell]
klassifiziert ein Zeichen oder eine Zeichensequenz
(virtual protected member function of std::ctype<CharT>) [bearbeiten]
klassifiziert ein breites Zeichen gemäß der angegebenen LC_CTYPE-Kategorie
(Funktion) [bearbeiten]