Ein regulärer Ausdruck (Regex) ist eine Zeichenfolge, die ein Suchmuster definiert. So schreiben Sie reguläre Ausdrücke:
Was ist ein Linux-Dateisystem?
- Beginnen Sie damit, die in Regex verwendeten Sonderzeichen zu verstehen, z. B. ., *, +, ? und mehr.
- Wählen Sie eine Programmiersprache oder ein Tool, das Regex unterstützt, z. B. Python, Perl oder grep.
- Schreiben Sie Ihr Muster mit Sonderzeichen und Buchstaben.
- Verwenden Sie die entsprechende Funktion oder Methode, um nach dem Muster in einer Zeichenfolge zu suchen.
Beispiele:
- Um eine Folge von Literalzeichen abzugleichen, schreiben Sie diese Zeichen einfach in das Muster.
- Um ein einzelnes Zeichen aus einer Reihe von Möglichkeiten zuzuordnen, verwenden Sie eckige Klammern, z. B. [0123456789] entspricht einer beliebigen Ziffer.
- Um null oder mehr Vorkommen des vorhergehenden Ausdrucks zu finden, verwenden Sie das Sternsymbol (*).
- Um ein oder mehrere Vorkommen des vorhergehenden Ausdrucks abzugleichen, verwenden Sie das Pluszeichen (+).
- Es ist wichtig zu beachten, dass Regex komplex und schwer zu lesen sein kann. Daher wird empfohlen, Tools wie Regex-Tester zum Debuggen und Optimieren Ihrer Muster zu verwenden.
Ein regulärer Ausdruck (manchmal auch rationaler Ausdruck genannt) ist eine Folge von Zeichen, die ein Suchmuster definieren, hauptsächlich zur Verwendung beim Mustervergleich mit Zeichenfolgen oder beim Zeichenfolgenvergleich, d. h. beim Suchen und Ersetzen ähnlicher Operationen. Reguläre Ausdrücke sind eine verallgemeinerte Möglichkeit, Muster mit Zeichenfolgen abzugleichen. Es wird in jeder Programmiersprache wie C++, Java und Python verwendet.
Was ist ein regulärer Ausdruck und was macht ihn so wichtig?
Regex wird verwendet in Google Analytics beim URL-Abgleich bei der Unterstützung von Suchen und Ersetzen in den gängigsten Editoren wie Sublime, Notepad++, Brackets, Google Docs und Microsoft Word.
Example : Regular expression for an email address : ^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$> Der obige reguläre Ausdruck kann verwendet werden, um zu überprüfen, ob es sich bei einem bestimmten Zeichensatz um eine E-Mail-Adresse handelt oder nicht.
Wie schreibe ich reguläre Ausdrücke?
Es gibt bestimmte Elemente, die zum Schreiben regulärer Ausdrücke verwendet werden, wie unten erwähnt:
1. Repeater (*, + und {})
Diese Symbole fungieren als Wiederholer und teilen dem Computer mit, dass das vorangehende Zeichen nicht nur einmal verwendet werden soll.
2. Das Sternchensymbol (*)
Es weist den Computer an, das vorhergehende Zeichen (oder den vorangehenden Zeichensatz) nullmal oder öfter (bis unendlich) abzugleichen.
Example : The regular expression ab*c will give ac, abc, abbc, abbbc….and so on>
3. Das Plus-Symbol ( + )
Es weist den Computer an, das vorhergehende Zeichen (oder den vorhergehenden Zeichensatz) mindestens einmal oder mehrmals (bis zu unendlich) zu wiederholen.
Example : The regular expression ab+c will give abc, abbc, abbbc, … and so on.>
4. Die geschweiften Klammern { … }
Es weist den Computer an, das vorhergehende Zeichen (oder die vorangehende Zeichengruppe) so oft zu wiederholen, wie der Wert in dieser Klammer vorkommt.
Example : {2} means that the preceding character is to be repeated 2 times, {min,} means the preceding character is matches min or more times. {min,max} means that the preceding character is repeated at least min & at most max times.> 5. Platzhalter ( . )
Das Punktsymbol kann jedes andere Symbol ersetzen und wird daher als Platzhalterzeichen bezeichnet.
Example : The Regular expression .* will tell the computer that any character can be used any number of times.>
6. Optionales Zeichen ( ? )
Dieses Symbol teilt dem Computer mit, dass das vorangehende Zeichen möglicherweise in der zu vergleichenden Zeichenfolge vorhanden ist oder nicht.
Example : We may write the format for document file as – docx? The ‘?’ tells the computer that x may or may not be present in the name of file format.>
7. Das Caret-Symbol (^). ( Einstellungsposition für das Spiel)
Das Caret-Symbol teilt dem Computer mit, dass die Übereinstimmung am Anfang der Zeichenfolge oder Zeile beginnen muss.
Example : ^d{3} will match with patterns like '901' in '901-333-'.> 8. Das Dollarsymbol ($).
Es teilt dem Computer mit, dass die Übereinstimmung am Ende der Zeichenfolge oder vor am Ende der Zeile oder Zeichenfolge erfolgen muss.
Example : -d{3}$ will match with patterns like '-333' in '-901-333'.> 9. Charakterklassen
Eine Zeichenklasse entspricht einem beliebigen Zeichensatz. Es wird verwendet, um das grundlegendste Element einer Sprache wie einen Buchstaben, eine Ziffer, ein Leerzeichen, ein Symbol usw. zuzuordnen.
S : Entspricht allen Leerzeichen wie Leerzeichen und Tabulatorzeichen.
S : Entspricht allen Zeichen, die keine Leerzeichen sind.
D : entspricht einem beliebigen Ziffernzeichen.
D: entspricht allen nicht-stelligen Zeichen.
In : Entspricht jedem Wortzeichen (hauptsächlich alphanumerisch)
IN : Entspricht jedem Nicht-Wort-Zeichen.
B : Entspricht jeder Wortgrenze (dazu gehören Leerzeichen, Bindestriche, Kommas, Semikolons usw.).
[set_of_characters]: Entspricht jedem einzelnen Zeichen in set_of_characters. Standardmäßig wird bei der Übereinstimmung die Groß-/Kleinschreibung beachtet.
Example : [abc] will match characters a,b and c in any string.>
10. [^set_of_characters] Negation:
Entspricht jedem einzelnen Zeichen, das nicht in set_of_characters enthalten ist. Standardmäßig wird bei der Übereinstimmung die Groß-/Kleinschreibung beachtet.
Example : [^abc] will match any character except a,b,c .>
11. [zuerst-zuletzt] Zeichenbereich:
Entspricht jedem einzelnen Zeichen im Bereich vom ersten bis zum letzten.
Example : [a-zA-z] will match any character from a to z or A to Z.>
12. Das Escape-Symbol ( )
Wenn Sie eine Übereinstimmung mit den tatsächlichen Zeichen „+“, „.“ usw. wünschen, fügen Sie vor diesem Zeichen einen Backslash () ein. Dadurch wird der Computer angewiesen, das folgende Zeichen als Suchzeichen zu behandeln und es als passendes Muster zu betrachten.
Example : d+[+-x*]d+ will match patterns like '2+2' and '3*9' in '(2+2) * 3*9'.>
13. Zeichen gruppieren ( )
Eine Reihe verschiedener Symbole eines regulären Ausdrucks kann so gruppiert werden, dass sie als eine Einheit fungieren und sich wie ein Block verhalten. Dazu müssen Sie den regulären Ausdruck in Klammern setzen ().
Example : ([A-Z]w+) contains two different elements of the regular expression combined together. This expression will match any pattern containing uppercase letter followed by any character.>
14. Vertikaler Balken ( | )
Entspricht einem beliebigen Element, getrennt durch das vertikale Strichzeichen (|).
Example : th(e|is|at) will match words - the, this and that.>
15. umber
Rückverweis: Ermöglicht die anschließende Identifizierung eines zuvor übereinstimmenden Unterausdrucks (erfasster oder in runde Klammern eingeschlossener Ausdruck) im selben regulären Ausdruck. bedeutet, dass die in der n-ten Klammer eingeschlossene Gruppe an der aktuellen Position wiederholt wird.
Example : ([a-z])1 will match ee in Geek because the character at second position is same as character at position 1 of the match.>
16. Wie (?# Kommentar)
Inline-Kommentar: Der Kommentar endet mit der ersten schließenden Klammer.
Example : A(?#This is an inline comment)w+>
17. # [bis Zeilenende]
Kommentar zum X-Modus. Der Kommentar beginnt mit einem # ohne Escapezeichen und wird bis zum Ende der Zeile fortgesetzt.
Example : (?x)Aw+#Matches words starting with A>