Python Strings (met voorbeelden)

In deze tutorial leer je strings maken, formatteren, wijzigen en verwijderen in Python. Ook maakt u kennis met verschillende stringbewerkingen en functies.

Video: Python Strings

Wat is String in Python?

Een string is een reeks karakters.

Een personage is gewoon een symbool. De Engelse taal heeft bijvoorbeeld 26 tekens.

Computers hebben geen betrekking op tekens, maar op getallen (binair). Ook al ziet u tekens op uw scherm, intern wordt het opgeslagen en gemanipuleerd als een combinatie van nullen en enen.

Deze conversie van teken naar een getal wordt codering genoemd, en het omgekeerde proces is decodering. ASCII en Unicode zijn enkele van de populaire coderingen die worden gebruikt.

In Python is een string een reeks Unicode-tekens. Unicode werd geïntroduceerd om elk teken in alle talen op te nemen en uniformiteit in codering te brengen. U kunt meer te weten komen over Unicode van Python Unicode.

Hoe maak je een string in Python?

Tekenreeksen kunnen worden gemaakt door tekens tussen een enkel aanhalingsteken of dubbele aanhalingstekens te plaatsen. Zelfs drievoudige aanhalingstekens kunnen in Python worden gebruikt, maar worden over het algemeen gebruikt om strings met meerdere regels en docstrings weer te geven.

 # defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)

Wanneer u het programma uitvoert, is de uitvoer:

 Hallo Hallo Hallo Hallo, welkom in de wereld van Python

Hoe krijg ik toegang tot tekens in een string?

We hebben toegang tot individuele tekens met behulp van indexering en een reeks tekens met behulp van slicing. Index begint bij 0. Als u probeert toegang te krijgen tot een teken buiten het indexbereik, wordt een IndexError. De index moet een geheel getal zijn. We kunnen geen drijvers of andere typen gebruiken, dit zal resulteren in TypeError.

Python staat negatieve indexering toe voor zijn sequenties.

De index van -1verwijst naar het laatste item, -2naar het voorlaatste item enzovoort. We hebben toegang tot een reeks items in een string met behulp van de slicing-operator :(dubbele punt).

 #Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))

Als we het bovenstaande programma draaien, krijgen we de volgende output:

 str = programiz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am

Als we proberen toegang te krijgen tot een index die buiten het bereik valt of andere getallen dan een geheel getal gebruiken, krijgen we fouten.

 # index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers

Het snijden kan het beste worden gevisualiseerd door te kijken of de index tussen de elementen ligt, zoals hieronder wordt weergegeven.

Als we toegang willen krijgen tot een bereik, hebben we de index nodig die het gedeelte uit de string zal snijden.

String Slicing in Python

Hoe verander of verwijder ik een string?

Snaren zijn onveranderlijk. Dit betekent dat elementen van een string niet kunnen worden gewijzigd nadat ze zijn toegewezen. We kunnen eenvoudig verschillende strings aan dezelfde naam toewijzen.

 >>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'

We kunnen geen tekens uit een string verwijderen of verwijderen. Maar de string volledig verwijderen is mogelijk met behulp van het deltrefwoord.

 >>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined

Python String-bewerkingen

Er zijn veel bewerkingen die kunnen worden uitgevoerd met strings, waardoor het een van de meest gebruikte gegevenstypen in Python is.

Voor meer informatie over de gegevenstypen die beschikbaar zijn in Python, gaat u naar: Python-gegevenstypen

Aaneenschakeling van twee of meer strings

Het samenvoegen van twee of meer strings tot één strings wordt aaneenschakeling genoemd.

De + operator doet dit in Python. Door simpelweg twee letterlijke tekenreeksen samen te schrijven, worden ze ook samengevoegd.

De * operator kan worden gebruikt om de string een bepaald aantal keren te herhalen.

 # Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)

Als we het bovenstaande programma draaien, krijgen we de volgende output:

str1 + str2 = HalloWereld! str1 * 3 = HalloHelloHello

Als u twee letterlijke tekenreeksen samen schrijft, worden ze ook samengevoegd als + operator.

Als we strings in verschillende regels willen samenvoegen, kunnen we haakjes gebruiken.

 >>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'

Itereren door een touwtje

We kunnen een string doorlopen met een for-lus. Hier is een voorbeeld om het aantal 'l's in een string te tellen.

 # Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')

Als we het bovenstaande programma draaien, krijgen we de volgende output:

 3 letters gevonden

String lidmaatschapstest

We can test if a substring exists within a string or not, using the keyword in.

 >>> 'a' in 'program' True >>> 'at' not in 'battle' False

Built-in functions to Work with Python

Various built-in functions that work with sequence work with strings as well.

Some of the commonly used ones are enumerate() and len(). The enumerate() function returns an enumerate object. It contains the index and value of all the items in the string as pairs. This can be useful for iteration.

Similarly, len() returns the length (number of characters) of the string.

 str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))

When we run the above program, we get the following output:

 list(enumerate(str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len(str) = 4

Python String Formatting

Escape Sequence

If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError as the text itself contains both single and double quotes.

 >>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax

One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.

An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.

 # using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")

When we run the above program, we get the following output:

 He said, "What's there?" He said, "What's there?" He said, "What's there?"

Here is a list of all the escape sequences supported by Python.

Escape Sequence Description
ewline Backslash and newline ignored
\ Backslash
\' Single quote
" Double quote
a ASCII Bell
 ASCII Backspace
f ASCII Formfeed
ASCII Linefeed
ASCII Carriage Return
ASCII Horizontal Tab
v ASCII Vertical Tab
ooo Character with octal value ooo
xHH Character with hexadecimal value HH

Here are some examples

 >>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation

Raw String to ignore escape sequence

Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r or R in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.

 >>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example

The format() Method for Formatting Strings

The format() method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces () as placeholders or replacement fields which get replaced.

We can use positional arguments or keyword arguments to specify the order.

 # Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)

When we run the above program, we get the following output:

 --- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John

The format() method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <, right-justify > or center ^ a string in the given space.

We kunnen gehele getallen ook opmaken als binair, hexadecimaal, etc. en drijvers kunnen worden afgerond of weergegeven in het exponentformaat. Er zijn heel veel opmaak die u kunt gebruiken. Bezoek hier alle tekenreeksopmaak die beschikbaar is met de format()methode.

 >>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'

Opmaak in oude stijl

We kunnen zelfs strings opmaken zoals de oude sprintf()stijl die wordt gebruikt in programmeertaal C. We gebruiken de %operator om dit te bereiken.

 >>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457

Algemene Python String-methoden

Er zijn talloze methoden beschikbaar met het string-object. De format()methode die we hierboven noemden, is er een van. Enkele van de meest gebruikte methoden zijn lower(), upper(), join(), split(), find(), replace()enz. Hier kunt u een lijst van alle ingebouwde methoden om werk en strings in Python.

 >>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'

Interessante artikelen...