Chuỗi Python (Có ví dụ)

Trong hướng dẫn này, bạn sẽ học cách tạo, định dạng, sửa đổi và xóa các chuỗi trong Python. Ngoài ra, bạn sẽ được giới thiệu về các hoạt động và chức năng chuỗi khác nhau.

Video: Chuỗi Python

Chuỗi trong Python là gì?

Chuỗi là một chuỗi các ký tự.

Một ký tự chỉ đơn giản là một biểu tượng. Ví dụ, ngôn ngữ tiếng Anh có 26 ký tự.

Máy tính không xử lý các ký tự, chúng xử lý các số (nhị phân). Mặc dù bạn có thể nhìn thấy các ký tự trên màn hình của mình, nhưng bên trong nó vẫn được lưu trữ và thao tác dưới dạng kết hợp của số 0 và số 1.

Quá trình chuyển đổi ký tự thành số này được gọi là mã hóa và quá trình ngược lại là giải mã. ASCII và Unicode là một số bảng mã phổ biến được sử dụng.

Trong Python, một chuỗi là một chuỗi các ký tự Unicode. Unicode được giới thiệu để bao gồm mọi ký tự trong tất cả các ngôn ngữ và mang lại sự đồng nhất trong bảng mã. Bạn có thể tìm hiểu về Unicode từ Python Unicode.

Làm thế nào để tạo một chuỗi trong Python?

Các chuỗi có thể được tạo bằng cách đặt các ký tự bên trong một dấu ngoặc kép hoặc dấu ngoặc kép. Ngay cả dấu ngoặc kép có thể được sử dụng trong Python nhưng thường được sử dụng để biểu diễn chuỗi nhiều dòng và chuỗi doc.

 # defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)

Khi bạn chạy chương trình, đầu ra sẽ là:

 Xin chào Xin chào Xin chào, chào mừng bạn đến với thế giới Python

Làm thế nào để truy cập các ký tự trong một chuỗi?

Chúng tôi có thể truy cập các ký tự riêng lẻ bằng cách sử dụng lập chỉ mục và một loạt các ký tự bằng cách sử dụng cắt. Chỉ mục bắt đầu từ 0. Cố gắng truy cập một ký tự nằm ngoài phạm vi chỉ mục sẽ tăng một IndexError. Chỉ mục phải là một số nguyên. Chúng tôi không thể sử dụng phao hoặc các loại khác, điều này sẽ dẫn đến TypeError.

Python cho phép lập chỉ mục âm cho các chuỗi của nó.

Chỉ mục của -1đề cập đến mục cuối cùng, -2đến mục cuối cùng thứ hai, v.v. Chúng ta có thể truy cập một loạt các mục trong một chuỗi bằng cách sử dụng toán tử cắt :(dấu hai chấm).

 #Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))

Khi chúng tôi chạy chương trình trên, chúng tôi nhận được kết quả sau:

 str = programmiz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am

Nếu chúng tôi cố gắng truy cập một chỉ mục ngoài phạm vi hoặc sử dụng các số khác với số nguyên, chúng tôi sẽ gặp lỗi.

 # index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers

Việc cắt lát có thể được hình dung tốt nhất bằng cách xem xét chỉ số nằm giữa các phần tử như hình dưới đây.

Nếu chúng ta muốn truy cập một phạm vi, chúng ta cần chỉ mục sẽ cắt phần đó khỏi chuỗi.

String Slicing trong Python

Làm thế nào để thay đổi hoặc xóa một chuỗi?

Chuỗi là bất biến. Điều này có nghĩa là các phần tử của một chuỗi không thể thay đổi khi chúng đã được gán. Chúng ta có thể chỉ cần gán lại các chuỗi khác nhau cho cùng một tên.

 >>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'

Chúng tôi không thể xóa hoặc loại bỏ các ký tự khỏi một chuỗi. Nhưng có thể xóa hoàn toàn chuỗi bằng cách sử dụng deltừ khóa.

 >>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined

Hoạt động chuỗi trong Python

Có rất nhiều thao tác có thể được thực hiện với chuỗi, điều này khiến nó trở thành một trong những kiểu dữ liệu được sử dụng nhiều nhất trong Python.

Để tìm hiểu thêm về các kiểu dữ liệu có sẵn trong Python, hãy truy cập: Các kiểu dữ liệu Python

Kết nối của hai hoặc nhiều chuỗi

Nối hai hoặc nhiều chuỗi thành một chuỗi duy nhất được gọi là nối.

Các + nhà điều hành thực hiện điều này bằng Python. Đơn giản chỉ cần viết hai ký tự chuỗi với nhau cũng có thể nối chúng.

Các * điều hành có thể được sử dụng để lặp lại các chuỗi cho một số lượng nhất định của thời đại.

 # Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)

Khi chúng tôi chạy chương trình trên, chúng tôi nhận được kết quả sau:

str1 + str2 = HelloWorld! str1 * 3 = Xin chàoHelloHello

Viết hai ký tự chuỗi với nhau cũng nối chúng giống như toán tử + .

Nếu chúng ta muốn nối các chuỗi trong các dòng khác nhau, chúng ta có thể sử dụng dấu ngoặc đơn.

 >>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'

Lặp lại thông qua một chuỗi

Chúng ta có thể lặp qua một chuỗi bằng vòng lặp for. Đây là một ví dụ để đếm số lượng 'l trong một chuỗi.

 # Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')

Khi chúng tôi chạy chương trình trên, chúng tôi nhận được kết quả sau:

 3 chữ cái được tìm thấy

Kiểm tra tư cách thành viên chuỗi

We can test if a substring exists within a string or not, using the keyword in.

 >>> 'a' in 'program' True >>> 'at' not in 'battle' False

Built-in functions to Work with Python

Various built-in functions that work with sequence work with strings as well.

Some of the commonly used ones are enumerate() and len(). The enumerate() function returns an enumerate object. It contains the index and value of all the items in the string as pairs. This can be useful for iteration.

Similarly, len() returns the length (number of characters) of the string.

 str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))

When we run the above program, we get the following output:

 list(enumerate(str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len(str) = 4

Python String Formatting

Escape Sequence

If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError as the text itself contains both single and double quotes.

 >>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax

One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.

An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.

 # using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")

When we run the above program, we get the following output:

 He said, "What's there?" He said, "What's there?" He said, "What's there?"

Here is a list of all the escape sequences supported by Python.

Escape Sequence Description
ewline Backslash and newline ignored
\ Backslash
\' Single quote
" Double quote
a ASCII Bell
 ASCII Backspace
f ASCII Formfeed
ASCII Linefeed
ASCII Carriage Return
ASCII Horizontal Tab
v ASCII Vertical Tab
ooo Character with octal value ooo
xHH Character with hexadecimal value HH

Here are some examples

 >>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation

Raw String to ignore escape sequence

Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r or R in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.

 >>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example

The format() Method for Formatting Strings

The format() method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces () as placeholders or replacement fields which get replaced.

We can use positional arguments or keyword arguments to specify the order.

 # Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)

When we run the above program, we get the following output:

 --- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John

The format() method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <, right-justify > or center ^ a string in the given space.

Chúng tôi cũng có thể định dạng số nguyên dưới dạng nhị phân, thập lục phân, v.v. và số thực có thể được làm tròn hoặc hiển thị ở định dạng số mũ. Có rất nhiều định dạng bạn có thể sử dụng. Truy cập vào đây để biết tất cả các định dạng chuỗi có sẵn với format()phương thức này.

 >>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'

Định dạng kiểu cũ

Chúng ta thậm chí có thể định dạng chuỗi giống như sprintf()kiểu cũ được sử dụng trong ngôn ngữ lập trình C. Chúng tôi sử dụng %toán tử để thực hiện điều này.

 >>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457

Các phương thức chuỗi Python phổ biến

Có rất nhiều phương thức có sẵn với đối tượng chuỗi. Các format()phương pháp mà chúng tôi đề cập ở trên là một trong số họ. Một số phương pháp thường được sử dụng là lower(), upper(), join(), split(), find(), replace()vv Đây là một danh sách đầy đủ của tất cả được xây dựng trong phương pháp để làm việc với các chuỗi trong Python.

 >>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'

thú vị bài viết...