Hướng dẫn giới thiệu về biểu thức chính quy
Biểu thức chính quy, thường được gọi là biểu thức chính quy hoặc biểu thức chính quy, là các chuỗi ký tự tạo thành mẫu tìm kiếm. Chúng chủ yếu được sử dụng để khớp chuỗi và thao tác. Regex có thể cực kỳ mạnh mẽ để tìm kiếm, thay thế và trích xuất dữ liệu từ văn bản.
Cú pháp cơ bản
Biểu thức chính quy bao gồm sự kết hợp của các ký tự chữ và ký tự đặc biệt được gọi là siêu ký tự. Dưới đây là một số thành phần cơ bản:
- Ký tự chữ: Đây là những ký tự bình thường khớp với chính chúng. Ví dụ: biểu thức chính quy
cat
khớp với chuỗi "cat". - Siêu ký tự: Những ký tự này có ý nghĩa đặc biệt và được sử dụng để xây dựng các mẫu phức tạp. Các ví dụ bao gồm
.
,*
,+
,?
,[]
,{}
,()
và|
.
Siêu ký tự phổ biến
Dưới đây là một số siêu ký tự được sử dụng phổ biến nhất và chức năng của chúng:
.
- So khớp với bất kỳ ký tự đơn nào ngoại trừ dòng mới.*
- Khớp 0 hoặc nhiều lần lặp lại của phần tử trước đó.+
- Khớp 1 hoặc nhiều lần lặp lại của phần tử trước đó.?
- Khớp 0 hoặc 1 lần lặp lại của phần tử trước.[]
- Được sử dụng để khớp bất kỳ một trong các ký tự bên trong dấu ngoặc.{}
- Chỉ định số lần xuất hiện cụ thể của phần tử trước.()
- Nhóm nhiều mã thông báo lại với nhau và tạo các nhóm chụp.|
- Hoạt động như toán tử OR.
Ví dụ về các mẫu cơ bản
Hãy cùng khám phá một số mẫu biểu thức chính quy cơ bản bằng các ví dụ:
cat
Khớp với chuỗi "cat" ở bất kỳ đâu trong văn bản.
.at
Khớp với bất kỳ chuỗi nào chứa "a", theo sau là ký tự bất kỳ và sau đó là "t". Ví dụ: "cat", "bat", "hat".
\d{3}
Khớp chính xác ba chữ số. Ví dụ: "123", "456", "789".
[a-z]
Khớp với bất kỳ chữ cái viết thường nào từ "a" đến "z".
(dog|cat)
Khớp với "dog" hoặc "cat".
Sử dụng Regex trong lập trình
Biểu thức chính quy được hỗ trợ trong nhiều ngôn ngữ lập trình. Dưới đây là ví dụ về cách sử dụng biểu thức chính quy trong Python và JavaScript:
Ví dụ về Python
import re
# Search for 'cat' in a string
pattern = r'cat'
text = 'The cat sat on the mat.'
match = re.search(pattern, text)
if match:
print('Match found:', match.group())
else:
print('No match found')
Ví dụ về JavaScript
// Search for 'cat' in a string
const pattern = /cat/;
const text = 'The cat sat on the mat.';
const match = text.match(pattern);
if (match) {
console.log('Match found:', match[0]);
} else {
console.log('No match found');
}
Phần kết luận
Biểu thức chính quy là một công cụ mạnh mẽ để xử lý văn bản và trích xuất dữ liệu. Bằng cách hiểu cú pháp cơ bản và các mẫu phổ biến, bạn có thể bắt đầu sử dụng biểu thức chính quy trong các dự án của mình để hợp lý hóa và nâng cao khả năng thao tác văn bản của mình. Thực hành với các mẫu khác nhau và khám phá các tính năng nâng cao của biểu thức chính quy để trở nên thành thạo hơn.