Đếm số lượng từ duy nhất python

Về cơ bản, tôi đã chuyển đổi chuỗi của bạn thành một danh sách bằng cách sử dụng hàm split(). Sau đó, tôi đã chuyển đổi nó thành một bộ, sẽ chỉ để lại các giá trị duy nhất trong danh sách

Khi bạn đã có bộ, bạn có thể in chiều dài. Hi vọng điêu nay co ich. Tất nhiên bạn có thể làm điều này trong một tuyên bố duy nhất

Công cụ sau đây trực quan hóa những gì máy tính đang làm từng bước khi nó thực thi chương trình nói trên

Trình chỉnh sửa mã Python

Có một cách khác để giải quyết giải pháp này?

Trước. Viết chương trình Python để xóa các ký tự có giá trị chỉ số lẻ của một chuỗi đã cho
Kế tiếp. Viết tập lệnh Python lấy đầu vào từ người dùng và hiển thị đầu vào đó ở dạng chữ hoa và chữ thường

Mức độ khó của bài tập này là gì?

Dễ dàng trung bình khó

Kiểm tra kỹ năng Lập trình của bạn với bài kiểm tra của w3resource



Theo dõi chúng tôi trên FacebookTwitter để cập nhật thông tin mới nhất.

con trăn. Lời khuyên trong ngày

Tuyên bố chuyển nhượng được chú thích

Điều này có vẻ không ấn tượng bằng một số thủ thuật khác nhưng đó là một cú pháp mới được đưa vào Python trong những năm gần đây và bạn nên biết

Các bài tập được chú thích cho phép người viết mã để lại các gợi ý về loại trong mã. Những điều này không có bất kỳ quyền lực thực thi nào ít nhất là chưa. Thật tuyệt khi có thể ngụ ý một số gợi ý về loại và chắc chắn cung cấp nhiều tùy chọn hơn là chỉ có thể nhận xét về các loại biến dự kiến

(chuông máy trò chơi) - Gần như mọi trình xử lý văn bản hiện đại đều có công cụ đếm từ để đếm tổng số từ trong tài liệu. Đối với thử thách này, chúng ta sẽ sử dụng công cụ đó thêm một bước nữa để thực hành cả việc chia nhỏ văn bản và đếm các mục. Mục tiêu của bạn là viết một hàm Python xác định số lượng từ duy nhất trong một tệp văn bản và đếm số lần mỗi từ xuất hiện. Nó sẽ chấp nhận đường dẫn đến tệp văn bản làm đối số đầu vào, sau đó in tổng số từ trong tệp, cũng như 20 từ được sử dụng thường xuyên nhất và số lần xuất hiện của mỗi từ đó. Một ví dụ gọi hàm có thể trông như thế này. In ra một tin nhắn với tổng số từ và danh sách 20 từ hàng đầu. Cách bạn chọn định dạng đầu ra đó thực sự tùy thuộc vào bạn. Bạn nên bỏ qua trường hợp khi cân nhắc xem hai từ giống hay khác nhau và đối với thử thách này, chúng tôi sẽ nói rằng các từ có thể chứa các chữ cái, số, dấu nháy đơn và dấu gạch nối, đồng thời chúng được phân tách bằng bất kỳ dấu chấm câu hoặc khoảng trắng nào khác. Nếu bạn đang tìm kiếm các tệp đầu vào để kiểm tra chương trình của mình, tôi khuyên bạn nên tải xuống một số tài liệu cổ điển từ Gutenberg. tổ chức. Ở định dạng văn bản thuần túy. Tôi sẽ sử dụng toàn bộ tác phẩm của William Shakespeare cho trường hợp thử nghiệm của riêng mình. Tạm dừng video ngay bây giờ để tạo giải pháp của riêng bạn, sau đó tôi sẽ chỉ cho bạn cách tôi giải quyết thử thách này. (tiếng chuông máy trò chơi) Được rồi. Từ giải pháp của mình, tôi đã sử dụng hai mô-đun Python, mô-đun biểu thức chính quy để trích xuất các từ riêng lẻ từ tệp văn bản và mô-đun bộ sưu tập cho lớp bộ đếm của nó, là lớp con từ điển cung cấp một cách thuận tiện để kiểm đếm các mục duy nhất. Đó chính xác là những gì thử thách này cần. Với chức năng đếm từ của mình, tôi mở tệp đầu vào bằng trình quản lý ngữ cảnh trực tuyến sáu và sau đó sử dụng biểu thức chính quy để tìm tất cả các từ trong văn bản. Mẫu tìm kiếm tìm kiếm bất kỳ chuỗi nào gồm một hoặc nhiều chữ cái, số, dấu gạch ngang và hoặc dấu nháy đơn. Trực tuyến tám, tôi chuyển đổi danh sách các từ mà nó tìm thấy thành tất cả chữ hoa, sau đó in ra độ dài của danh sách đó, cho biết tổng số từ được tìm thấy. Tôi tạo một bộ đếm mới từ mô-đun bộ sưu tập ở dòng 11, chuyển vào danh sách các từ của tôi dưới dạng đối số, đối số này sẽ điền vào từ điển của bộ đếm số lần xuất hiện của mỗi từ. Cuối cùng, trong đoạn mã cuối cùng, tôi sử dụng phương thức phổ biến nhất của bộ đếm để lấy danh sách 20 từ phổ biến nhất cùng với giá trị đếm của chúng để hiển thị. Bây giờ, trong thiết bị đầu cuối, tôi đã bắt đầu trình bao Python tương tác và đã nhập hàm đếm từ của mình. Vì vậy, tôi sẽ gọi nó là số từ, và sau đó vượt qua Shakespeare. văn bản làm đối số đầu vào. Đây là tệp văn bản chứa toàn bộ tác phẩm của William Shakespeare mà tôi đã tải xuống từ Gutenberg. tổ chức. Khi tôi thực hiện chức năng đó, tôi có thể thấy rằng Shakespeare đã viết hơn 900.000 từ và từ yêu thích của ông ấy là "The. "Không quá bất ngờ. Đây chỉ là một cách để giải quyết thách thức này. Nếu bạn thực hiện một cách tiếp cận khác, tôi khuyến khích bạn chia sẻ chiến lược của mình với những người khác trong phần bình luận

Tải xuống các khóa học và học mọi lúc, mọi nơi

Xem các khóa học trên thiết bị di động của bạn mà không cần kết nối internet. Tải xuống các khóa học bằng ứng dụng LinkedIn Learning trên iOS hoặc Android của bạn

Trong hướng dẫn Python này, chúng ta sẽ tìm hiểu về Python Đếm từ trong tệp. Ở đây, chúng tôi giả sử tệp dưới dạng tệp Văn bản đơn giản (. txt). Ngoài ra, chúng tôi sẽ bao gồm các chủ đề này

  • Python Đếm từ trong tệp
  • Python Đếm các từ cụ thể trong tệp
  • Python đếm từ trong nhiều tệp
  • Python Đếm các tệp từ duy nhất
  • Python Đếm từ trong tệp Excel
  • Python Đếm các từ duy nhất trong tệp văn bản
  • Chương trình Python để đếm số từ trong tệp
  • Python đếm tần số từ trong một tệp
  • Tệp CSV đếm từ của Python

Mục lục

Python Đếm từ trong tệp

Trong phần này chúng ta sẽ tìm hiểu về python đếm từ trong file. Nói cách khác, chúng ta sẽ học cách đếm tổng số từ trong một tệp văn bản bằng Python

  • Toàn bộ quá trình được chia thành ba bước đơn giản
    • mở tệp văn bản ở chế độ chỉ đọc
    • đọc thông tin của tập tin
    • chia các câu thành các từ và tìm len
  • Sử dụng
    # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    1, chúng tôi có thể mở tệp ở chế độ chỉ đọc và lưu trữ thông tin này trong một biến tệp
  • # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    2 câu lệnh này được sử dụng để đọc toàn bộ dữ liệu trong một lần và lưu trữ nó trong một biến có tên là read_data
  • Đã đến lúc chia các câu thành các từ và điều đó có thể được thực hiện bằng cách sử dụng
    # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    3 ở đây phương thức split() được sử dụng để chia nhỏ từng câu trong read_data và tất cả thông tin này được lưu trữ trong một biến có tên per_word
  • bước cuối cùng là in độ dài của biến per_word. Xin lưu ý rằng chiều dài đang đếm tổng số từ trong tệp. Đây là câu lệnh để in một tin nhắn có tổng số từ
    # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    4

Mã nguồn

Đây là mã nguồn để triển khai Python Count Words in a File

file = open('file.txt', 'r')
read_data = file.read()
per_word = read_data.split()

print('Total Words:', len(per_word))

đầu ra

Đây là đầu ra của việc đếm các từ trong một tệp bằng Python. Trong kết quả này, tệp văn bản chúng tôi đã sử dụng có 221 từ

Đếm số lượng từ duy nhất python
Python Đếm từ trong một tệp

Đọc. Bộ đếm Python

Python Đếm các từ cụ thể trong tệp

Trong phần này, chúng ta sẽ tìm hiểu về Python Đếm số từ cụ thể trong tệp. Người dùng sẽ cung cấp bất kỳ từ nào và chương trình của chúng tôi sẽ hiển thị tổng số lần xuất hiện của từ đó

  • Sự xuất hiện của từ cụ thể có thể được tính trong 5 bước đơn giản
    • Yêu cầu đầu vào của người dùng
    • Mở tệp ở chế độ chỉ đọc
    • Đọc dữ liệu của tập tin
    • chuyển đổi dữ liệu thành chữ thường và đếm số lần xuất hiện của từ cụ thể
    • In số đếm
  • # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    5 trong mã này, đầu vào của người dùng được thu thập và lưu trữ trong một biến. Bất cứ từ nào người dùng sẽ nhập ở đây từ đó sẽ được tìm kiếm trong một tệp
  • # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    1 trong tệp mã này. txt là tệp được mở ở chế độ chỉ đọc và kết quả được lưu trữ trong biến 'tệp'
  • Khi chúng tôi đã mở một tệp, bước tiếp theo là đọc dữ liệu trong đó, vì vậy sử dụng mã
    # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    7, chúng tôi đã đọc toàn bộ dữ liệu và lưu trữ thông tin trong một biến có tên là 'read_data'
  • word_count = read_data. thấp hơn(). đếm(search_word_count) Trong mã này, chúng tôi đã chuyển đổi dữ liệu thành chữ thường và sử dụng phương pháp đếm, chúng tôi đã tìm kiếm từ mà người dùng đã cung cấp. Toàn bộ kết quả được lưu trữ trong một biến có tên là ‘word_count’
  • Bước cuối cùng trong quy trình là in tin nhắn có đếm. Chúng tôi đã sử dụng chuỗi được định dạng để làm cho thông điệp của chúng tôi mang tính mô tả. Đây là mã cho điều đó
    # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    8

Mã nguồn

Đây là mã nguồn hoàn chỉnh để thực hiện python đếm các từ cụ thể trong một tệp

# asking for user input
search_word_count = input('Enter the word: ')

# opening text file in read only mode
file = open("file.txt", "r")

# reading data of the file
read_data = file.read()

# converting data in lower case and the counting the occurrence 
word_count = read_data.lower().count(search_word_count)

# printing word and it's count
print(f"The word '{search_word_count}' appeared {word_count} times.")

đầu ra

Đây là đầu ra của Python Đếm từ cụ thể trong một tệp. Trong kết quả này, chúng tôi đã tìm kiếm từ 'the' trong một tệp văn bản. Kết quả cho thấy ‘the’ xuất hiện 4 lần trong một file văn bản

Đếm số lượng từ duy nhất python
Python Đếm các từ cụ thể trong tệp

Đọc. Python lấy tất cả các tệp trong thư mục

Python đếm từ trong nhiều tệp

Trong phần này, chúng ta sẽ tìm hiểu về Python Đếm từ trong nhiều tệp. Chúng tôi có ba tệp văn bản mà chúng tôi sẽ sử dụng và chúng tôi sẽ đếm các từ từ tất cả các tệp này

  • Đếm từ từ nhiều tệp có thể được thực hiện trong năm bước đơn giản
    • nhập mô-đun toàn cầu trong Python
    • tạo một danh sách trống để lưu trữ các tệp văn bản và bộ đếm có giá trị mặc định là 0
    • bắt đầu một vòng lặp, nhận dạng tệp văn bản bằng toàn cục và thêm nó vào danh sách trống mà chúng tôi đã tạo ở bước trước
    • bắt đầu một vòng lặp khác trên danh sách trống đó, tổng số tệp sẽ quyết định số lần vòng lặp sẽ chạy. Mỗi vòng lặp thời gian chạy một tệp được mở, đọc, chia thành các từ và sau đó độ dài của tổng số từ được thêm vào biến từ
    • Cuối cùng, in biến từ với thông báo mô tả
  • toàn cầu được sử dụng để trả về tất cả tệp có phần mở rộng cụ thể. Vì chúng tôi cần tất cả các tệp có. txt vì vậy chúng tôi đã sử dụng toàn cầu ở đây
  • # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    9 danh sách trống này sẽ lưu trữ tất cả các tệp có. phần mở rộng txt.
    for file in glob.glob("*.txt"):
        txt_files.append(file)
    0 điều này sẽ theo dõi tất cả các từ trong nhiều tệp
for file in glob.glob("*.txt"):
    txt_files.append(file)
  • Trong mã này, chúng tôi đã bắt đầu một vòng lặp và quả cầu được sử dụng để quét tất cả các tệp bằng. phần mở rộng txt
  • mỗi tệp được thêm vào một danh sách trống. Vì vậy, mỗi lần vòng lặp chạy tên tệp từ thư mục hiện tại có phần mở rộng txt được thêm vào danh sách trống
for f in txt_files:
    file = open(f, "r")
    read_data = file.read()
    per_word = read_data.split()
    words += len(per_word)
  • Trong mã này, chúng tôi đã bắt đầu một vòng lặp trên danh sách trống vì không phải danh sách trống đó có tất cả các tệp văn bản trong đó
  • Mỗi vòng lặp thời gian chạy một tệp được mở, đọc, tất cả các câu được chia thành các từ và tổng số từ được thêm vào một biến
  • Theo cách này, giả sử tệp một có 20 từ và tệp hai có 30 từ thì biến từ sẽ hiển thị 50 (20 + 30) từ ở cuối vòng lặp
  • for file in glob.glob("*.txt"):
        txt_files.append(file)
    tổng số 1 từ được in với thông điệp mô tả

Mã nguồn

Đây là mã nguồn để triển khai Python Đếm từ trong nhiều tệp

import glob

# empty list and variable
txt_files = []
words = 0

# loop to add text files to a list
for file in glob.glob("*.txt"):
    txt_files.append(file)

# loop to read, split and count word of each file
for f in txt_files:
    file = open(f, "r")
    read_data = file.read()
    per_word = read_data.split()
    words += len(per_word)

# print total words in multiple files
print('Total Words:',words)

đầu ra

Đây là đầu ra của mã nguồn trên để triển khai Python Đếm từ trong nhiều tệp

Đếm số lượng từ duy nhất python
Python đếm từ trong nhiều tệp

Đọc. Từ điển danh sách Python

Python Đếm các từ duy nhất trong một tệp

Trong phần này, chúng ta sẽ tìm hiểu về Python Đếm các từ duy nhất trong một tệp. Chương trình python sẽ kiểm tra sự xuất hiện của từng từ trong một tệp văn bản và sau đó nó sẽ chỉ đếm các từ duy nhất trong một tệp

  • Sử dụng Python, chúng tôi có thể đếm các từ duy nhất từ ​​một tệp trong sáu bước đơn giản
    • tạo bộ đếm và gán giá trị mặc định bằng 0
    • mở tệp ở chế độ chỉ đọc
    • đọc dữ liệu của tập tin
    • tách dữ liệu thành từ và lưu trữ trong một tập hợp
    • bắt đầu một vòng lặp for và tiếp tục tăng bộ đếm với mỗi từ
    • Cuối cùng, in bộ đếm
  • for file in glob.glob("*.txt"):
        txt_files.append(file)
    2là bộ đếm có giá trị mặc định được đặt thành 0. Bộ đếm này sẽ tăng sau
  • for file in glob.glob("*.txt"):
        txt_files.append(file)
    3 trong mã này, chúng tôi đang mở một tệp văn bản ở chế độ chỉ đọc và thông tin được lưu trữ trong một biến tệp
  • # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    7 trong mã này, chúng tôi đang đọc dữ liệu được lưu trữ trong một tệp
  • for file in glob.glob("*.txt"):
        txt_files.append(file)
    5 Trong mã này, chúng tôi đã chia nhỏ dữ liệu và chúng tôi cũng đã loại bỏ các giá trị trùng lặp. Đặt luôn chỉ giữ dữ liệu duy nhất
  • chúng tôi đã bắt đầu một vòng lặp for trên tổng số từ và mỗi khi vòng lặp chạy, nó sẽ thêm một từ vào bộ đếm. Vì vậy, nếu có 35 từ duy nhất thì vòng lặp sẽ chạy 35 lần và bộ đếm sẽ có 35
  • Cuối cùng, số lượng được in dưới dạng đầu ra

Mã nguồn

Đây là mã nguồn để triển khai Python Đếm các từ duy nhất trong một tệp

count = 0
file = open("names.txt", "r")
read_data = file.read()
words = set(read_data.split())
for word in words:
    count += 1
    
print('Total Unique Words:', count)

đầu ra

Đây là kết quả của một chương trình đếm các từ duy nhất trong một tệp bằng Python. Trong kết quả này, chúng tôi đã đọc một tệp và nó có 85 từ duy nhất trong đó

Đếm số lượng từ duy nhất python
Tập tin số lượng từ duy nhất của Python

Đọc. Từ điển Python sang CSV

Python Đếm từ trong tệp Excel

Trong phần này, chúng ta sẽ tìm hiểu về Python Đếm từ trong tệp Excel

  • Cách tốt nhất để đếm từ trong tệp excel bằng python là sử dụng mô-đun Pandas trong python
  • bạn cần cài đặt pandas trên thiết bị của mình
# anaconda 
conda install pandas

# pip
pip install pandas
  • Sử dụng phương pháp ____11_______6 trong gấu trúc, chúng ta có thể đếm tổng số từ trong một tệp có cột
  • Sử dụng
    for file in glob.glob("*.txt"):
        txt_files.append(file)
    7chúng ta có thể lấy giá trị cuối cùng của tổng số từ trong một tệp
  • Đây là cách triển khai trên Jupyter Notebook

Đọc. Gấu trúc trong Python

Python Đếm các từ duy nhất trong tệp văn bản

Trong phần này, chúng ta sẽ tìm hiểu về Python Đếm các từ duy nhất trong một tệp. Chương trình python sẽ kiểm tra sự xuất hiện của từng từ trong một tệp văn bản và sau đó nó sẽ chỉ đếm các từ duy nhất trong một tệp

  • Sử dụng Python, chúng tôi có thể đếm các từ duy nhất từ ​​một tệp trong sáu bước đơn giản
    • tạo bộ đếm và gán giá trị mặc định bằng 0
    • mở tệp ở chế độ chỉ đọc
    • đọc dữ liệu của tập tin
    • tách dữ liệu thành từ và lưu trữ trong một tập hợp
    • bắt đầu một vòng lặp for và tiếp tục tăng bộ đếm với mỗi từ
    • Cuối cùng, in bộ đếm
  • for file in glob.glob("*.txt"):
        txt_files.append(file)
    2là bộ đếm có giá trị mặc định được đặt thành 0. Bộ đếm này sẽ tăng sau
  • for file in glob.glob("*.txt"):
        txt_files.append(file)
    3 trong mã này, chúng tôi đang mở một tệp văn bản ở chế độ chỉ đọc và thông tin được lưu trữ trong một biến tệp
  • # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    7 trong mã này, chúng tôi đang đọc dữ liệu được lưu trữ trong một tệp
  • for file in glob.glob("*.txt"):
        txt_files.append(file)
    5 Trong mã này, chúng tôi đã chia nhỏ dữ liệu và chúng tôi cũng đã loại bỏ các giá trị trùng lặp. Đặt luôn chỉ giữ dữ liệu duy nhất
  • chúng tôi đã bắt đầu một vòng lặp for trên tổng số từ và mỗi khi vòng lặp chạy, nó sẽ thêm một từ vào bộ đếm. Vì vậy, nếu có 35 từ duy nhất thì vòng lặp sẽ chạy 35 lần và bộ đếm sẽ có 35
  • Cuối cùng, số lượng được in dưới dạng đầu ra với thông báo mô tả

Mã nguồn

Đây là mã nguồn để triển khai Python Đếm các từ duy nhất trong tệp văn bản

count = 0
file = open("names.txt", "r")
read_data = file.read()
words = set(read_data.split())
for word in words:
    count += 1
    
print('Total Unique Words:', count)

đầu ra

Đây là kết quả của một chương trình đếm các từ duy nhất trong một tệp bằng Python. Trong kết quả này, chúng tôi đã đọc một tệp và nó có 85 từ duy nhất trong đó

Đếm số lượng từ duy nhất python
Python Đếm các từ duy nhất trong tệp văn bản

Đọc. Python Pandas CSV

Chương trình Python để đếm số từ trong tệp

Trong phần này, chúng ta sẽ tìm hiểu về python đếm từ trong tệp. Nói cách khác, chúng ta sẽ học cách đếm tổng số từ trong một tệp văn bản bằng Python

  • Toàn bộ quá trình được chia thành ba bước đơn giản
    • mở tệp văn bản ở chế độ chỉ đọc
    • đọc thông tin của tập tin
    • chia các câu thành các từ và tìm len
  • Sử dụng
    # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    1, chúng tôi có thể mở tệp ở chế độ chỉ đọc và lưu trữ thông tin này trong một biến tệp
  • # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    2 câu lệnh này được sử dụng để đọc toàn bộ dữ liệu trong một lần và lưu trữ nó trong một biến có tên là read_data
  • Đã đến lúc chia các câu thành các từ và điều đó có thể được thực hiện bằng cách sử dụng
    # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    3 ở đây phương thức split() được sử dụng để chia nhỏ từng câu trong read_data và tất cả thông tin này được lưu trữ trong một biến có tên per_word
  • bước cuối cùng là in độ dài của biến per_word. Xin lưu ý rằng chiều dài đang đếm tổng số từ trong tệp. Đây là câu lệnh để in một tin nhắn có tổng số từ
    # asking for user input
    search_word_count = input('Enter the word: ')
    
    # opening text file in read only mode
    file = open("file.txt", "r")
    
    # reading data of the file
    read_data = file.read()
    
    # converting data in lower case and the counting the occurrence 
    word_count = read_data.lower().count(search_word_count)
    
    # printing word and it's count
    print(f"The word '{search_word_count}' appeared {word_count} times.")
    
    4

Mã nguồn

Đây là mã nguồn để triển khai Python Count Words in a File

file = open("file.txt", "r")
read_data = file.read()
per_word = read_data.split()

print('Total Words:', len(per_word))

đầu ra

Đây là đầu ra của việc đếm các từ trong một tệp bằng Python. Trong kết quả này, tệp văn bản chúng tôi đã sử dụng có 221 từ

Đếm số lượng từ duy nhất python

Đọc. Hàm tích hợp Python

Python đếm tần số từ trong một tệp

Trong phần này, chúng ta sẽ tìm hiểu về Python Đếm tần số từ trong một tệp. Nói cách khác, chúng ta sẽ đếm số lần một từ xuất hiện trong tệp

  • Tần suất của mỗi từ có thể được đếm trong 3 bước đơn giản trong Python
    • Nhập bộ đếm từ mô-đun bộ sưu tập trong python
    • tạo hàm nhận tên file, bên trong hàm mở file, đọc dữ liệu và tách câu thành từ. và giữ tất cả những thứ này bên trong phương thức truy cập
    • gọi hàm và in nó với thông báo mô tả
  • Trong phần này, chúng tôi đã nhập Bộ đếm từ các bộ sưu tập. Bộ đếm giữ dữ liệu ở định dạng khóa-giá trị. Định dạng từ điển sẽ là tốt nhất để hiển thị tên và sự xuất hiện của chúng
  • trong hàm count_word(), chúng tôi đã mở tệp văn bản và sau đó trả về mỗi từ với tổng số lần xuất hiện của chúng
  • Cuối cùng, chúng tôi đã gọi hàm và in nó với thông báo mô tả

Mã nguồn

Đây là mã nguồn để triển khai Python Đếm tần số từ trong một tệp

from collections import Counter

def count_word(file_name):
        with open(file_name) as f:
                return Counter(f.read().split())

print("Frequency :",count_word("names.txt"))

đầu ra

Trong kết quả này, mỗi từ được hiển thị với tổng số lần xuất hiện của chúng trong Python

Đếm số lượng từ duy nhất python
Python đếm tần số từ trong một tệp

Đọc. Nhận thư mục hiện tại Python

Tệp CSV đếm từ của Python

Trong phần này, chúng ta sẽ tìm hiểu về Python Word Count trong tệp CSV

  • Cách tốt nhất để đếm từ trong tệp excel bằng python là sử dụng mô-đun Pandas trong python
  • bạn cần cài đặt pandas trên thiết bị của mình
# anaconda 
conda install pandas

# pip
pip install pandas
  • for file in glob.glob("*.txt"):
        txt_files.append(file)
    6phương pháp trong pandas chúng ta có thể đếm tổng số từ trong một tệp có cột
  • Sử dụng
    for file in glob.glob("*.txt"):
        txt_files.append(file)
    7chúng ta có thể lấy giá trị cuối cùng của tổng số từ trong một tệp
  • Đây là cách triển khai trên Jupyter Notebook

Bạn cũng có thể thích đọc các bài viết sau

  • Tạo một mảng trống trong Python
  • Python tìm chỉ mục của phần tử trong danh sách
  • Mảng Python với các ví dụ
  • Bảng băm trong python
  • Nếu không có điều kiện trong python
  • Python tạo tập rỗng
  • Python tìm số trong Chuỗi

Trong hướng dẫn này, chúng ta đã học về Python Đếm từ trong tệp. Ngoài ra, chúng tôi đã đề cập đến các chủ đề này

  • Python Đếm từ trong tệp
  • Python Đếm các từ cụ thể trong tệp
  • Python đếm từ trong nhiều tệp
  • Python Đếm các tệp từ duy nhất
  • Python Đếm từ trong tệp Excel
  • Python Đếm các từ duy nhất trong tệp văn bản
  • Chương trình Python để đếm số từ trong tệp
  • Python đếm tần số từ trong một tệp
  • Tệp CSV đếm từ của Python

Đếm số lượng từ duy nhất python

Bijay Kumar

Python là một trong những ngôn ngữ phổ biến nhất ở Hoa Kỳ. Tôi đã làm việc với Python trong một thời gian dài và tôi có kinh nghiệm làm việc với nhiều thư viện khác nhau trên Tkinter, Pandas, NumPy, Turtle, Django, Matplotlib, Tensorflow, Scipy, Scikit-Learn, v.v… Tôi có kinh nghiệm làm việc với nhiều khách hàng khác nhau . Kiểm tra hồ sơ của tôi