Hướng dẫn how to remove html formatting from word document - cách xóa định dạng html khỏi tài liệu word

Hướng dẫn how to remove html formatting from word document - cách xóa định dạng html khỏi tài liệu word

Được viết bởi Allen Wyatt (cập nhật lần cuối ngày 26 tháng 6 năm 2018) Mẹo này áp dụng cho Word 2007, 2010, 2013, 2016, 2019 và Word trong Microsoft 365
This tip applies to Word 2007, 2010, 2013, 2016, 2019, and Word in Microsoft 365


Aaron có một tài liệu chứa một số thẻ HTML và anh ta muốn xóa các thẻ nhưng duy trì định dạng mà chúng đại diện. Chẳng hạn, nếu anh ta có một cụm từ xuất hiện theo cách này, anh ta muốn xóa các thẻ (và) nhưng có "một cụm từ" xuất hiện bằng chữ in nghiêng. Aaron khá chắc chắn rằng điều này có thể được thực hiện với tìm và thay thế, nhưng anh ta không hoàn toàn chắc chắn làm thế nào để đi về nó.

Bạn nói đúng, Aaron, bạn có thể sử dụng tìm và thay thế để hoàn thành việc loại bỏ. Cách bạn sẽ làm là làm theo các bước sau:

  1. Nhấn Ctrl+H. Word Hiển thị tab Thay thế hộp thoại Tìm và thay thế.Ctrl+H. Word displays the Replace tab of the Find and Replace dialog box.
  2. Nhấp vào nút Thêm, nếu nó có sẵn. (Xem Hình 1.)
  3. Hướng dẫn how to remove html formatting from word document - cách xóa định dạng html khỏi tài liệu word

    Hình 1. Tab thay thế của hộp thoại Tìm và thay thế. The Replace tab of the Find and Replace dialog box.

  4. Đảm bảo hộp kiểm sử dụng WildCards được chọn.
  5. Trong tìm hộp nào, nhập như sau: \ ([!\([!<]@)\
  6. Trong hộp thay thế, nhập như sau: \ 1\1
  7. Với điểm chèn vẫn còn trong hộp thay thế, nhấn Ctrl+I một lần. Văn bản "in nghiêng" sẽ xuất hiện ngay bên dưới hộp thay thế.Ctrl+I once. The text "Italic" should appear just below the Replace With box.
  8. Nhấp vào Thay thế tất cả.

Mã mà bạn nhập vào tìm hộp nào (Bước 4) có thể trông hơi khó khăn. Tất cả những gì bạn đang nói Word làm là tìm thẻ html () bắt đầu theo sau là bất kỳ số lượng ký tự nào và kết thúc bằng thẻ HTML đóng (). Mục nhập rất ngắn trong hộp thay thế (Bước 5) chỉ đơn giản nói để thay thế bất cứ điều gì được tìm thấy bằng nội dung của phần tử đầu tiên của hộp tìm thấy nào được bao quanh bởi dấu ngoặc đơn mà chỉ là văn bản giữa hai thẻ HTML .

Nếu bạn muốn loại bỏ sự cần thiết phải nhớ (hoặc tra cứu) nội dung của hộp tìm kiếm mọi lúc, bạn có thể đặt hoạt động tìm và thay thế vào một macro:

Sub ConvertItalicTags()
    Selection.Find.ClearFormatting
    Selection.Find.Replacement.ClearFormatting
    Selection.Find.Replacement.Font.Italic = True
    With Selection.Find
        .Text = "\<i\>([!<]@)\"
        .Replacement.Text = "\1"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = True
        .MatchCase = False
        .MatchWholeWord = False
        .MatchAllWordForms = False
        .MatchSoundsLike = False
        .MatchWildcards = True
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
End Sub

Gán macro cho một phím tắt và bạn có thể xóa các thẻ HTML in nghiêng bất cứ lúc nào bạn cần. Bạn cũng có thể mở rộng macro để thực hiện các thay đổi tương tự so với các thẻ HTML khác mà bạn có thể cần phải xóa. Bạn thậm chí có thể muốn đảm bảo rằng các thẻ thay thế được xử lý. Chẳng hạn, HTML sử dụng cả hai và thẻ để hiển thị thông tin bằng chữ in nghiêng, điều đó có nghĩa là bạn nên giải thích cho khả năng cả hai bộ thẻ trong macro của bạn.

Tất nhiên, có một cách tiếp cận hoàn toàn khác mà bạn có thể sử dụng để loại bỏ các thẻ HTML và vẫn giữ lại định dạng liên quan đến các thẻ đó. Đó là để lưu văn bản được mã hóa HTML vào một tệp văn bản, mở nó trong trình duyệt của bạn, sao chép văn bản trong cửa sổ trình duyệt và dán trực tiếp vào tài liệu Word. Nếu mọi việc suôn sẻ, bạn sẽ có văn bản được định dạng mong muốn trong tài liệu đã hoàn thành của bạn.

Nếu bạn muốn biết cách sử dụng các macro được mô tả trên trang này (hoặc trên bất kỳ trang nào khác trên các trang web Wordtips), tôi đã chuẩn bị một trang đặc biệt bao gồm thông tin hữu ích. Nhấn vào đây để mở trang đặc biệt đó trong tab Trình duyệt mới.

Wordtips là nguồn của bạn để đào tạo Word Word hiệu quả về chi phí. .

Tác giả sinh học

Với hơn 50 cuốn sách phi hư cấu và nhiều bài báo trên tạp chí về tín dụng của mình, Allen Wyatt là một tác giả được quốc tế công nhận. Ông là chủ tịch của Sharon Parq Associates, một công ty dịch vụ máy tính và xuất bản. Tìm hiểu thêm về Allen ...

Thêm từ Allen

Thay đổi thứ tự in nhãn

Nếu bạn muốn thay đổi thứ tự trong đó các nhãn được in khi thực hiện hợp nhất thư, Word không cung cấp nhiều tùy chọn. & Nbsp; ...

Khám phá nhiều hơn

Sử dụng chỉ báo tiến trình trong macro

Một vài mẹo về việc thêm một chỉ báo tiến trình chạy trong các tính toán vĩ mô dài.

Khám phá nhiều hơn

Xóa các cột trống

Nhập dữ liệu từ một chương trình khác và bạn có thể kết thúc với rất nhiều cột trống trong dữ liệu của mình.Đây là cách nhanh nhất & nbsp; ...

Khám phá nhiều hơn

Làm thế nào để bạn thay đổi định dạng HTML trong Word?

Để chuyển đổi tệp Word thành HTML bằng Word2CleanHTML,..
Mở tệp từ.....
Chọn tất cả bằng Ctrl + A;Sao chép tất cả bằng Ctrl + C ..
Chuyển đến công cụ Word2Clean và dán văn bản bằng Ctrl + V ..
Nhấp vào nút chuyển đổi để làm sạch nút HTML ..
Sau khi tệp được chuyển đổi, nhấp vào Sao chép HTML sang Clipboard ..

Làm thế nào để tôi trở lại phong cách bình thường trong Word?

Thay đổi bố cục mặc định Mở mẫu hoặc tài liệu dựa trên mẫu có cài đặt mặc định bạn muốn thay đổi.Trên menu Định dạng, nhấp vào tài liệu, sau đó nhấp vào tab Bố cục.Thực hiện bất kỳ thay đổi nào bạn muốn, và sau đó nhấp vào mặc định.On the Format menu, click Document, and then click the Layout tab. Make any changes that you want, and then click Default.

Làm cách nào để loại bỏ bố cục web trong Word?

Bạn có thể đặt lại MS Word về chế độ xem này bằng cách chọn tab Xem ở đầu cửa sổ, sau đó nhấp vào nút In Layout in trong nhóm xem trên ruy băng.selecting the View tab at the top of the window, then clicking the Print Layout button in the Views group on the ribbon.