Python-docx lấy kiểu đoạn văn

Điều đầu tiên cần hiểu về hệ thống chuyển đổi là nó được thiết kế như một đường ống. Theo sơ đồ, nó trông như thế này

Show
Python-docx lấy kiểu đoạn văn

Định dạng đầu vào được chuyển đổi đầu tiên thành XHTML bằng plugin Đầu vào thích hợp. HTML này sau đó được chuyển đổi. Ở bước cuối cùng, XHTML đã xử lý được chuyển đổi sang định dạng đầu ra được chỉ định bằng plugin Đầu ra thích hợp. Kết quả chuyển đổi có thể khác nhau rất nhiều, dựa trên định dạng đầu vào. Một số định dạng chuyển đổi tốt hơn nhiều so với những định dạng khác. Danh sách các định dạng nguồn tốt nhất để chuyển đổi có sẵn tại đây .

Các biến đổi hoạt động trên đầu ra XHTML là nơi tất cả công việc diễn ra. Có nhiều biến đổi khác nhau, ví dụ: để chèn siêu dữ liệu sách dưới dạng một trang ở đầu sách, để phát hiện tiêu đề chương và tự động tạo Mục lục, để điều chỉnh kích thước phông chữ theo tỷ lệ, v.v. Điều quan trọng cần nhớ là tất cả các biến đổi hoạt động trên đầu ra XHTML bởi plugin Đầu vào, không phải trên chính tệp đầu vào. Vì vậy, ví dụ: nếu bạn yêu cầu calibre chuyển đổi tệp RTF thành EPUB, thì trước tiên tệp đó sẽ được chuyển đổi nội bộ thành XHTML, các biến đổi khác nhau sẽ được áp dụng cho XHTML và sau đó plugin Đầu ra sẽ tạo tệp EPUB, tự động tạo tất cả siêu dữ liệu

Bạn có thể xem quá trình này đang hoạt động bằng cách sử dụng tùy chọn gỡ lỗi

Python-docx lấy kiểu đoạn văn
. Chỉ cần chỉ định đường dẫn đến một thư mục cho đầu ra gỡ lỗi. Trong quá trình chuyển đổi, calibre sẽ đặt XHTML được tạo bởi các giai đoạn khác nhau của quy trình chuyển đổi vào các thư mục con khác nhau. Bốn thư mục con là.

Các giai đoạn của quy trình chuyển đổi

Thư mục

Sự mô tả

đầu vào

Cái này chứa đầu ra HTML của plugin Đầu vào. Sử dụng cái này để gỡ lỗi plugin Đầu vào

phân tích cú pháp

Kết quả của quá trình tiền xử lý và chuyển đổi sang XHTML đầu ra từ plugin Đầu vào. Sử dụng để gỡ lỗi phát hiện cấu trúc

kết cấu

Phát hiện cấu trúc bài đăng, nhưng trước khi làm phẳng CSS và chuyển đổi kích thước phông chữ. Sử dụng để gỡ lỗi chuyển đổi kích thước phông chữ và chuyển đổi CSS

xử lý

Ngay trước khi sách điện tử được chuyển đến plugin Đầu ra. Sử dụng để gỡ lỗi plugin Đầu ra

Nếu bạn muốn chỉnh sửa một chút tài liệu đầu vào trước khi chuyển đổi nó, điều tốt nhất nên làm là chỉnh sửa các tệp trong thư mục con

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
8, sau đó nén nó lên và sử dụng tệp ZIP làm đầu vào . Để thực hiện việc này, hãy sử dụng hộp thoại Chỉnh sửa thông tin meta để thêm tệp ZIP làm định dạng cho sách, sau đó, ở góc trên cùng bên trái của hộp thoại chuyển đổi .

Tài liệu này sẽ giải quyết chủ yếu các biến đổi khác nhau hoạt động trên XHTML trung gian và cách kiểm soát chúng. Cuối cùng là một số mẹo dành riêng cho từng định dạng đầu vào/đầu ra

Nhìn và cảm nhận¶

nội dung

  • Phông chữ

  • Chữ

  • Cách trình bày

  • tạo kiểu

  • Chuyển đổi phong cách

  • Chuyển đổi HTML

Nhóm tùy chọn này kiểm soát các khía cạnh khác nhau của giao diện của sách điện tử được chuyển đổi

Phông chữ¶

Một trong những tính năng thú vị nhất của trải nghiệm đọc sách điện tử là khả năng dễ dàng điều chỉnh kích thước phông chữ cho phù hợp với nhu cầu cá nhân và điều kiện ánh sáng. calibre có các thuật toán tinh vi để đảm bảo rằng tất cả sách mà nó xuất ra đều có kích thước phông chữ nhất quán, bất kể kích thước phông chữ nào được chỉ định trong tài liệu đầu vào

Cỡ chữ cơ sở của tài liệu là cỡ chữ phổ biến nhất trong tài liệu đó, tôi. e. , kích thước của phần lớn văn bản trong tài liệu đó. Khi bạn chỉ định Cỡ chữ cơ bản , calibre sẽ tự động thay đổi tỷ lệ tất cả các cỡ chữ trong tài liệu theo tỷ lệ để cỡ chữ phổ biến nhất trở thành cỡ chữ cơ sở được chỉ định . Bằng cách chọn cỡ phông cơ bản lớn hơn, bạn có thể làm cho phông chữ trong tài liệu lớn hơn và ngược lại. Khi bạn đặt cỡ chữ cơ sở, để có kết quả tốt nhất, bạn cũng nên đặt phím cỡ chữ.

Thông thường, calibre sẽ tự động chọn kích thước phông chữ cơ bản phù hợp với cấu hình đầu ra mà bạn đã chọn (xem Thiết lập trang ). Tuy nhiên, bạn có thể ghi đè điều này tại đây trong trường hợp mặc định không phù hợp với bạn.

Tùy chọn Phím cỡ chữ cho phép bạn kiểm soát cách thay đổi kích thước phông chữ không phải cơ sở. Thuật toán thay đổi kích thước phông chữ hoạt động bằng cách sử dụng khóa kích thước phông chữ, đây chỉ đơn giản là một danh sách kích thước phông chữ được phân tách bằng dấu phẩy. Phím kích thước phông chữ cho biết kích thước phông chữ lớn hơn hoặc nhỏ hơn bao nhiêu "bước" so với kích thước phông chữ cơ sở. Ý tưởng là nên có một số kích thước phông chữ hạn chế trong một tài liệu. Ví dụ: một kích thước cho nội dung văn bản, một vài kích thước cho các cấp tiêu đề khác nhau và một vài kích thước cho siêu/tập lệnh phụ và chú thích cuối trang. Phím kích thước phông chữ cho phép calibre phân chia các kích thước phông chữ trong tài liệu đầu vào thành các “ngăn” riêng biệt tương ứng với các kích thước phông chữ hợp lý khác nhau.

Hãy minh họa bằng một ví dụ. Giả sử tài liệu nguồn mà chúng tôi đang chuyển đổi được tạo bởi một người có thị lực xuất sắc và có cỡ chữ cơ bản là 8pt. Điều đó có nghĩa là phần lớn văn bản trong tài liệu có kích thước 8pts, trong khi các tiêu đề lớn hơn một chút (giả sử 10 và 12pt) và chú thích cuối trang hơi nhỏ hơn ở 6pt. Bây giờ nếu chúng ta sử dụng các cài đặt sau

Base font size : 12pt
Font size key  : 7, 8, 10, 12, 14, 16, 18, 20

Tài liệu đầu ra sẽ có cỡ chữ cơ bản là 12pt, tiêu đề là 14 và 16pt và chú thích cuối trang là 8pt. Bây giờ, giả sử chúng ta muốn làm cho kích thước tiêu đề lớn nhất nổi bật hơn và làm cho các chú thích cũng lớn hơn một chút. Để đạt được điều này, phím phông chữ phải được thay đổi thành

New font size key : 7, 9, 12, 14, 18, 20, 22

Các tiêu đề lớn nhất bây giờ sẽ trở thành 18pt, trong khi các chú thích cuối trang sẽ trở thành 9pt. Bạn có thể thử với các cài đặt này để thử và tìm ra cài đặt nào sẽ tối ưu cho mình bằng cách sử dụng trình hướng dẫn thay đổi kích thước phông chữ. Bạn có thể truy cập cài đặt này bằng cách nhấp vào nút nhỏ bên cạnh phím Kích thước phông chữPhím cỡ chữPhím cỡ chữ setting.

Tất cả việc thay đổi kích thước phông chữ trong quá trình chuyển đổi cũng có thể bị vô hiệu hóa tại đây, nếu bạn muốn giữ nguyên kích thước phông chữ trong tài liệu đầu vào

Cài đặt có liên quan là Chiều cao của dòng . Chiều cao dòng kiểm soát chiều cao dọc của dòng. Theo mặc định, (độ cao của dòng bằng 0), không có thao tác nào đối với độ cao của dòng được thực hiện. Nếu bạn chỉ định một giá trị không mặc định, chiều cao của dòng sẽ được đặt ở tất cả các vị trí không chỉ định chiều cao của dòng riêng của chúng. Tuy nhiên, đây là thứ vũ khí cùn và nên được sử dụng một cách tiết kiệm. Nếu bạn muốn điều chỉnh độ cao của dòng cho một số phần của thông tin đầu vào, thì tốt hơn là sử dụng CSS bổ sung .

Trong phần này, bạn cũng có thể yêu cầu calibre nhúng bất kỳ phông chữ được tham chiếu nào vào sách. Điều này sẽ cho phép các phông chữ hoạt động trên thiết bị đọc ngay cả khi chúng không có sẵn trên thiết bị

Chữ¶

Văn bản có thể được căn đều hoặc không. Văn bản được căn đều có thêm khoảng trắng giữa các từ để tạo lề phải mượt mà. Một số người thích văn bản hợp lý, những người khác thì không. Thông thường, tầm cỡ sẽ bảo vệ sự biện minh trong tài liệu gốc. Nếu bạn muốn ghi đè lên nó, bạn có thể sử dụng tùy chọn Chứng minh văn bản trong phần này.

Bạn cũng có thể yêu cầu calibre để Dấu câu thông minh sẽ thay thế dấu ngoặc kép đơn giản, dấu gạch ngang và dấu chấm lửng bằng các lựa chọn thay thế chính xác về mặt chính tả của chúng. Lưu ý thuật toán này không hoàn hảo nên cần xem lại kết quả. Tính năng ngược lại, cụ thể là Dấu chấm câu không thông minh cũng khả dụng.

Cuối cùng là Mã hóa ký tự đầu vào . Các tài liệu cũ hơn đôi khi không chỉ định mã hóa ký tự của chúng. Khi được chuyển đổi, điều này có thể dẫn đến các ký tự không phải tiếng Anh hoặc các ký tự đặc biệt như dấu ngoặc kép thông minh bị hỏng. calibre cố gắng tự động phát hiện mã hóa ký tự của tài liệu nguồn nhưng không phải lúc nào cũng thành công. Bạn có thể buộc nó giả sử một mã hóa ký tự cụ thể bằng cách sử dụng cài đặt này. cp1252 là mã hóa phổ biến cho các tài liệu được tạo bằng phần mềm Windows. Bạn cũng nên đọc Làm cách nào để chuyển đổi tệp chứa các ký tự không phải tiếng Anh hoặc dấu ngoặc kép thông minh? để biết thêm về các vấn đề mã hóa.

Cách trình bày¶

Thông thường, các đoạn văn trong XHTML được hiển thị với một dòng trống giữa chúng và không có văn bản đầu dòng thụt vào. calibre có một số tùy chọn để kiểm soát điều này. Xóa khoảng cách giữa các đoạn văn đảm bảo chắc chắn rằng tất cả các đoạn văn không có khoảng cách giữa các đoạn văn. Nó cũng đặt thụt lề văn bản thành 1. 5em (có thể thay đổi) để đánh dấu đầu mỗi đoạn văn. Chèn dòng trống làm ngược lại, đảm bảo rằng có chính xác một dòng trống giữa mỗi cặp đoạn văn. Cả hai tùy chọn này đều rất toàn diện, loại bỏ khoảng cách hoặc chèn nó cho tất cả các đoạn văn (về mặt kỹ thuật là thẻ

Nếu bạn muốn xóa khoảng cách giữa tất cả các đoạn, ngoại trừ một số đoạn được chọn, không sử dụng các tùy chọn này. Thay vào đó, hãy thêm mã CSS sau vào CSS bổ sung .

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }

Sau đó, trong tài liệu nguồn của bạn, hãy đánh dấu các đoạn cần giãn cách với class=”spacious”. Nếu tài liệu đầu vào của bạn không ở dạng HTML, hãy sử dụng tùy chọn Gỡ lỗi, được mô tả trong phần Giới thiệu để nhận HTML (sử dụng thư mục con

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
8)

Một tùy chọn hữu ích khác là Tuyến tính hóa bảng . Một số tài liệu được thiết kế kém sử dụng bảng để kiểm soát bố cục của văn bản trên trang. Khi được chuyển đổi, các tài liệu này thường có văn bản chạy ra khỏi trang và các hiện vật khác. Tùy chọn này sẽ trích xuất nội dung từ các bảng và trình bày nó theo kiểu tuyến tính. Lưu ý rằng tùy chọn này tuyến tính hóa tất cả các bảng, vì vậy chỉ sử dụng tùy chọn này nếu bạn chắc chắn rằng tài liệu đầu vào không sử dụng bảng cho các mục đích hợp pháp, chẳng hạn như trình bày thông tin dạng bảng.

Tạo kiểu¶

Tùy chọn CSS bổ sung cho phép bạn chỉ định CSS tùy ý sẽ được áp dụng cho tất cả các tệp HTML trong đầu vào. CSS này được áp dụng với mức độ ưu tiên rất cao và do đó sẽ ghi đè hầu hết CSS có trong chính tài liệu đầu vào. Bạn có thể sử dụng cài đặt này để tinh chỉnh cách trình bày/bố cục tài liệu của mình. Ví dụ: nếu bạn muốn tất cả các đoạn của chú thích cuối lớp được căn phải, chỉ cần thêm.

.endnote { text-align: right }

hoặc nếu bạn muốn thay đổi thụt đầu dòng của tất cả các đoạn văn

p { text-indent: 5mm; }

CSS bổ sung là một tùy chọn rất mạnh mẽ, nhưng bạn cần hiểu cách CSS hoạt động để sử dụng nó với tiềm năng đầy đủ của nó. Bạn có thể sử dụng tùy chọn đường dẫn gỡ lỗi được mô tả ở trên để xem CSS nào có trong tài liệu đầu vào của bạn.

Một tùy chọn đơn giản hơn là sử dụng Thông tin kiểu bộ lọc . Điều này cho phép bạn xóa tất cả các thuộc tính CSS của các loại đã chỉ định khỏi tài liệu. Ví dụ: bạn có thể sử dụng nó để xóa tất cả màu sắc hoặc phông chữ.

Chuyển đổi phong cách¶

Đây là cơ sở liên quan đến phong cách mạnh mẽ nhất. Bạn có thể sử dụng nó để xác định các quy tắc thay đổi kiểu dựa trên các điều kiện khác nhau. Ví dụ: bạn có thể sử dụng nó để thay đổi tất cả các màu xanh lục thành xanh lam hoặc xóa tất cả các kiểu in đậm khỏi văn bản hoặc tô màu tất cả các tiêu đề theo một màu nhất định, v.v.

Chuyển đổi HTML¶

Tương tự như kiểu chuyển đổi, nhưng cho phép bạn thay đổi nội dung HTML của cuốn sách. Bạn có thể thay thế thẻ này bằng thẻ khác, thêm lớp hoặc thuộc tính khác vào thẻ dựa trên nội dung của chúng, v.v.

Thiết lập trang¶

Các tùy chọn Thiết lập trang để kiểm soát bố cục màn hình, như lề và kích thước màn hình. Có các tùy chọn để thiết lập lề trang, tùy chọn này sẽ được plugin đầu ra sử dụng, nếu định dạng đầu ra được chọn hỗ trợ lề trang. Ngoài ra, bạn nên chọn một Profile đầu vào và một profile đầu ra. Về cơ bản, cả hai bộ cấu hình đều xử lý cách diễn giải các phép đo trong tài liệu đầu vào/đầu ra, kích thước màn hình và các phím thay đổi kích thước phông chữ mặc định.

Nếu bạn biết rằng tệp bạn đang chuyển đổi dự định sẽ được sử dụng trên một nền tảng thiết bị/phần mềm cụ thể, hãy chọn cấu hình đầu vào tương ứng, nếu không, chỉ cần chọn cấu hình đầu vào mặc định. Nếu bạn biết các tệp bạn đang sản xuất dành cho một loại thiết bị cụ thể, hãy chọn cấu hình đầu ra tương ứng. Nếu không, hãy chọn một trong các cấu hình đầu ra Chung. Nếu bạn đang chuyển đổi sang MOBI hoặc AZW3 thì hầu như bạn sẽ luôn muốn chọn một trong các cấu hình đầu ra của Kindle. Mặt khác, cách tốt nhất cho các thiết bị đọc sách điện tử hiện đại là chọn cấu hình đầu ra E-ink HD chung .

Cấu hình đầu ra cũng kiểm soát kích thước màn hình. Ví dụ, điều này sẽ khiến hình ảnh được tự động thay đổi kích thước để vừa với màn hình ở một số định dạng đầu ra. Vì vậy, hãy chọn cấu hình của thiết bị có kích thước màn hình tương tự như thiết bị của bạn

Xử lý heuristic¶

Xử lý heuristic cung cấp nhiều chức năng có thể được sử dụng để thử và phát hiện cũng như khắc phục các sự cố phổ biến trong các tài liệu đầu vào có định dạng kém. Sử dụng các chức năng này nếu tài liệu đầu vào của bạn bị định dạng kém. Vì các chức năng này dựa trên các mẫu phổ biến, hãy lưu ý rằng trong một số trường hợp, một tùy chọn có thể dẫn đến kết quả tồi tệ hơn, vì vậy hãy cẩn thận khi sử dụng. Ví dụ: một vài trong số các tùy chọn này sẽ xóa tất cả các thực thể không phá vỡ khoảng trắng hoặc có thể bao gồm các kết quả khớp sai liên quan đến chức năng

Cho phép xử lý heuristic

Tùy chọn này kích hoạt giai đoạn xử lý heuristic của calibre trong quy trình chuyển đổi. Tính năng này phải được bật để các chức năng phụ khác nhau được áp dụng

Unwrap dòng

Kích hoạt tùy chọn này sẽ khiến calibre cố gắng phát hiện và sửa lỗi ngắt dòng khó tồn tại trong tài liệu bằng cách sử dụng dấu chấm câu và độ dài dòng. calibre trước tiên sẽ cố gắng phát hiện xem có tồn tại ngắt dòng cứng hay không, nếu chúng không tồn tại, calibre sẽ không cố gắng mở các dòng. Có thể giảm hệ số ngắt dòng nếu bạn muốn 'buộc' tầm cỡ để mở dòng

Yếu tố mở dòng

Tùy chọn này kiểm soát tầm cỡ thuật toán sử dụng để loại bỏ ngắt dòng cứng. Ví dụ: nếu giá trị của tùy chọn này là 0. 4, điều đó có nghĩa là calibre sẽ loại bỏ các ngắt dòng cứng ở cuối các dòng có độ dài nhỏ hơn 40% độ dài của tất cả các dòng trong tài liệu. Nếu tài liệu của bạn chỉ có một vài ngắt dòng cần sửa, thì giá trị này sẽ được giảm xuống một nơi nào đó trong khoảng 0. 1 và 0. 2

Phát hiện và đánh dấu các tiêu đề chương và tiêu đề phụ chưa được định dạng

If your document does not have chapter headings and titles formatted differently from the rest of the text, calibre can use this option to attempt to detect them and surround them with heading tags.

tags are used for chapter headings; tags are used for any titles that are detected.Chức năng này sẽ không tạo TOC, nhưng trong nhiều trường hợp, nó sẽ khiến cài đặt phát hiện chương mặc định của calibre phát hiện chính xác các chương và tạo TOC. Điều chỉnh XPath trong Phát hiện cấu trúc nếu TOC không được tạo tự động. Nếu không có tiêu đề nào khác được sử dụng trong tài liệu thì hãy đặt “//h. h2” trong Phát hiện cấu trúc sẽ là cách dễ nhất để tạo TOC cho tài liệuCác tiêu đề được chèn không được định dạng, để áp dụng định dạng, hãy sử dụng tùy chọn CSS bổ sung trong cài đặt chuyển đổi Giao diện. Ví dụ: để căn giữa các thẻ tiêu đề, hãy sử dụng như sau. h2, h3 { text-align: center } Renumber sequences of or tagsSome publishers format chapter headings using multiple or tags sequentially. calibre’s default conversion settings will cause such titles to be split into two pieces. This option will re-number the heading tags to prevent splitting.Xóa dòng trống giữa các đoạn vănTùy chọn này sẽ khiến thước đo phân tích các dòng trống có trong tài liệu. Nếu mỗi đoạn được xen kẽ với một dòng trống, thì calibre sẽ loại bỏ tất cả các đoạn trống đó. Chuỗi nhiều dòng trống sẽ được coi là ngắt cảnh và được giữ lại dưới dạng một đoạn văn. Tùy chọn này khác với tùy chọn Xóa khoảng cách đoạn văn trong Giao diện trong . Tùy chọn này cũng có thể xóa các đoạn đã được chèn bằng tùy chọn Chèn dòng trống của calibre. Đảm bảo ngắt cảnh được định dạng nhất quánVới tùy chọn này, calibre sẽ cố gắng phát hiện các điểm đánh dấu ngắt cảnh phổ biến và đảm bảo rằng chúng được căn giữa. Điểm đánh dấu ngắt cảnh 'Mềm', tôi. e. ngắt cảnh chỉ được xác định bởi khoảng trắng thừa, được tạo kiểu để đảm bảo rằng chúng sẽ không được hiển thị cùng với ngắt trangThay thế ngắt cảnhNếu tùy chọn này được định cấu hình thì calibre sẽ thay thế các điểm đánh dấu ngắt cảnh mà nó tìm thấy bằng văn bản thay thế do người dùng chỉ định. Xin lưu ý rằng một số ký tự trang trí có thể không được hỗ trợ trên tất cả các thiết bị đọcIn general you should avoid using HTML tags, calibre will discard any tags and use pre-defined markup. tags, i.e. horizontal rules, and tags are exceptions. Horizontal rules can optionally be specified with styles, if you choose to add your own style be sure to include the ‘width’ setting, otherwise the style information will be discarded. Image tags can used, but calibre does not provide the ability to add the image during conversion, this must be done after the fact using the ‘Edit book’ feature.Thẻ hình ảnh mẫu (đặt hình ảnh trong thư mục 'Hình ảnh' bên trong EPUB sau khi chuyển đổi)Ví dụ quy tắc ngang với phong cáchLoại bỏ các dấu gạch nối không cần thiếtcalibre sẽ phân tích tất cả nội dung được gạch nối trong tài liệu khi tùy chọn này được bật. Bản thân tài liệu được dùng làm từ điển để phân tích. Điều này cho phép calibre loại bỏ chính xác các dấu gạch ngang cho bất kỳ từ nào trong tài liệu bằng bất kỳ ngôn ngữ nào, cùng với các từ khoa học được tạo ra và tối nghĩa. Hạn chế chính là các từ chỉ xuất hiện một lần trong tài liệu sẽ không bị thay đổi. Quá trình phân tích xảy ra trong hai lượt, lượt đầu tiên phân tích các kết thúc của dòng. Các dòng chỉ được mở ra nếu từ tồn tại có hoặc không có dấu gạch nối trong tài liệu. Lần thứ hai phân tích tất cả các từ được gạch nối trong toàn bộ tài liệu, các dấu gạch nối sẽ bị xóa nếu từ tồn tại ở nơi khác trong tài liệu mà không khớpIn nghiêng các từ và mẫu phổ biếnKhi được bật, calibre sẽ tìm kiếm các từ và mẫu phổ biến biểu thị chữ nghiêng và in nghiêng chúng. Ví dụ là các quy ước văn bản phổ biến như ~từ~ hoặc các cụm từ thường được in nghiêng, v.v. g. cụm từ tiếng Latin như 'v.v. ’ hoặc ‘vân vân’Thay thế thụt lề thực thể bằng thụt lề CSSMột số tài liệu sử dụng quy ước xác định thụt lề văn bản bằng cách sử dụng các thực thể khoảng trắng không phá vỡ. Khi tùy chọn này được bật, calibre sẽ cố gắng phát hiện loại định dạng này và chuyển đổi chúng thành văn bản thụt lề 3% bằng CSSTìm kiếm & thay thế¶

Các tùy chọn này hữu ích chủ yếu để chuyển đổi tài liệu PDF hoặc chuyển đổi OCR, mặc dù chúng cũng có thể được sử dụng để khắc phục nhiều sự cố cụ thể của tài liệu. Ví dụ: một số chuyển đổi có thể để lại đầu trang và chân trang trong văn bản. Các tùy chọn này sử dụng biểu thức chính quy để thử và phát hiện đầu trang, chân trang hoặc văn bản tùy ý khác và xóa hoặc thay thế chúng. Hãy nhớ rằng chúng hoạt động trên XHTML trung gian do đường dẫn chuyển đổi tạo ra. Có một trình hướng dẫn giúp bạn tùy chỉnh các biểu thức chính quy cho tài liệu của mình. Nhấp vào cây đũa thần bên cạnh hộp biểu thức và nhấp vào nút 'Kiểm tra' sau khi soạn biểu thức tìm kiếm của bạn. Các trận đấu thành công sẽ được đánh dấu màu Vàng

Tìm kiếm hoạt động bằng cách sử dụng biểu thức chính quy Python. Tất cả văn bản phù hợp được xóa khỏi tài liệu một cách đơn giản hoặc được thay thế bằng mẫu thay thế. Mẫu thay thế là tùy chọn, nếu để trống thì văn bản khớp với mẫu tìm kiếm sẽ bị xóa khỏi tài liệu. Bạn có thể tìm hiểu thêm về biểu thức chính quy và cú pháp của chúng tại Tất cả về cách sử dụng biểu thức chính quy theo cỡ .

Phát hiện cấu trúc¶

Phát hiện cấu trúc liên quan đến việc calibre cố gắng hết sức để phát hiện các thành phần cấu trúc trong tài liệu đầu vào khi chúng không được chỉ định đúng cách. Ví dụ: chương, ngắt trang, đầu trang, chân trang, v.v. Như bạn có thể tưởng tượng, quá trình này rất khác nhau giữa các cuốn sách. May mắn thay, calibre có các tùy chọn rất mạnh mẽ để kiểm soát điều này. Sức mạnh đi kèm với sự phức tạp, nhưng nếu bạn dành thời gian để tìm hiểu sự phức tạp, bạn sẽ thấy nỗ lực đó rất xứng đáng.

Các chương và ngắt trang¶

calibre có hai bộ tùy chọn để phát hiện chươngchèn ngắt trang. This can sometimes be slightly confusing, as by default, calibre will insert page breaks before detected chapters as well as the locations detected by the page breaks option. The reason for this is that there are often location where page breaks should be inserted that are not chapter boundaries. Also, detected chapters can be optionally inserted into the auto generated Table of Contents.

calibre sử dụng XPath, một ngôn ngữ mạnh mẽ cho phép người dùng chỉ định ranh giới chương/ngắt trang. Lúc đầu, XPath có vẻ hơi khó sử dụng, may mắn thay, có hướng dẫn XPath trong Hướng dẫn sử dụng. Hãy nhớ rằng tính năng Phát hiện cấu trúc hoạt động trên XHTML trung gian do quy trình chuyển đổi tạo ra. Sử dụng tùy chọn gỡ lỗi được mô tả trong Giới thiệu để tìm ra cài đặt thích hợp cho sách của bạn. Ngoài ra còn có một nút dành cho trình thủ thuật XPath giúp tạo các biểu thức XPath đơn giản.

Theo mặc định, calibre sử dụng biểu thức sau để phát hiện các chương

________số 8

This expression is rather complex, because it tries to handle a number of common cases simultaneously. What it means is that calibre will assume chapters start at either

or

tags that have any of the words (chapter, book, section or part) in them or that have the class=”chapter” attribute.Một tùy chọn có liên quan là Dấu chương , tùy chọn này cho phép bạn kiểm soát hoạt động của calibre khi phát hiện một chương. Theo mặc định, nó sẽ chèn ngắt trang trước chương. Bạn có thể yêu cầu nó chèn một dòng kẻ thay vì hoặc thêm vào dấu ngắt trang. Bạn cũng có thể để nó không làm gì cả. Cài đặt mặc định để phát hiện ngắt trang là//*[name()='h1' or name()='h2'] which means that calibre will insert page breaks before every and tag by default.Ghi chúCác biểu thức mặc định có thể thay đổi tùy thuộc vào định dạng đầu vào mà bạn đang chuyển đổiĐiều khoản khác¶

Có một số tùy chọn khác trong phần này

Chèn siêu dữ liệu dưới dạng trang ở đầu sách

Một trong những điều tuyệt vời về tầm cỡ là nó cho phép bạn duy trì siêu dữ liệu rất đầy đủ về tất cả sách của mình, ví dụ: xếp hạng, thẻ, nhận xét, v.v. Tùy chọn này sẽ tạo một trang duy nhất với tất cả siêu dữ liệu này và chèn nó vào sách điện tử đã chuyển đổi, thường ngay sau trang bìa. Hãy nghĩ về nó như một cách để tạo bìa sách tùy chỉnh của riêng bạn

Xóa hình ảnh đầu tiên

Đôi khi, tài liệu nguồn mà bạn đang chuyển đổi bao gồm trang bìa như một phần của cuốn sách, thay vì dưới dạng trang bìa riêng biệt. Nếu bạn cũng chỉ định bìa theo cỡ, thì sách đã chuyển đổi sẽ có hai bìa. Tùy chọn này sẽ chỉ xóa hình ảnh đầu tiên khỏi tài liệu nguồn, do đó đảm bảo rằng sách được chuyển đổi chỉ có một bìa, bìa được chỉ định trong cỡ nòng

Mục lục¶

Khi tài liệu đầu vào có Mục lục trong siêu dữ liệu của nó, calibre sẽ chỉ sử dụng tài liệu đó. Tuy nhiên, một số định dạng cũ hơn không hỗ trợ Mục lục dựa trên siêu dữ liệu hoặc các tài liệu riêng lẻ không có. Trong những trường hợp này, các tùy chọn trong phần này có thể giúp bạn tự động tạo Mục lục trong sách điện tử đã chuyển đổi, dựa trên nội dung thực tế trong tài liệu đầu vào

Ghi chú

Việc sử dụng các tùy chọn này có thể hơi khó khăn để hiểu chính xác. Nếu bạn muốn tạo/chỉnh sửa Mục lục theo cách thủ công, hãy chuyển đổi sang định dạng EPUB hoặc AZW3 và chọn hộp kiểm ở cuối phần Mục lục của hộp thoại chuyển đổi có nội dung Chế độ thủ công . Thao tác này sẽ khởi chạy công cụ ToC Editor sau khi chuyển đổi. Nó cho phép bạn tạo các mục trong Mục lục bằng cách chỉ cần nhấp vào vị trí trong cuốn sách mà bạn muốn mục đó trỏ đến. Bạn cũng có thể tự sử dụng ToC Editor mà không cần thực hiện chuyển đổi. Đi tới . This will launch the ToC Editor tool after the conversion. It allows you to create entries in the Table of Contents by simply clicking the place in the book where you want the entry to point. You can also use the ToC Editor by itself, without doing a conversion. Go to Tùy chọn → Giao diện → Thanh công cụ và thêm ToC Editor vào . Sau đó, chỉ cần chọn sách bạn muốn chỉnh sửa và nhấp vào nút ToC Editor .

Tùy chọn đầu tiên là Bắt buộc sử dụng Mục lục được tạo tự động . Bằng cách chọn tùy chọn này, bạn có thể ghi đè lên bất kỳ Mục lục nào được tìm thấy trong siêu dữ liệu của tài liệu đầu vào bằng tài liệu được tạo tự động.

Cách mặc định mà việc tạo Mục lục được tạo tự động hoạt động là, trước tiên, calibre sẽ cố gắng thêm bất kỳ chương nào được phát hiện vào mục lục được tạo. Bạn có thể tìm hiểu cách tùy chỉnh tính năng phát hiện chương trong phần Phát hiện cấu trúc ở trên. Nếu bạn không muốn đưa các chương đã phát hiện vào mục lục đã tạo, hãy chọn tùy chọn Không thêm các chương đã phát hiện .

Nếu số lượng chương được phát hiện ít hơn Ngưỡng chương , thì calibre sẽ thêm bất kỳ siêu liên kết nào mà nó tìm thấy trong tài liệu đầu vào vào Bảng . Điều này thường hoạt động tốt. nhiều tài liệu đầu vào bao gồm một Mục lục siêu liên kết ngay từ đầu. Tùy chọn Số lượng liên kết có thể được sử dụng để kiểm soát hành vi này. Nếu được đặt thành 0, không có liên kết nào được thêm vào. Nếu được đặt thành một số lớn hơn 0, nhiều nhất số liên kết đó được thêm vào.

calibre sẽ tự động lọc các bản sao từ Mục lục đã tạo. Tuy nhiên, nếu có thêm một số mục nhập không mong muốn, bạn có thể lọc chúng bằng tùy chọn Bộ lọc TOC . Đây là một biểu thức chính quy sẽ khớp với tiêu đề của các mục trong mục lục được tạo. Bất cứ khi nào một trận đấu được tìm thấy, nó sẽ bị loại bỏ. Ví dụ: để xóa tất cả các mục có tiêu đề “Tiếp theo” hoặc “Trước đó”, hãy sử dụng.

Base font size : 12pt
Font size key  : 7, 8, 10, 12, 14, 16, 18, 20
0

Các tùy chọn TOC cấp 1,2,3 cho phép bạn tạo Mục lục đa cấp phức tạp. Chúng là các biểu thức XPath khớp với các thẻ trong XHTML trung gian do đường dẫn chuyển đổi tạo ra. Xem phần Giới thiệu để biết cách truy cập vào XHTML này. Ngoài ra, hãy đọc hướng dẫn XPath , để tìm hiểu cách tạo biểu thức XPath. Bên cạnh mỗi tùy chọn là một nút khởi chạy trình hướng dẫn để giúp tạo các biểu thức XPath cơ bản. Ví dụ đơn giản sau đây minh họa cách sử dụng các tùy chọn này.

Giả sử bạn có một tài liệu đầu vào có kết quả là XHTML trông như thế này

Base font size : 12pt
Font size key  : 7, 8, 10, 12, 14, 16, 18, 20
1

Sau đó, chúng tôi đặt các tùy chọn như

New font size key : 7, 9, 12, 14, 18, 20, 22
0

Điều này sẽ dẫn đến Mục lục hai cấp được tạo tự động giống như

New font size key : 7, 9, 12, 14, 18, 20, 22
1

Cảnh báo

Không phải tất cả các định dạng đầu ra đều hỗ trợ Mục lục đa cấp. Trước tiên, bạn nên thử với đầu ra EPUB. Nếu nó hoạt động, thì hãy thử định dạng bạn chọn

Sử dụng hình ảnh làm tiêu đề chương khi chuyển đổi tài liệu đầu vào HTML¶

Giả sử bạn muốn sử dụng một hình ảnh làm tiêu đề chương của mình, nhưng vẫn muốn calibre có thể tự động tạo Mục lục cho bạn từ tiêu đề chương. Sử dụng đánh dấu HTML sau để đạt được điều này

New font size key : 7, 9, 12, 14, 18, 20, 22
2

Đặt cài đặt TOC cấp 1 thành

.endnote { text-align: right }
0. Sau đó, đối với chương hai, calibre sẽ lấy tiêu đề từ giá trị của thuộc tính
.endnote { text-align: right }
1 trên thẻ
.endnote { text-align: right }
2, vì thẻ này không có văn bản.

Sử dụng các thuộc tính thẻ để cung cấp văn bản cho các mục trong Mục lục¶

Nếu bạn có tiêu đề chương đặc biệt dài và muốn các phiên bản rút gọn trong Mục lục, bạn có thể sử dụng thuộc tính tiêu đề để đạt được điều này, chẳng hạn

New font size key : 7, 9, 12, 14, 18, 20, 22
3

Đặt cài đặt TOC cấp 1 thành

.endnote { text-align: right }
3. Sau đó, calibre sẽ lấy tiêu đề từ giá trị của thuộc tính
.endnote { text-align: right }
1 trên thẻ
.endnote { text-align: right }
2, thay vì sử dụng văn bản bên trong thẻ. Lưu ý dấu
.endnote { text-align: right }
6 trên biểu thức XPath, bạn có thể sử dụng biểu mẫu này để yêu cầu calibre lấy văn bản từ bất kỳ thuộc tính nào bạn muốn.

Cách các tùy chọn được đặt/lưu để chuyển đổi¶

Có hai nơi có thể đặt tùy chọn chuyển đổi theo cỡ nòng. Đầu tiên là trong Tùy chọn-> Chuyển đổi. Các cài đặt này là mặc định cho các tùy chọn chuyển đổi. Bất cứ khi nào bạn cố gắng chuyển đổi một cuốn sách mới, cài đặt được đặt ở đây sẽ được sử dụng theo mặc định

Bạn cũng có thể thay đổi cài đặt trong hộp thoại chuyển đổi cho từng chuyển đổi sách. Khi bạn chuyển đổi một cuốn sách, calibre sẽ ghi nhớ các cài đặt bạn đã sử dụng cho cuốn sách đó để nếu bạn chuyển đổi lại sách đó, các cài đặt đã lưu cho từng cuốn sách sẽ được ưu tiên hơn các cài đặt mặc định được đặt trong Tùy chọn< . Bạn có thể khôi phục các cài đặt riêng lẻ về mặc định bằng cách sử dụng nút . You can restore the individual settings to defaults by using the Khôi phục mặc định trong hộp thoại chuyển đổi sách riêng lẻ. Bạn có thể xóa cài đặt đã lưu cho một nhóm sách bằng cách chọn tất cả sách rồi nhấp vào nút Chỉnh sửa siêu dữ liệu để hiển thị hộp thoại chỉnh sửa siêu dữ liệu hàng loạt, .

Khi bạn chuyển đổi hàng loạt một bộ sách, các cài đặt sẽ được thực hiện theo thứ tự sau (cái cuối cùng thắng)

  • Từ các giá trị mặc định được đặt trong Tùy chọn-> Chuyển đổi

  • Từ cài đặt chuyển đổi đã lưu cho mỗi cuốn sách được chuyển đổi (nếu có). Điều này có thể được tắt bằng tùy chọn ở góc trên cùng bên trái của hộp thoại Chuyển đổi hàng loạt

  • Từ cài đặt được đặt trong hộp thoại Chuyển đổi hàng loạt

Lưu ý rằng cài đặt cuối cùng cho mỗi cuốn sách trong Chuyển đổi hàng loạt sẽ được lưu và sử dụng lại nếu sách được chuyển đổi lần nữa. Do ưu tiên cao nhất trong Chuyển đổi hàng loạt được dành cho các cài đặt trong hộp thoại Chuyển đổi hàng loạt, những cài đặt này sẽ ghi đè bất kỳ cài đặt sách cụ thể nào. Vì vậy, bạn chỉ nên chuyển đổi hàng loạt sách với nhau cần cài đặt tương tự. Các ngoại lệ là siêu dữ liệu và cài đặt định dạng đầu vào cụ thể. Vì hộp thoại Chuyển đổi hàng loạt không có cài đặt cho hai danh mục này nên chúng sẽ được lấy từ cài đặt dành riêng cho sách (nếu có) hoặc mặc định

Ghi chú

Bạn có thể xem cài đặt thực tế được sử dụng trong bất kỳ chuyển đổi nào bằng cách nhấp vào biểu tượng xoay ở góc dưới bên phải rồi nhấp đúp vào công việc chuyển đổi riêng lẻ. Thao tác này sẽ hiển thị nhật ký chuyển đổi chứa các cài đặt thực tế được sử dụng, ở gần trên cùng

Định dạng mẹo cụ thể¶

Tại đây bạn sẽ tìm thấy các mẹo dành riêng cho việc chuyển đổi các định dạng cụ thể. Các tùy chọn dành riêng cho định dạng cụ thể, cho dù đầu vào hay đầu ra có sẵn trong hộp thoại chuyển đổi trong phần riêng của chúng, ví dụ: đầu vào TXT hoặc đầu ra EPUB

Chuyển đổi tài liệu Microsoft Word¶

tầm cỡ có thể tự động chuyển đổi các tệp

.endnote { text-align: right }
7 được tạo bởi Microsoft Word 2007 trở lên. Chỉ cần thêm tệp vào tầm cỡ và nhấp vào chuyển đổi

Ghi chú

Có một bản trình diễn. docx thể hiện khả năng của công cụ chuyển đổi tầm cỡ. Chỉ cần tải xuống và chuyển đổi sang EPUB hoặc AZW3 để xem tầm cỡ có thể làm được gì

calibre sẽ tự động tạo Mục lục dựa trên các tiêu đề nếu bạn đánh dấu các tiêu đề của mình bằng

.endnote { text-align: right }
8,
.endnote { text-align: right }
9, v.v. phong cách trong Microsoft Word. Mở sách điện tử đầu ra trong trình xem Sách điện tử tầm cỡ và nhấp vào nút Mục lục để xem Mục lục đã tạo.

Lớn hơn. tập tin tài liệu¶

dành cho người lớn tuổi. doc, bạn có thể lưu tài liệu dưới dạng HTML bằng Microsoft Word và sau đó chuyển đổi tệp HTML thu được với cỡ. Khi lưu dưới dạng HTML, hãy đảm bảo sử dụng tùy chọn “Lưu dưới dạng trang web, đã lọc” vì tùy chọn này sẽ tạo ra HTML sạch sẽ chuyển đổi tốt. Lưu ý rằng Word tạo HTML thực sự lộn xộn, việc chuyển đổi có thể mất nhiều thời gian, vì vậy hãy kiên nhẫn. Nếu bạn có phiên bản Word mới hơn, bạn có thể trực tiếp lưu nó dưới dạng. docx cũng vậy

Một cách khác là sử dụng LibreOffice miễn phí. mở của bạn. doc trong LibreOffice và lưu nó dưới dạng. docx, có thể được chuyển đổi trực tiếp theo cỡ

Chuyển đổi tài liệu TXT¶

Các tài liệu TXT không có cách xác định rõ ràng để chỉ định định dạng như in đậm, in nghiêng, v.v. hoặc cấu trúc tài liệu như đoạn văn, tiêu đề, phần, v.v., nhưng có nhiều quy ước thường được sử dụng. Theo mặc định, calibre cố gắng tự động phát hiện định dạng và đánh dấu chính xác dựa trên các quy ước đó

Đầu vào TXT hỗ trợ một số tùy chọn để phân biệt cách phát hiện các đoạn văn

Kiểu đoạn văn. Tự động

Phân tích tệp văn bản và cố gắng tự động xác định cách xác định các đoạn văn. Tùy chọn này nhìn chung sẽ hoạt động tốt, nếu bạn đạt được kết quả không mong muốn, hãy thử một trong các tùy chọn thủ công

Kiểu đoạn văn. Khối

Giả sử một hoặc nhiều dòng trống là một ranh giới đoạn văn

New font size key : 7, 9, 12, 14, 18, 20, 22
4

Kiểu đoạn văn. Duy nhất

Giả sử rằng mỗi dòng là một đoạn văn

New font size key : 7, 9, 12, 14, 18, 20, 22
5

Kiểu đoạn văn. In

Giả sử rằng mọi đoạn văn đều bắt đầu bằng một khoảng thụt lề (có thể là tab hoặc hơn 2 dấu cách). Các đoạn văn kết thúc khi đến dòng tiếp theo bắt đầu bằng thụt lề

New font size key : 7, 9, 12, 14, 18, 20, 22
6

Kiểu đoạn văn. chưa định dạng

Giả định rằng tài liệu không có định dạng, nhưng sử dụng ngắt dòng cứng. Dấu chấm câu và độ dài dòng trung bình được sử dụng để cố gắng tạo lại các đoạn văn

kiểu định dạng. Tự động

Cố gắng phát hiện loại đánh dấu định dạng đang được sử dụng. Nếu không sử dụng đánh dấu thì định dạng heuristic sẽ được áp dụng

kiểu định dạng. Tự tìm tòi

Phân tích tài liệu cho các tiêu đề chương phổ biến, ngắt cảnh và các từ in nghiêng và áp dụng đánh dấu HTML thích hợp trong quá trình chuyển đổi

kiểu định dạng. đánh dấu

calibre cũng hỗ trợ chạy đầu vào TEXT thông qua bộ tiền xử lý chuyển đổi được gọi là Markdown. Markdown cho phép thêm định dạng cơ bản vào tài liệu TXT, chẳng hạn như in đậm, in nghiêng, tiêu đề phần, bảng, danh sách, Mục lục, v.v. Đánh dấu tiêu đề chương bằng dấu # ở đầu và đặt biểu thức phát hiện XPath của chương thành “//h. h1” là cách dễ nhất để có mục lục thích hợp được tạo từ tài liệu TXT. Bạn có thể tìm hiểu thêm về cú pháp Markdown tạiDadredfireball

kiểu định dạng. Không có

Không áp dụng định dạng đặc biệt nào cho văn bản, tài liệu được chuyển đổi sang HTML mà không có thay đổi nào khác

Chuyển đổi tài liệu PDF¶

Tài liệu PDF là một trong những định dạng tồi tệ nhất để chuyển đổi từ. Chúng có kích thước trang cố định và định dạng vị trí văn bản. Có nghĩa là, rất khó để xác định nơi một đoạn kết thúc và một đoạn khác bắt đầu. calibre sẽ cố gắng hủy ngắt dòng bằng cách sử dụng hệ số ngắt dòng có thể định cấu hình. Đây là thang đo được sử dụng để xác định độ dài mà tại đó một dòng sẽ được mở ra. Các giá trị hợp lệ là một số thập phân từ 0 đến 1. Mặc định là 0. 45, ngay dưới chiều dài đường trung bình. Hạ thấp giá trị này để bao gồm nhiều văn bản hơn trong phần mở gói. Tăng để bao gồm ít hơn. Bạn có thể điều chỉnh giá trị này trong cài đặt chuyển đổi bên dưới Đầu vào PDF .

Ngoài ra, chúng thường có đầu trang và chân trang như một phần của tài liệu sẽ được đưa vào văn bản. Sử dụng bảng điều khiển Tìm kiếm và thay thế để xóa đầu trang và chân trang nhằm giảm thiểu sự cố này. Nếu đầu trang và chân trang không bị xóa khỏi văn bản, nó có thể làm hỏng việc mở đoạn văn. Để tìm hiểu cách sử dụng các tùy chọn xóa đầu trang và chân trang, hãy đọc Tất cả về cách sử dụng biểu thức chính quy theo cỡ .

Một số hạn chế của đầu vào PDF là

  • Tài liệu phức tạp, nhiều cột và hình ảnh không được hỗ trợ

  • Trích xuất hình ảnh vector và bảng từ bên trong tài liệu cũng không được hỗ trợ

  • Một số tệp PDF sử dụng các ký tự đặc biệt để biểu thị ll hoặc ff hoặc fi, v.v. Việc chuyển đổi những thứ này có thể hoạt động hoặc không hoạt động tùy thuộc vào cách chúng được thể hiện bên trong PDF

  • Liên kết và Mục lục không được hỗ trợ

  • Các tệp PDF sử dụng phông chữ không phải Unicode được nhúng để thể hiện các ký tự không phải tiếng Anh sẽ dẫn đến đầu ra bị cắt xén cho các ký tự đó

  • Một số tệp PDF được tạo thành từ các bức ảnh của trang có văn bản OCRed phía sau chúng. Trong những trường hợp như vậy, calibre sử dụng văn bản OCRed, văn bản này có thể rất khác so với những gì bạn thấy khi xem tệp PDF

  • Các tệp PDF được sử dụng để hiển thị văn bản phức tạp, như ngôn ngữ từ phải sang trái và sắp chữ toán học sẽ không chuyển đổi chính xác

Để lặp lại PDF là một định dạng thực sự rất tệ để sử dụng làm đầu vào. Nếu bạn nhất định phải sử dụng PDF, thì hãy chuẩn bị cho kết quả đầu ra từ khá đến không sử dụng được, tùy thuộc vào PDF đầu vào

Tuyển tập truyện tranh¶

Một tuyển tập truyện tranh là một. tập tin cbc. Một. tệp cbc là tệp ZIP chứa các tệp CBZ/CBR khác. Ngoài ra các. tệp cbc phải chứa một tệp văn bản đơn giản có tên là truyện tranh. txt, được mã hóa bằng UTF-8. truyện tranh. txt phải chứa danh sách các tệp truyện tranh bên trong. tệp cbc, ở dạng tên tệp. tiêu đề, như hình dưới đây

New font size key : 7, 9, 12, 14, 18, 20, 22
7

Các. tệp cbc sau đó sẽ chứa

New font size key : 7, 9, 12, 14, 18, 20, 22
8

tầm cỡ sẽ tự động chuyển đổi này. cbc thành một cuốn sách điện tử với Mục lục trỏ đến từng mục trong truyện tranh. txt

Bản minh họa định dạng nâng cao EPUB¶

Định dạng nâng cao khác nhau cho các tệp EPUB được thể hiện trong tệp demo này. Tệp được tạo từ HTML được mã hóa thủ công bằng cách sử dụng cỡ nòng và được dùng làm mẫu cho các nỗ lực tạo EPUB của riêng bạn

HTML nguồn nó được tạo ra từ bản demo có sẵn. khóa kéo. Các cài đặt được sử dụng để tạo EPUB từ tệp ZIP là

New font size key : 7, 9, 12, 14, 18, 20, 22
9

Lưu ý rằng vì tệp này khám phá tiềm năng của EPUB nên hầu hết các định dạng nâng cao sẽ không hoạt động trên các trình đọc kém khả năng hơn trình xem EPUB tích hợp của calibre

Chuyển đổi tài liệu ODT¶

calibre có thể chuyển đổi trực tiếp các tệp ODT (Văn bản OpenDocument). Bạn nên sử dụng các kiểu để định dạng tài liệu của mình và giảm thiểu việc sử dụng định dạng trực tiếp. Khi chèn hình ảnh vào tài liệu của bạn, bạn cần neo chúng vào đoạn văn, tất cả các hình ảnh được neo vào một trang sẽ kết thúc ở phía trước của chuyển đổi

Để kích hoạt tính năng tự động phát hiện các chương, bạn cần đánh dấu chúng bằng các kiểu dựng sẵn có tên là Tiêu đề 1 , Heading 2, …, Heading 6 (Heading 1 equates to the HTML tag

p { text-indent: 5mm; }
0, Heading 2 to
.endnote { text-align: right }
2, etc). When you convert in calibre you can enter which style you used into the Phát hiện chương tại . Thí dụ.

  • Nếu bạn đánh dấu các Chương theo kiểu Tiêu đề 2 , bạn phải đặt hộp 'Phát hiện các chương tại' thành

    .endnote { text-align: right }
    
    0

  • Đối với TOC lồng nhau có Phần được đánh dấu bằng Tiêu đề 2 và các Chương được đánh dấu bằng Tiêu đề 3< . Trên trang Chuyển đổi - TOC, đặt hộp you need to enter

    p { text-indent: 5mm; }
    
    3. On the Convert - TOC page set the TOC cấp 1 thành
    .endnote { text-align: right }
    
    0 và TOC cấp 2 box to
    p { text-indent: 5mm; }
    
    5.

Các thuộc tính tài liệu nổi tiếng (Tiêu đề, Từ khóa, Mô tả, Người tạo) được công nhận và tầm cỡ sẽ sử dụng hình ảnh đầu tiên (không nhỏ và có tỷ lệ khung hình tốt) làm ảnh bìa

Ngoài ra còn có một chế độ chuyển đổi thuộc tính nâng cao, được kích hoạt bằng cách đặt thuộc tính tùy chỉnh

p { text-indent: 5mm; }
6 (loại 'Có hoặc Không') thành Có trong tài liệu ODT của bạn (Tệp->Thuộc tính->Thuộc tính Tùy chỉnh). Nếu thuộc tính này được phát hiện theo calibre, các thuộc tính tùy chỉnh sau sẽ được nhận dạng (
p { text-indent: 5mm; }
7 ghi đè người tạo tài liệu)

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
0

Ngoài ra, bạn có thể chỉ định ảnh sẽ sử dụng làm bìa bằng cách đặt tên cho nó là

p { text-indent: 5mm; }
8 (nhấp chuột phải, Picture->Options->Name) trong ODT. Nếu không tìm thấy hình ảnh có tên này, phương pháp 'thông minh' được sử dụng. Vì việc phát hiện bìa có thể dẫn đến bìa kép ở một số định dạng đầu ra nhất định, quy trình sẽ xóa đoạn văn (chỉ khi nội dung duy nhất là bìa. ) từ tài liệu. Nhưng điều này chỉ hoạt động với hình ảnh được đặt tên

Để tắt tính năng phát hiện bìa, bạn có thể đặt thuộc tính tùy chỉnh

p { text-indent: 5mm; }
9 (loại 'Có hoặc Không') thành Có trong chế độ nâng cao

Chuyển đổi sang PDF¶

Cài đặt đầu tiên, quan trọng nhất cần quyết định khi chuyển đổi sang PDF là kích thước trang. Theo mặc định, cỡ nòng sử dụng kích thước trang là “U. S. Bức thư". Bạn có thể thay đổi điều này thành kích thước trang tiêu chuẩn khác hoặc kích thước hoàn toàn tùy chỉnh trong phần Đầu ra PDF của hộp thoại chuyển đổi. Nếu bạn đang tạo tệp PDF để sử dụng trên một thiết bị cụ thể, thì bạn có thể bật tùy chọn sử dụng kích thước trang từ cấu hình đầu ra để thay thế. Vì vậy, nếu cấu hình đầu ra của bạn được đặt thành Kindle, calibre sẽ tạo tệp PDF có kích thước trang phù hợp để xem trên màn hình Kindle nhỏ.

Đầu trang và Chân trang¶

Bạn có thể chèn đầu trang và chân trang tùy ý trên mỗi trang của PDF bằng cách chỉ định các mẫu đầu trang và chân trang. Mẫu chỉ là các đoạn mã HTML được hiển thị ở vị trí đầu trang và chân trang. Ví dụ: để hiển thị số trang ở giữa ở cuối mỗi trang, có màu xanh lục, hãy sử dụng mẫu chân trang sau

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
1

calibre sẽ tự động thay thế

h2, h3 { text-align: center }
0 bằng số trang hiện tại. Bạn thậm chí có thể đặt các nội dung khác nhau trên các trang chẵn và lẻ, ví dụ: mẫu tiêu đề sau sẽ hiển thị tiêu đề trên các trang lẻ và tác giả trên các trang chẵn

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
2

calibre sẽ tự động thay thế

h2, h3 { text-align: center }
1 và
h2, h3 { text-align: center }
2 bằng tiêu đề và tác giả của tài liệu được chuyển đổi. Đặt
h2, h3 { text-align: center }
3 thành
h2, h3 { text-align: center }
4 sẽ làm cho văn bản được căn phải

Bạn cũng có thể hiển thị văn bản ở cạnh trái và phải và thay đổi kích thước phông chữ, như minh họa với mẫu tiêu đề này

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
3

Điều này sẽ hiển thị tiêu đề ở bên trái và tác giả ở bên phải, với cỡ chữ nhỏ hơn văn bản chính

Bạn cũng có thể sử dụng phần hiện tại trong các mẫu, như hình bên dưới

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
4

h2, h3 { text-align: center }
5 được thay thế bằng bất kỳ tên nào của phần hiện tại là. Những tên này được lấy từ Mục lục siêu dữ liệu trong tài liệu (PDF Outline). Nếu tài liệu không có mục lục thì nó sẽ được thay thế bằng văn bản trống. Nếu một trang PDF có nhiều phần, phần đầu tiên trên trang sẽ được sử dụng. Tương tự, có một biến tên là
h2, h3 { text-align: center }
6 có thể được sử dụng để lấy tên của phần cấp cao nhất hiện tại

Bạn thậm chí có thể sử dụng JavaScript bên trong các mẫu đầu trang và chân trang, ví dụ: mẫu sau sẽ khiến số trang bắt đầu từ 4 thay vì 1

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
5

Ngoài ra, có một số biến khác mà bạn có thể sử dụng trong đầu trang và chân trang, được ghi lại bên dưới

  • h2, h3 { text-align: center }
    
    7 - tổng số trang trong tệp PDF, chẳng hạn như hữu ích để triển khai bộ đếm tiến trình

  • h2, h3 { text-align: center }
    
    8 - tổng số trang trong phần cấp cao nhất hiện tại

  • h2, h3 { text-align: center }
    
    9 - số trang của trang hiện tại trong phần cấp cao nhất hiện tại

Ghi chú

Khi thêm đầu trang và chân trang, đảm bảo bạn đặt lề trên và lề dưới của trang thành các giá trị đủ lớn, trong phần Đầu ra PDF của .

Mục lục có thể in¶

Bạn cũng có thể chèn Mục lục có thể in được ở cuối tệp PDF liệt kê số trang cho mỗi phần. Điều này rất hữu ích nếu bạn có ý định in PDF ra giấy. Nếu bạn muốn sử dụng PDF trên thiết bị điện tử, thì PDF Outline cung cấp chức năng này và được tạo theo mặc định

Bạn có thể tùy chỉnh giao diện của Mục lục đã tạo bằng cách sử dụng cài đặt chuyển đổi CSS bổ sung trong phần Giao diện của hộp thoại chuyển đổi. CSS mặc định được sử dụng được liệt kê bên dưới, chỉ cần sao chép nó và thực hiện bất kỳ thay đổi nào bạn muốn

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }
6

Lề trang tùy chỉnh cho từng tệp HTML¶

Nếu bạn đang chuyển đổi tệp EPUB hoặc AZW3 có nhiều tệp HTML riêng lẻ bên trong và bạn muốn thay đổi lề trang cho một tệp HTML cụ thể, bạn có thể thêm khối kiểu sau vào tệp HTML bằng trình chỉnh sửa Sách điện tử tầm cỡ