一、下載軟件
需要用到的軟件叫FreePic2pdf, 下載之後打開頁面如下所示:
此時需要點擊右下角的“更改PDF”,彈出如下圖所示的頁面:
其中,“往PDF挂書簽”是根據指定的文件往PDF目錄中挂文件的,而“從PDF取書簽”則是提取PDF文件中的目錄。
二、制作步驟
首先找到一本沒有目錄的電子書,如下圖所示:
接着如參照步驟一進行“從PDF取書簽”的操作,這一步的主要目的是生成指定格式的文件。
選擇該PDF電子書并做操作後,會在同目錄下生成一個文件夾,如下圖所示:
點進去之後可以看到下圖所示的文件:
接着隻需要在“Freepic2Pdf.bkmk.txt”中輸入準備好的目錄信息,并進行格式調整。
目錄的格式要求為:
\t一級目錄\t頁碼
\t\t二級目錄\t頁碼
\t\t\t三級目錄\t頁碼
...
其中,“\t”代表一個Tab鍵。
同時調整“FreePic2Pdf.tif”中的BasePage參數即可。
如下圖所示:
至于數值是多少,大家可以到第一章在PDF文件中所處的頁數,而我這裡是12。
接着切換到“往PDF挂書簽”,并點擊開始即可為PDF生成目錄,生成效果如下圖所示:
三、如何獲取目錄
目錄的來源最方便的方法是從百度百科或者京東商城中進行複制。大多數情況下,都可以找到對應的目錄。
比如在百度百科中搜索之後,跳轉到目錄頁,如下圖所示:
下面是京東的搜索結果:
但是,偶爾也會存在找不到的情況,這時候就需要找各種OCR識别軟件了。由于我開的WPS的會員,因此直接用WPS自帶的“提取文字”功能。當然,也可以使用百度翻譯來進行文字識别。
不管是網上找的,還是通過OCR軟件識别出來的目錄信息,大多數時候會存在格式問題。因此需要進行格式上的調整。
四、調整目錄格式
對于目錄格式的調整來說,可以一個一個調整,但是這樣的話工作量比較大,且容易出錯。因此,需要利用一些軟件通過正則表達式進行替換。
下面是我從網上扒到的一個目錄:
這裡我用到的軟件叫EditPlus,至于别的軟件是否可行,大家自行嘗試即可。需要說明的是,使用正則表達式進行替換時需要勾上“使用正則表達式”的選項,如下圖所示:
這一步用到的正則表達式為:“^[\t \n]*”,替換為“”,如下圖所示:
替換後結果如下所示:
使用到的正則表達式為“^(\d{1,2}\.\d{1,2}\.\d{1,2})”, 替換的表達式為“\t\t\0”,如下圖所示:
替換後結果如下圖所示:
這裡使用的正則表達式為“^(\d{1,2}\.\d{1,2})”,替換的表達式為“\t\0”, 如下圖所示:
替換後結果如下圖所示:
處理頁碼 用到的正則表達式為“[…\t .]*(\d{1,3})[ ]*$”, 替換表達式為“\t\1”,如下圖所示:
替換後結果如下圖:
此時目錄的調整就已經算完畢了。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!