老鐵們,今天分享一個比較實用的小技巧,“如何提取PDF文件中的表格?“
方法很簡單,大概2分鐘就學會,請耐心往下看,相信對你以後工作有幫助。
01 問題背景最近看GP行情,就下載了一些研報(PDF格式),其中有大量表格,覺得看數據不是太直觀,所以就想導入到Excel中來制作成圖表。
原始圖片
但是直接複制PDF中表格,粘貼到Excel中,格式就不太規範,如下圖所示,所有的數據都在一個單元格内,并沒有分列,這樣就為我們處理數據帶來麻煩,而且即使分列以後,還要重新整理格式,哪該如何處理呢?
粘貼效果
02 解決辦法對于文字整理成表格的問題,我就想到了微軟的另外一大辦公軟件:Word,所有可以放到Word裡面來整理,然後再複制到Excel裡面,就可以了;
(1)在PDF中複制上表格,直接粘貼到Word裡面(如下圖所示);可以看到文字之間,行列并沒有區分清楚,但是文字之間有分隔符的。
Word粘貼
(2)剩下的,就是如何将Word中的文字轉換成表格了。選中所有的文字,在插入選項卡下面,選擇表格-文字轉換成表格,此時會彈出一個對話框,在裡面選擇分隔符為空格(根據你自己表格情況選擇),列數調整為7(PDF中表格為7列),點确定即可。
表格處理
(3)現在就搞定了,結果圖如下,此時我們再複制粘貼到Excel中,就可以了,想怎麼作圖都行了。
效果圖
03 其他辦法其實解決這問題,方法很多,包括我以前講過的使用PowerQuery(在文章末尾有鍊接),也可以使用在Excel中分列,再處理的方法,都是可以的,下次就分享下,如何在Excel中分列,再處理的方式來做,敬請期待;
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!