tft每日頭條

 > 科技

 > pdf不可編輯怎麼提取表格

pdf不可編輯怎麼提取表格

科技 更新时间:2024-10-11 21:27:57

彙總100個表頭順序不同的PDF表格。職場中遇到這樣的問題會讓很多人感到頭皮發麻,即使是 “職場老鳥”也不例外。很多人都能想到的方法就是利用付費軟件将PDF一個一個的轉換為excel,然後再彙總但是它們的表頭順序是不同的隻能一個一個表格的調整順序再複制粘貼,有一個粉絲表示需要彙總100個這樣的文件,已經做了1天了還沒搞定,有沒有什麼快速的方法呢?其實我們不必舍近求遠,利用Excel中的power query這個功能隻需要幾分鐘就能輕松解決這樣的。操作也并不難,隻需利用2個M函數就能輕松搞定,下面就讓我們來一起操作下吧!

pdf不可編輯怎麼提取表格(彙總100個格式錯亂的PDF表格)1

一、所需M函數

1. PDF.Tables:獲取Pdf中的表格數據

語法:=Pdf.Tables(pdf as binary) as table

這個M函數的可選參數非常多,我們可以不做設置,它的必須參數是:pdf as binary意思就說:pdf文件必須要轉換為binary(二進制文件)才能放在第一參數中。as table是說函數返回的類型是表格

2. Table.PromoteHeaders:将第一行用作标題

語法:= Table.PromoteHeaders(table as table) as table

table as table它的意思是說這個函數的參數必須是一個table格式的數據,as table是說函數返回的類型是表格

對于這類的函數可能大家都比較陌生感覺看不懂。今天的操作其實非常的簡單,這兩個函數我們都是僅僅為其添加了一個參數,下面我們就來着手彙總下PDF

二、彙總PDF

1.獲取數據

首先我們需要将想要彙總的pdf文件都放在一個文件夾中,然後新建一個Excel點擊【數據】功能組,在左側找到【獲取數據】→【來自文件】→【從文件夾】。跳出一個文件選擇的窗口後我們找到存放PDF的文件夾然後點擊打開,power query就會加載獲取數據,獲取數據後會跳出界面,我們直接點擊【轉換數據】就會進入power query的編輯界面

pdf不可編輯怎麼提取表格(彙總100個格式錯亂的PDF表格)2

2.整理數據

進入PQ後我們僅僅保留前兩列數據,将其餘的數據都删掉。Name這一列是pdf文件的名稱,Content這一列是每個pdf對應的二進制文件。然後将name這一列放在最前面,緊接着我們【轉換】找到【替換值】将後綴名.pdf替換掉。最後将name更改為文件名

pdf不可編輯怎麼提取表格(彙總100個格式錯亂的PDF表格)3

3.獲取PDF中的表格

上一步PQ已經将pdf文件轉換為了binary,我們就可以使用Pdf.Tables來獲取pdf文件中的表格了。需要點擊【添加列】找到【自定義列】就會跳出添加自定義列的界面,随後我們在自定義公式這個輸入:Pdf.Tables([Content])然後點擊确定,這樣的話就會多出一列自定義列,并且數據都是table

pdf不可編輯怎麼提取表格(彙總100個格式錯亂的PDF表格)4

随後我們點擊自定義右上角的左右箭頭來展開數據,在這裡我們僅僅選擇kind和date這兩類數據,再把使用原始列明作為前綴的對勾去掉點擊确定即可,這樣的話在一個pdf文件就會對應2個kind分别是page和table,這兩個類型中的數據是一模一樣的我們隻需要任選一個作為數據即可,在這裡我們選擇table為數據,可以在kind字段中篩選table然後點擊确定即可,随後我們就可以将kind和content這兩個字段都删掉了,在這裡data字段中的table對應的就是每個pdf文件中的表格,我們可以點擊看一下

pdf不可編輯怎麼提取表格(彙總100個格式錯亂的PDF表格)5

4.提升标題

現在我們雖然獲取了pdf中的表格,但是它的标題是默認的,想要達到自動匹配表頭的效果,我們就必須要将表格中的标題放在PQ中标題的位置,這個時候我們就需要用到Table.PromoteHeaders這個函數,也是添加一個自定義列,然後将公式設置為:=Table.PromoteHeaders([Data])然後将data這一列數據删除掉,我們點擊table可以看下表格中的标題已經放在标題行了

pdf不可編輯怎麼提取表格(彙總100個格式錯亂的PDF表格)6

5.展開數據

随後我們還是點擊下自定義右上角的左右箭頭來展開數據,選擇全部字段不要勾選使用原始列名,然後點擊确定,這樣的話就彙總完畢了,最後隻需要點擊【主頁】找到【關閉并上載】将數加載回excel即可

pdf不可編輯怎麼提取表格(彙總100個格式錯亂的PDF表格)7

使用這個方法當我們向文件夾中放置新的pdf表格文件,隻需要回到彙總的Excel表格中,點擊鼠标右鍵選擇刷新,新放置的pdf文件就能自動刷新進來,非常的方便

以上就是今天分享的全部内容,你學會了嗎?

我是Excel從零到一,關注我,持續分享更多Excel技巧

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved