tft每日頭條

 > 科技

 > 如何快速批量提取數據

如何快速批量提取數據

科技 更新时间:2024-12-13 04:00:53

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)1

文:徐軍泰 首發:Excel同學會

數據提取 · Excel · 無規律 · 正則表達式

⏱5mins 讀完,今天的文章絕對建議收藏


大家好,我是徐老師。

最近做會員答疑時遇到不少數據提取方面的問題,尤其是無規律數據的提取。比如,下面這個問題中,要求從A列文本中将規格信息提取出來,即單元格中類似AxB,或者AxBxC的信息。

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)2

▲ 從A列數據中提取規格信息

這個問題中,有幾個難點,一起來看一下:

  • A列文本長度無規律,要提取的規格數據位置不固定,因此使用函數法——No!行不通
  • 目标數據格式不統一,例如有的單元格内為AxB,有的為AxBxC,因此快速填充法——No!行不通
  • A、B、C的格式也不統一,有的隻有數字,有的數字前面有φ符号,有的後面有mm,有的數字帶小數點,有的不帶……
  • 數據量大,整張表共有1800餘行

這樣的表,用常規方法來處理,花兩天時間也搞不定!基本就八個字——束手無策,無可奈何!

怎麼辦?我的解決方案是嘗試在Excel超能力插件中應用【正則提取】功能來實現智能提取,來看我的操作。

01

編寫正則表達式

在"Excel中怎麼提取不規則文本?一篇文章,快速學會正則表達式 正則提取"一文中,我們介紹了正則表達式的用法。

所謂正則表達式,說白了,就是對文本規律/規則的一種表達方法。隻要我們能将要提取的目标文本的規則表達清楚,用正則表達式寫出來,就有可能快速完成提取。

由于目标文本前面已經描述了,有可能是AxB,也有可能是AxBxC。A、B、C的主體是數字信息,因此最基本的正則表達式可以寫為:

\d x\d (x\d )?

\d 代表至少1位數字,由于目标數據中A、B一定存在,但C不一定,因此(x\d )後面加?表示出現0次或1次。

有了基本的正則框架,現根據A、B、C内部格式的多樣性特點,最終将本例的正則表達式寫為:

φ?\d (\.\d )?(mm)?xφ?\d (\.\d )?(mm)?(xφ?\d (\.)?\d )?(mm)?

具體含義可對照"Excel中怎麼提取不規則文本?一篇文章,快速學會正則表達式 正則提取"一文中的正則字符含義來理解。

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)3

02

在Excel超能力中進行正則提取

1、在Excel超能力的【正則提取】框内,将已經編寫的正則表達式粘貼進去,并按回車鍵;

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)4

2、在彈出的對話框中選擇要處理的區域,A3:A1802;

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)5

3、确定後,在彈出對話框中選擇結果保存的位置,這裡選擇B3單元格;

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)6

再次點擊确定後,超能力将進行自動處理。約3秒鐘時間,即可完成自動提取。

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)7

▲ GIF:操作演示

好了,今天的内容就介紹到這裡,我是徐老師,感謝閱讀。

如果文章有用,記得關注/收藏/轉發。

關聯閱讀:

「數據提取」正則表達式:如何在Excel中實現精準提取


作者 徐軍泰

——《左手數據,右手圖表》作者,Excel同學會創辦人,唯庫、萬門大學等平台特約講師。

● 如何獲取「Excel超能力」?

Excel超能力,是一款面向職場人的超實用Excel效率提升插件,同時兼容MSOffice和金山WPS。

插件意在提升Excel批量處理和操作方面的不足,彌補Excel在多表導航、密碼管理等方面的功能,以及優化合并單元格等操作層面的體驗,讓用戶具備Excel超能力!

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)8

▲ Office安裝效果

如何快速批量提取數據(10秒鐘搞定1800條無規則數據提取)9

▲ WPS安裝效果

目前,插件已有包括Excel文本處理、數據錄入、數據處理、格式轉化、報表合并與拆分、(動态)圖表制作、文件批處理、文檔加密解密、圖片批處理、個人賬号密碼管理、快捷鍵、自定義函數等在内的10餘個功能模塊以及200 個功能,覆蓋90%以上的常用操作和應用場景,幫助用戶快速解決問題,節省95%的操作時間。

關注我,私信回複:666,可自動領取。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved