今天我们来了解一个Excel中非常强大的功能:汇总PDF文件,相较于其他的汇总软件,利用Excel进行汇总最大的好处就是可以自动匹配表头,后期如果有新的文件进来只需点击下刷新就能一键汇总!
 
快速汇总PDF
 
  一、所需函数
 
  今天我们需要用到2个M函数,这个是PowerQuery独有的,Excel也是需要版本支持的,最低2016,如果版本不止的话,使用PowerBI也是一样的操作
 
  Pdf.Tables:获取PDF文件中的表格
 
  Table.PromoteHeaders:将第一行用于标题
 
  M函数的用法与Excel函数很相似,但是它们的区别还是还是很大的,Excel函数仅仅只能计算单元格,M函数可以计算一个表格,一列数据的,简单来说就是它可以对表格的结构进行计算
 
  二、导入到PowerQuery
 
  首先我们需要将想要汇总的Excel都放在一个文件夹中,随后打开Excel,点击【数据】功能组,在右侧找到【获取数据】→【从文件夹】,然后找到存放PDF的文件夹,直接点击下打开,稍等一下就会看出一个【导航器】的界面,点击右下角的【转换数据】进入PowerQuery的编辑界面
 
  三、数据整理
 
  在这里我们仅仅需要【Content】与【Name】这两列数据,可以将所有的数据都删掉。
 
  Content这一列我们可以理解为它就是一个PDF文件
 
  Name这一列就是每个PFD文件的名称
 
  随后点击【添加列】找到【自定义列】在跳出的窗口中输入函数:=Pdf.Tables([Content]),它的作用就是获取PDF中的表格中数据,点击确定后,就会多出一列【自定义】列,需要点击右上角的左右箭头来展开数据,仅仅勾选【Kind】与【Data】这两个字段即可,不要使用【原始列名作为前缀】
 
  四、筛选数据
 
  【Data】这个字段存放的就是PDF文件中的表格,【Kind】这个字段是数据类型。
 
  首先在【Kind】中仅仅选中【Table】这个类型,就是表示仅仅选中PDF文件中的表格,【page】表示页,就是PDF每一页的数据,这个我们是不需要的
 
  随后点击【Data】中蓝色的table就会看到表格,但是现在数据的表头是在表格中的,我们需要将表头放在上一行用做标题,才能使用自动匹配字段
 
  筛选完毕后,就可以将【Kind】与【Content】这两个字段删掉了
 
  五、提升标题
 
  需要点击下【添加列】找到自定义列,将公式设置为:Table.PromoteHeaders([Data]),然后点击确定,就会在后面多出一个【自定义】列,这样的话就会将表头用作标题,我们还是直接点击【右上角】来展开数据即可,这样就可以将所有的PDF文件都汇总一起。
 
  最后将【Data】这一列删除掉,然后点击【主页】点击【关闭并上载】就会将数据加载到Excel文件中了,至此就汇总完毕了
 
  后期如果有新的PDF文件进来,只需要放在这个文件夹中,然后打开汇总表,点击【刷新】就能实现自动汇总了,非常的方便。