Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

PDF файл дахь хүснэгтээс Microsoft Excel хуудас руу өгөгдөл дамжуулах ажил үргэлж "хөгжилтэй" байдаг. Ялангуяа танд FineReader гэх мэт үнэтэй таних програм хангамж байхгүй бол. Шууд хуулбарлах нь ихэвчлэн сайн зүйлд хүргэдэггүй, учир нь. хуулсан өгөгдлийг хуудсан дээр буулгасны дараа тэдгээр нь нэг баганад "наалдсан" байх магадлалтай. Тиймээс тэдгээрийг багаж хэрэгслээр шаргуу тусгаарлах шаардлагатай болно Текстийг баганаар бичнэ табаас Өгөгдөл (Өгөгдөл - Текстийг багана руу).

Мэдээжийн хэрэг, хуулбарлах нь зөвхөн текст давхарга байгаа PDF файлуудад, өөрөөр хэлбэл цааснаас PDF рүү сканнердсан баримт бичигт л боломжтой, энэ нь зарчмын хувьд ажиллахгүй.

Гэхдээ тийм ч гунигтай биш, үнэхээр 🙂

Хэрэв танд Office 2013 эсвэл 2016 байгаа бол хэдэн минутын дотор нэмэлт програмгүйгээр PDF файлаас Microsoft Excel руу өгөгдөл дамжуулах бүрэн боломжтой. Word болон Power Query нь үүнд тусална.

Жишээлбэл, Европын эдийн засгийн комиссын вэбсайтаас олон тооны текст, томъёо, хүснэгт бүхий энэхүү PDF тайланг авч үзье.

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

… мөн Excel дээр үүнийг гаргаж авахыг оролдоод эхний хүснэгтийг хэл:

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Явъя!

Алхам 1. Word дээр PDF файлыг нээнэ үү

Зарим шалтгааны улмаас цөөхөн хүн мэддэг боловч 2013 оноос хойш Microsoft Word нь PDF файлуудыг нээж, таньж сурсан (сканнердсан файлуудыг ч гэсэн, өөрөөр хэлбэл текст давхаргагүй!). Энэ нь бүрэн стандарт аргаар хийгддэг: Word програмыг нээж, дарна уу Файл - Нээлттэй (Файл - Нээлттэй) мөн цонхны баруун доод буланд байрлах унадаг жагсаалтаас PDF форматыг зааж өгнө үү.

Дараа нь бидэнд хэрэгтэй PDF файлыг сонгоод товшино уу Нээлттэй (Нээлттэй). Word нь энэ баримт бичиг дээр OCR-г ажиллуулж, текст бичих гэж байгааг бидэнд хэлдэг:

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Бид зөвшөөрч байгаа бөгөөд хэдхэн секундын дараа бид PDF-ээ Word дээр засварлахад нээлттэй байхыг харах болно.

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Мэдээжийн хэрэг, загвар, хэв маяг, фонт, толгой ба доод хэсэг гэх мэт нь баримтаас хэсэгчлэн гарах болно, гэхдээ энэ нь бидний хувьд чухал биш - бидэнд зөвхөн хүснэгтийн өгөгдөл хэрэгтэй. Зарчмын хувьд энэ үе шатанд хүлээн зөвшөөрөгдсөн баримтаас хүснэгтийг Word руу хуулж аваад Excel-д буулгах нь аль хэдийн сонирхол татаж байна. Заримдаа энэ нь ажилладаг, гэхдээ ихэнхдээ энэ нь бүх төрлийн өгөгдлийн гажуудалд хүргэдэг - жишээлбэл, тоонууд нь огноо болон хувирч эсвэл бидний тохиолдол шиг текст хэвээр үлддэг. PDF нь тусгаарлагчгүй ашигладаг:

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Тиймээс булангуудыг огтолж болохгүй, гэхдээ бүх зүйлийг арай илүү төвөгтэй, гэхдээ зөв болгоё.

Алхам 2: Баримт бичгийг вэб хуудас болгон хадгал

Хүлээн авсан өгөгдлийг Excel-д (Power Query-ээр дамжуулан) ачаалахын тулд Word дахь манай баримт бичгийг вэб хуудасны форматаар хадгалах шаардлагатай - энэ формат нь Word болон Excel-ийн хоорондох нийтлэг хэсэг юм.

Үүнийг хийхийн тулд цэс рүү очно уу Файл - Хадгалах (Файл - Хадгалах) эсвэл товчлуурыг дарна уу F12 гар болон нээгдэх цонхноос файлын төрлийг сонгоно уу Нэг файл дахь вэб хуудас (Вэб хуудас - Нэг файл):

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Хадгалсны дараа та mhtml өргөтгөлтэй файлыг авах хэрэгтэй (хэрэв та Explorer дээр файлын өргөтгөлүүдийг харвал).

3-р шат. Power Query-ээр файлаа Excel-д байршуулах

Та үүсгэсэн MHTML файлыг Excel дээр шууд нээж болно, гэхдээ дараа нь бид PDF-ийн бүх агуулгыг нэг дор, текст болон олон тооны шаардлагагүй хүснэгтүүдийн хамт авах болно, хоёрдугаарт, бид буруу бичсэний улмаас өгөгдлийг дахин алдах болно. тусгаарлагч. Тиймээс бид Power Query нэмэлтээр дамжуулан Excel-д импорт хийх болно. Энэ бол бараг ямар ч эх сурвалжаас (файл, хавтас, өгөгдлийн сан, ERP систем) Excel-д өгөгдөл байршуулж, дараа нь хүлээн авсан өгөгдлийг хүссэн хэлбэрт оруулах боломжтой бүх аргаар өөрчлөх боломжтой бүрэн үнэгүй нэмэлт юм.

Хэрэв танд Excel 2010-2013 байгаа бол та Microsoft-ын албан ёсны вэбсайтаас Power Query-г татаж авах боломжтой - суулгасны дараа та табыг харах болно. Эрчим хүчний асуулга. Хэрэв танд Excel 2016 ба түүнээс дээш хувилбар байгаа бол та юу ч татаж авах шаардлагагүй - бүх функцийг Excel-д анхдагч байдлаар суулгасан бөгөөд таб дээр байрладаг. Өгөгдөл (Огноо) бүлэгт Татаж аваад хөрвүүлэх (Авах & Хувиргах).

Тиймээс бид таб руу очно Өгөгдөл, эсвэл таб дээр Эрчим хүчний асуулга ба багаа сонго Өгөгдөл авахын тулд or Асуулга үүсгэх - Файлаас - XML-ээс. Зөвхөн XML файлуудыг харагдуулахгүйн тулд цонхны баруун доод буланд байрлах унадаг жагсаалтын шүүлтүүрүүдийг өөрчилнө үү. Бүх файлууд (Бүх файлууд) мөн манай MHTML файлыг зааж өгнө үү:

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Импорт амжилттай дуусахгүй гэдгийг анхаарна уу, учир нь. Power Query нь биднээс XML-г хүлээж байгаа ч үнэндээ бид HTML форматтай. Тиймээс, гарч ирэх дараагийн цонхонд та Power Query-д ойлгомжгүй файл дээр хулганы баруун товчийг дараад форматыг нь зааж өгөх хэрэгтэй болно.

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Үүний дараа файлыг зөв таних бөгөөд бид түүнд агуулагдах бүх хүснэгтүүдийн жагсаалтыг харах болно.

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Мэдээллийн баганын нүднүүдийн цагаан дэвсгэр дээр (Хүснэгт гэсэн үг биш!) хулганы зүүн товчийг дарснаар хүснэгтүүдийн агуулгыг харах боломжтой.

Хүссэн хүснэгтийг тодорхойлсон бол ногоон үгэн дээр дарна уу Хүснэгт - мөн та түүний агуулгад "унасан":

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

Түүний агуулгыг "самнах" хэд хэдэн энгийн алхмуудыг хийх хэрэгтэй, тухайлбал:

  1. Шаардлагагүй баганыг устгах (баганын толгой дээр хулганы баруун товчийг дарна уу - Remove)
  2. цэгүүдийг таслалаар солих (баганыг сонгоод хулганы баруун товчийг дарна уу - Утгауудыг солих)
  3. толгой хэсэгт тэнцүү тэмдгийг арилгах (баганыг сонгоод хулганы баруун товчийг дарна уу - Утгауудыг солих)
  4. дээд мөрийг арилгах (Нүүр хуудас – Мөрүүдийг устгах – Дээд мөрүүдийг устгах)
  5. хоосон мөрүүдийг арилгах (Нүүр хуудас - Мөрүүдийг устгах - Хоосон мөрүүдийг устгах)
  6. эхний мөрийг хүснэгтийн толгой хэсэгт өргөх (Нүүр хуудас - Эхний мөрийг гарчиг болгон ашиглана уу)
  7. шүүлтүүр ашиглан шаардлагагүй өгөгдлийг шүүнэ

Хүснэгтийг хэвийн хэлбэрт оруулах үед тушаалаар хуудас руу буулгаж болно хааж татаж аваарай (Хаах & Ачаалах) on Үндсэн таб. Мөн бид аль хэдийн ажиллах боломжтой ийм гоо сайхныг олж авах болно:

Power Query ашиглан PDF файлаас Excel рүү өгөгдөл импортлох

  • Power Query ашиглан баганыг хүснэгт болгон хувиргах
  • Наалттай текстийг багана болгон хуваах

хариу үлдээх