Использование файлов PDF — это простой и безопасный способ отправки и обмена документами по почте. Если вы хотите сохранить формат и детали таблицы, рекомендуется преобразовать документ в PDF. Однако извлечение таблицы из одной — непростая задача, когда вы получаете PDF-файл.
Конечно, вы захотите сэкономить время и не захотите создавать новую таблицу с нуля. Как же извлечь таблицы из PDF, не прибегая к копированию и вставке? Вот несколько способов, которыми вы можете этого добиться.
Использование онлайн-конвертеров
Самый быстрый способ — использовать онлайн-конвертеры файлов для преобразования PDF-файла в любой другой формат документа. Несколько бесплатных онлайн-инструментов конвертируют PDF в Excel для извлечения табличных данных. Популярными примерами являются cometdox, а также Littlepdf. Однако большинство из этих инструментов предлагают только базовые возможности извлечения.
Отказ от ответственности: Мы настоятельно рекомендуем избегать использования онлайн-конвертеров при работе с PDF-файлами, содержащими конфиденциальную и секретную информацию.
Вот как извлечь таблицы из PDF-файлов с помощью Smallpdf:
Шаг 1: Посетите веб-сайт Smallpdf.
Посетите Smallpdf
Шаг 2: Выберите преобразование, которое вы хотите выполнить.
Шаг 3: Перетащите файл PDF, который вы хотите преобразовать, в конвертер PDF.
Шаг 4: После завершения загрузки файла нажмите «Преобразовать в Excel».
Шаг 5: Нажмите «Загрузить», чтобы сохранить PDF-файл на своем устройстве.
Шаг 6: Запустите загруженный Excel, чтобы убедиться, что ваша электронная таблица была преобразована точно.
Извлечение таблиц с помощью Microsoft Power BI
Microsoft BI — еще один полезный инструмент для извлечения табличных данных из файлов PDF. В частности, функция Power Query в Power BI позволяет пользователям легко импортировать PDF-файлы и извлекать табличные данные из документа.
Однако это работает только для тех, у кого есть подписка Office 365; в противном случае вам придется приобрести Power BI отдельно.
Power Query также доступен в рамках бесплатной пробной версии Power BI. Вот как использовать его для извлечения табличных данных:
Шаг 1: Загрузите, установите и запустите Microsoft Power BI.
Скачать Microsoft Power BI
Шаг 2: Выберите «Извлечь данные» в разделе «Главная» на приборной панели приложения.
Шаг 3: Нажмите «Файл», а затем выберите «PDF».
Шаг 4: Нажмите «Ссылка», чтобы отобразить местоположение файла PDF на вашем компьютере.
Шаг 5: Выберите местоположение PDF-файла для импорта в Power BI.
Шаг 6: После импорта файла в Power BI вы должны увидеть навигатор с номерами таблиц и страниц. Выберите номер таблицы, которую вы хотите загрузить.
Шаг 7: Выберите Загрузить, чтобы создать таблицу в Power BI.
Использование MicrosoftExcel
В Microsoft Excel, как и в Power BI, есть функция Power Query, которую можно использовать для загрузки PDF-файлов и извлечения табличных данных. Однако эта функция доступна только в Excel 2016 или более поздней версии. Вот как это работает:
Шаг 1: Запустите Microsoft Excel.
Шаг 2: Выберите опцию Данные на ленте.
Шаг 3: Выберите «Извлечь данные», чтобы открыть выпадающий список.
Шаг 4: Выберите «Из файла» и «Из PDF».
Шаг 5: Выберите местоположение PDF-файла для импорта в Excel.
Шаг 6: После импорта файла в Excel вы должны увидеть навигатор с номерами таблиц, страниц или предварительный просмотр данных в PDF-файле. Выберите номер таблицы, которую вы хотите загрузить.
Шаг 7: Выберите Загрузить, чтобы создать таблицу в Excel.
Если вы используете Microsoft Office 2016 или более позднюю версию и заметили, что на вкладке данных нет функции Power Query. Вот как его установить.
Шаг 1: Перейдите на веб-сайт Microsoft.
Скачать Power Query.
Шаг 2: Выберите язык дополнения.
Шаг 3: Выберите «Загрузить».
Шаг 4: Выберите версию надстройки, которую вы хотите загрузить.
Шаг 5: Выберите Далее, чтобы начать загрузку.
Шаг 6: Когда загрузка будет завершена, запустите файл для установки дополнения.
Использование Adobe Acrobat Pro DC
Adobe Acrobat Pro DC — еще один инструмент, который можно использовать для извлечения табличных данных из PDF-файлов или преобразования PDF-файлов в другие типы файлов, например Excel, для анализа данных. Инструмент имеет 7-дневную пробную и профессиональную версии, его можно использовать онлайн или загрузить на свое устройство.
Веб-версия Adobe Acrobat
Вот как использовать веб-версию для извлечения табличных данных:
Шаг 1: Перейдите по ссылке на веб-страницу Adobe Acrobat Pro DC.
Посетите веб-сайт Adobe Acrobat Pro DC
Шаг 2: В верхней части страницы выберите меню Конвертировать.
Шаг 3: Прокрутите страницу вниз и найдите PDF to Excel.
Шаг 4: В новом всплывающем меню перетащите файл PDF, который вы хотите преобразовать.
Шаг 5: После завершения загрузки файла выберите Экспорт в XLSX.
Шаг 6: Выберите значок «Загрузить» в верхней части страницы, чтобы сохранить преобразованный файл на своем устройстве.
Adobe Acrobat на ПК
Вот как использовать версию для ПК для извлечения табличных данных:
Шаг 1: Запустите приложение Adobe Acrobat Pro DC.
Шаг 2: В приложении выберите «Открыть файл».
Шаг 3: Используя библиотеку файлов, выберите файл PDF для импорта в приложение.
Шаг 4: Открыв файл, выделите курсором данные таблицы.
Шаг 5: Щелкните правой кнопкой мыши выделенную область и выберите «Экспортировать выделенное как».
Шаг 6: В библиотеке файлов введите имя файла и выберите тип файла.
Сравнение двух файлов PDF
Извлечение таблиц из файлов PDF не является невыполнимой задачей. С помощью Power Query в Excel и Power BI можно импортировать файлы других типов, кроме PDF. С другой стороны, с помощью Adobe Acrobat Pro DC можно сравнивать два PDF-файла бок о бок.