Разработал библиотеку для парсинга налоговых данных. Позволяет распарсить сведения о государственной регистрации юридических лиц и индивидуальных предпринимателей https://egrul.nalog.ru/
Парсит pdf файл, возвращает результат в виде массива. Для парсинга pdf в текст используется Smalot PdfParser
Для дальнейшей обработки данных используется парсинг по ключевым словам.
Библиотека доступна на github, можно установить через composer. Руководство по использованию и demo доступны на github.
Адрес: https://github.com/antonshell/egrul-nalog-parser
Технологии: PHP, Smalot PdfParser, Packagist