http://tinyurl.com/tvlf73k en día la gente usa PDF a gran escala para leer, presentar demo y muchos otros propósitos. Y muchos sitios web almacenan datos en un archivo PDF para que los espectadores los descarguen en lugar de publicarlos en las páginas web, lo que conlleva cambios en el web scraping. Puede ver, guardar e imprimir archivos PDF con facilidad. Pero el problema es que PDF está diseñado para mantener la integridad del archivo. Es más como un formato de ''papel electrónico'' para asegurarse de que el contenido se vea igual en cualquier computadora en cualquier momento. Por lo tanto, es difícil editar un archivo PDF y exportar datos desde él. Afortunadamente, hay algunas soluciones que ayudan a extraer datos de PDF a Excel y los presentaremos en esta publicación de blog. De:http://www.octoparse.es/blog/como-extraer-datos-de-pdf-a-excel