Documentos PDF ante Google – 10 Preguntas Comunes

Hace 5 días, Ramón , me hizo una pregunta muy interesante sobre SEO, y en este post explico todo sobre el tema.

La pregunta es: … detecta Google los archivos PDF? Detecta los archivos duplicados?

Sin duda, es una pregunta que raras veces nos planteamos.

Pero, conocer sobre esto puede influir mucho en el posicionamiento de tu Blog.

Descubre a continuación, las respuestas a las 10 preguntas más comunes sobre los Archivos PDF ante Google:

1-¿Puede leer Google el contenido de los PDFs?

Por supuesto!

Google es un motor de búsqueda “inteligente”, y puede leer todo el contenido textual de los archivos PDF en cualquier sitio web.

Google no puede leer imágenes en documentos PDF, tampoco los documentos protegidos con contraseña o encriptados.

2- ¿Puede detectar Google el Contenido Duplicado en PDFs?

Sí. Cuando Google lee el contenido de un documento PDF puede detectar si es contenido duplicado, ya sea de otro PDF o contenido de otro sitio web.

En algunos casos, cuando el sitio web publica artículos y permite visualizarlos en diferentes formatos (página web y pdf), es recomendable utilizar la etiqueta ‘rel=canonical’ para indicar a Google cual es la versión original, y así evitar que indexe ambas versiones.

3- ¿Indexa Google los archivos PDFs?

Sí. Google puede indexar los archivos PDF, siguiendo el mismo proceso al indexar una página web.

Entonces, se aplican las mismas reglas que conocemos. Si Google detecta que el PDF ha sido publicado en otro sitio, es posible que no sea indexado.

4- ¿Posiciona Google en las búsquedas SERP los PDFs?

Si, y existen 3 factores principales para determinar el posicionamiento de un PDF.

  • El título a mostrar en las búsquedas será el Título del documento PDF
  • La Descripción es generalmente, el primer párrafo del documento
  • Permalink

5- ¿Cómo considera Google los enlaces en PDFs?

Google considera los enlaces al igual que en documentos HTML. Esto quiere decir, que permite el flujo de PageRank y el robot también puede “seguirlos”.

Debido a su naturaleza, es “imposible” colocar el atributo “nofollow” a los enlaces en los documentos PDF.

6- ¿Cuál es el largo adecuado de un documento PDF?

La creencia popular dicta que los PDF deben ser largos, casi como eBooks. Pero, en realidad a Google no le interesa el largo del documento.

Google considera los documentos PDF como simples artículos publicados en un formato diferente al habitual (documentos HTML).

Entonces, tú puedes publicar un PDF de 500 palabras, y será indexado igual que un PDF de 50,000 palabras.

7- ¿Puedo generar tráfico a través de Documentos PDFs?

En teoría, sí.

Digo “en teoría” porque no generan mucho tráfico, son una fuente de tráfico pasivo.

Por ejemplo, hace aprox. 1 año, publiqué un PDF original en Scribd.com, y hasta el momento he recibido 119 visitas provenientes de Scribd, las cuales equivalen a casi 10 visitas mensuales.

8- ¿Cuál es la mejor manera de hacer Link Building con documentos PDFs?

Muchos creen que la mejor manera es enviar artículos en PDF a plataformas como Scribd. Pero están equivocados.

En lo personal, la técnica que me ha generado mejores resultados es la publicación de un eBook Gratuito, el cual se encuentra alojado en mi propio blog.

De esta manera, si otro blogger desea compartir con sus lectores el Ebook, se verá obligado a crear un backlink hacia mi blog!

9- ¿Puede afectar mi posicionamiento la publicación de un PDF?

Por supuesto!

Al igual que cualquier artículo. Si tú publicas un PDF con contenido duplicado, es posible que sea indexado, pero estará mal posicionado, afectando así el posicionamiento global de tu sitio web.

10- ¿Cómo puedo evitar que Google indexe mi documento PDF?

Puedes usar los mismos métodos que se utilizan con los sitios web tradicionales. Entre los métodos más usados tenemos: El bloqueo a través del archivo robots.txt y el uso de la etiqueta <meta name=”robots” content=”noindex,follow,noodp”/>

Concluyendo…

Los documentos PDF son considerados por Google  “casi” igual que los documentos HMTL.

Pero, también merecen ser mencionadas las desventajas de los PDFs, al usarlos como herramienta de SEO y marketing:

  • La desventaja principal de los PDF es que no puedes agregar anuncios o monetizarlos eficientemente
  • Es contenido estático
  • Si actualizas el documento, solo verán los cambios las personas que descarguen nuevamente o por primera vez el documento.
  • No tienes libertad total, al momento de optimizar (SEO) el documento. Posee muchas limitaciones!
  • Google no lee las imágenes
  • Entre otras

Como puedes ver, los documentos PDF poseen varias desventajas en cuanto  a SEO.

En lo personal no recomiendo la publicación de PDFs si tienes la opción de publicar en formato HTML (sitio web tradicional).

Acerca de Jose Vega

Soy Programador y mi trabajo es ayudar a las personas a Iniciar Negocios por Internet. Yo tengo varios negocios rentables propios y me gusta ayudar a nuevos emprendedores.

Deja tu Comentario


(Requerido)

15 Comentarios

  1. noriaki

    Feb 27. 2013

    Sencillamente muy interesante el artículo. Sin embargo me crea una gran duda:
    Cuando uno copia algun texto ya sea algunos párrafos de un libro, contrato, oración religiosa, poema, etc. ¿ Que pasa con google?
    Se supone que no se puede cambiar ninguno de esos contenidos. Me gustaría conocer tu opinión. Gracias.

    Responder a este comentario
  2. Ramon

    Feb 28. 2013

    Gracias por tu atención, aclarado por completo.
    Un saludo.

    Responder a este comentario
  3. Freyr Berkana

    May 10. 2013

    Excelente!! Muchas gracias por tu publicaciòn, realmente tenia dudas y queria comenzar un proyecto de posicionamiento con pdf`s pero me acabas de dar una super idea al decirme que èstos archivos google solo los encuentra como texto y no como imagenes. Muchas Gracias!!!

    Responder a este comentario
  4. Carmen

    Ago 31. 2013

    Muy buenas explicaciones. Pero hay algo que no sé dónde se coloca ni cómo:
    .

    Yo quiero crear una página web y quiero insertar un documento en PDF para comercializarlo, pero no sé cómo evitar que Google lo indexe y lo publique.

    Muhas gracias por tu tiempo. Un saludo.

    Responder a este comentario
    • Jose Vega

      Ago 31. 2013

      Hola Carmen.

      Puedes subir el documento PDF a un directorio, luego, crea un archivo robots.txt en el directorio principal de tu blog, y agrega lo siguiente al inicio del archivo robots:

      User-agent: *
      Disallow: /carpeta-a-bloquear/

      El directorio a bloquear debe ser una dirección URL relativa.

      Si deseas bloquear el directorio http://tublog.com/directorio/ebook/. Debes agregar /directorio/ebook/.

      Si solo deseas bloquear el Documento PDF, y se encuentra en la dirección URL http://tublog.com/directorio/ebook/documento.pdf. Debes agregar /directorio/ebook/documento.pdf

      Ten cuidado, si agregas solo / bloquearás todo tu blog.

      Espero que te sea de ayuda, Saludos.

      Responder a este comentario
  5. Mygue Morrison

    Sep 16. 2013

    Excelente articulo, según eh leido en foros que los pdf ayudan al posicionamiento en general del sitio web, es decir, recomiendan subir archivos pdf, videos etc, pero si no ayudan en eso entonces podría ser una perdida de tiempo?

    Responder a este comentario
    • Jose Vega

      Sep 16. 2013

      Sí, puede ser una pérdida de tiempo. Como digo en el artículo, si tú tienes un blog, es mejor publicar los artículos en el blog. Puedes publicar documentos PDF solo cuando sea un libro, o un texto extremadamente largo.

      Saludos.

      Responder a este comentario
  6. Andres

    Ene 12. 2014

    Hola Jose! Muy buen artículo! Y un poco preocupado después de leerlo jaja

    Estoy armando un pdf el cual contiene varios post de mi blog. Y además otros tantos post que serán exclusivos del pdf.

    Mis post en el blog ya tienen el rel=canonical. Mientras que el pdf lo enviare aquellos que estén suscritos a mi lista de email.

    Con ese canonical creo yo que es suficiente para evitar el contenido duplicado. Estoy en lo correcto?

    Muchas gracias por la info!
    Saludos,
    Andrés

    Responder a este comentario
  7. David

    Mar 02. 2016

    Hola Jose.

    Un artículo muy útil para mi. Tengo un blog musical con varias partituras en PDF, gratis para que los usuarios las descarguen y puedan disfrutar de la música. Los PDF contienen imágenes, no texto y al leer tu artículo he comprendido que google no va a indexar estos archivos y por lo tanto no van a ser vistos por las personas que busquen esas partituras.

    Me encantaría que google indexara las imágenes de los PDF para que se vieran en Google imágenes ya que creo que en este caso los usuarios se guían más por esta página para buscar partituras. ¿Qué me recomiendas?

    Antes de nada, muchísimas gracias por tu tiempo. Tienes un blog muy cuidado y lleno de contenido útil para personas como yo, que estamos empezando.

    Un fuerte abrazo desde España.

    Responder a este comentario
    • Jose Vega

      Mar 06. 2016

      Hola David, me alegra que te haya servido el artículo. Respondo tus preguntas:

      1- Para que tus partituras aparezcan en Google Imágenes deben ser imágenes reales. Puedes convertir los PDFs a imágenes y publicarlas en tu sitio web en lugar del PDF. Automáticamente saldrán en Google Imágenes.

      2- Google sí indexará tu PDF . La diferencia es que, al tener poco o nada de texto, posiblemente no saldrá en los primeros lugares de los resultados en Google porque no podrá superar a otras páginas que tienen más texto.

      Pero en principio sí estarán indexados.

      Saludos.

      Responder a este comentario