Puedo scrapear cientos de casos de éxito en minutos, y usted también puede.
En esta guía le muestro cómo scrapear casos de éxito de forma eficiente para crear una base de datos útil para ventas y marketing o análisis competitivo.
Al final del tutorial, podrá extraer automáticamente no solo los enlaces a los casos de éxito, sino también información clave como datos del cliente, sector e indicadores relevantes, todo organizado en un formato estructurado.
Este flujo de trabajo tiene 2 partes con pasos accionables:
- En la primera parte scrapeamos todos los enlaces desde las páginas principales donde están las historias de clientes
- En la segunda parte scrapeamos la información específica que necesitamos
Nota: Esta guía es para scrapear decenas o cientos de casos de éxito de un sitio web. Si quiere scrapear uno o dos casos de muchos sitios de empresas, vea esto: How to Scrape Case Studies at Scale with AI.
Parte 1: obtener enlaces de casos de éxito
Parte 1, Paso 1 para scrapear todos los casos de éxito de un sitio web
Vaya a Datablist.com y regístrese.
Cree una collection
Haga clic en “See all sources”
Elija “AI Agent - Site Scraper”
Parte 1, Paso 2 para scrapear todos los casos de éxito de un sitio web
En este paso configuraremos nuestro AI agent para extraer todos los enlaces de la página donde se listan los casos de éxito.
Empiece pegando el enlace de la página con los casos de éxito.
Ahora escriba un prompt para extraer los enlaces o use nuestra plantilla de abajo.
Este es mi prompt:
Quiero que extraiga todos los enlaces a los casos de éxito en esta página
===Extraiga solo los enlaces que tengan esta estructura "https://www.mazak-customers.com/story/story/......"
===
Sin introducciones
Sin explicaciones
Sin pensamientos
Solo los enlaces que lleven al caso de éxito
Asegúrese de darle a la IA un ejemplo de la estructura de enlace que desea capturar, como www.mazak-customers.com/story/
o www.salesforce.com/customer-stories/
, ya que a veces encuentra PDFs, que no son tan útiles para este caso.
Ahora marque la casilla a la izquierda de "Enable Pagination" y establezca un límite de páginas que el AI agent podrá visitar.
Luego configure sus outputs según lo necesite o copie los valores de abajo:
- Output Name: Case Study Link
- Output Description: The link found on the page
- Output Type: URL
Después, marque la casilla a la izquierda de "Advanced Settings" y active "Website Scraper Option: Render HTML".
Cuando termine, haga clic en "Continue" para iniciar el scraping.
Cuando el AI agent finalice, su collection debería verse así.
Los resultados muestran el enlace del caso de éxito en la columna "Case Study Link" y la página origen en "Page Scraped".
Ahora que ya tenemos todos los enlaces, vamos a scrapear el contenido de cada caso de éxito.
Parte 2: extraer información de los casos de éxito
Esta parte es un poco más sofisticada, pero le ahorrará muchísimo tiempo frente a hacerlo manualmente. Siga estas instrucciones y irá sobre seguro.
Estos son los pasos del flujo de trabajo:
- Visitar una o dos páginas para analizar su estructura
- Crear tags para cada dato que quiera extraer
- Escribir un prompt con instrucciones claras y ejemplos
- Configurar los outputs que necesita
- Ejecutar el AI agent para scrapear el contenido
Parte 2, Paso 1 para scrapear todos los casos de éxito de un sitio web
Primero, visite una o dos de las páginas que acaba de scrapear, defina qué datos quiere obtener y busque patrones en la estructura de los casos de éxito.
Después, cree un tag para cada dato que necesite, dé ejemplos a la IA y dígale dónde puede encontrar la información, ya que así obtendrá resultados mucho mejores.
A veces puede pasar el cursor por encima del texto para ver si el enlace tiene especificaciones que le ayuden a definir mejor los formatos de salida. En mi caso, por ejemplo, "VERSATECH" sería una serie de máquina.
💡 Consejo rápido
Dar ejemplos puede mejorar sus resultados hasta 3 veces.
Parte 2, Paso 2 para scrapear todos los casos de éxito de un sitio web
En este paso configuraremos el AI agent para scrapear la información de cada página del caso de éxito — ¡vamos allá!
Primero, abra de nuevo su collection con los enlaces a las páginas de casos de éxito.
Como la columna "Scraped Page" no se necesita para este flujo, la ocultamos y luego hacemos clic en "Enrich".
Vaya a “AI” y seleccione “AI Agent”.
Ahora copie la plantilla de prompt de abajo y modifíquela con la información que quiera extraer de la página del caso de éxito.
Contexto: Necesito cierta información relacionada con el caso de éxito en la página web
===Qué quiero que haga: Visite la página que le voy a dar y extraiga los data points solicitados. Enseguida le daré más detalles sobre la información
===
Los data points que debe buscar (con ejemplos):
[Tag de información 1] p. ej., [Ejemplo 1, Ejemplo 2, Ejemplo 3]
[Tag de información 2] p. ej., [Ejemplo 1, Ejemplo 2, Ejemplo 3]
[Tag de información 3] p. ej., [Ejemplo 1, Ejemplo 2, Ejemplo 3]
Puede acceder al caso de éxito con este enlace: /Su columna
Aquí tiene esta plantilla con datos de ejemplo:
Contexto: Necesito cierta información relacionada con el caso de éxito en la página web
===Qué quiero que haga: Visite la página que le voy a dar y extraiga los data points solicitados. Enseguida le daré más detalles sobre la información.
===
Los data points que debe buscar (con ejemplos):
Información de la máquina:
- Serie de máquina p. ej., VERSATECH, Dual Turn, CV5-500
- Nombre de máquina p. ej., VERSATECH V-140N/280, OPTIPLEX 4020 DDL, INTEGREX j-200
Información del cliente:
- Sector del cliente p. ej., Manufacturing, Aerospace, Construction
- Ubicación del cliente p. ej., Germany, France, Baltics
- Nombre del cliente p. ej.,
Puede acceder al caso de éxito con este enlace: /Case Study Link
💡 Dato rápido sobre el AI Agent
El AI agent sigue muy bien las instrucciones, pero si no le da ejemplos claros no obtendrá buenos resultados.
Tras configurar su prompt con nuestra plantilla, debe configurar los outputs. Así se hace:
Para cada dato que quiera extraer:
- Use el nombre del tag de información como "Output Name"
- Añada una descripción clara en "Output Description" o incluya ejemplos
- Elija el "Output Type" adecuado para el dato
- Haga clic en "More" para añadir más outputs y repita el proceso
Cuando haya configurado todos los outputs, haga clic en "Continue to outputs configuration"
Ahora haga clic en todos los iconos de más (+) para añadir una nueva columna por cada output, y luego en "Instant Run"
Estos son los resultados de los casos de éxito scrapeados
Preguntas frecuentes sobre scrapear casos de éxito
¿Cómo puedo scrapear casos de éxito de forma legal?
El scraping es legal cuando se extraen datos públicos y se respetan los derechos de autor.
¿Qué herramientas necesito para scrapear casos de éxito?
Puede usar herramientas de web scraping no-code como Datablist.
¿Cuánto se tarda en scrapear casos de éxito de un sitio web?
Con herramientas como Datablist, puede scrapear cientos de casos en minutos u horas. La configuración suele llevar 15–30 minutos una vez entiende la estructura del sitio.
¿Puedo scrapear casos de éxito de cualquier sitio web?
No todos los sitios permiten scraping. Algunos usan medidas anti-scraping o lo prohíben en sus términos de servicio.
¿Qué tipo de información puedo extraer de los casos de éxito?
Puede extraer datos como nombre de la empresa, sector, retos, soluciones, resultados, testimonios, fechas y métricas. La clave es identificar patrones consistentes en la estructura para asegurar una extracción precisa.