Detesto usar fórmulas de Excel para extraer nombres de dominio de URLs; y lo mismo ocurre con Google Sheets, porque se vuelve complejo y añade fricción innecesaria.
Hay que pelearse con fórmulas y regex; aun así, a veces no me queda otra que tirar de Google Sheets o Excel para sacar los dominios de una lista de URLs.
Si necesita obtener el dominio a partir de una URL, esta guía es para usted:
- Cómo extraer dominios de una lista de URLs en Excel.
- Cómo extraer dominios de una lista de URLs en Google Sheets.
- Cómo extraer dominios de una lista de URLs con IA, sin fórmulas ni regex.
Primer método: extraer dominios de URLs con una fórmula de Excel
¡Vamos allá! El primer método es con Microsoft Excel. Importe o pegue sus URLs en una hoja de Excel.
Luego pegue esta fórmula en otra celda para extraer los dominios de su lista de URLs.
Esta es la fórmula: =SUBSTITUTE(LEFT(MID(B5,FIND("//",B5)+2,LEN(B5)),FIND("/",MID(B5,FIND("//",B5)+2,LEN(B5))&"/")-1), "www.", "")
Y presione “ENTER” para aplicar la fórmula a su celda.
Cómo funciona esta fórmula:
FIND("//", B5)+2
- Localiza la posición de
://
y la salta (por ejemplo, enhttps://
) - Define el punto de inicio de la parte del dominio
- Localiza la posición de
MID(B5, FIND(...) + 2, LEN(B5))
- Extrae todo lo que va después de
://
hasta el final de la URL - Incluye el dominio, la ruta, etc.
- Extrae todo lo que va después de
FIND("/", ..., &"/")
- Encuentra la primera
/
después del dominio - El
&"/"
garantiza que funcione incluso si no hay/
en la URL original (evita el error #VALUE)
- Encuentra la primera
LEFT(..., ..., -1)
- Recorta solo el dominio (antes de la primera
/
) del resultado de MID
- Recorta solo el dominio (antes de la primera
SUBSTITUTE(..., "www.", "")
- Por último, elimina
"www."
del dominio (si está presente)
- Por último, elimina
Finalmente, arrastre la esquina inferior derecha para aplicar la fórmula a toda su lista de URLs, como en esta imagen:
💡 No lo olvide: Si usa Google Sheets, también puede aplicar esta fórmula y obtener el mismo resultado.
Segundo método: extraer dominios con una fórmula REGEXREPLACE en Google Sheets
La función =REGEXREPLACE()
viene integrada en Google Sheets y extrae dominios a partir de URLs.
La función no es excesivamente técnica, y puede ajustarla según necesite.
Empiece importando o pegando su lista de URLs en la Columna A.
Agregue esta fórmula en la columna B, junto a las URLs.
=REGEXREPLACE(A2,"https?\:\/\/|www\.|\/.*|\?.*|\#.*","")
Presione “ENTER” para aplicar la fórmula a su celda.
Cómo funciona esta fórmula
REGEXREPLACE(...)
- Usa expresiones regulares para identificar y reemplazar partes del texto (en este caso, la URL).
- Cada patrón separado por
|
es un elemento que se eliminará.
https?\:\/\/
- Elimina tanto
http://
comohttps://
s?
significa que las
es opcional, así que coincide con ambos protocolos\:
y\/
escapan los dos puntos y las barras (sintaxis regex)
- Elimina tanto
www\.
- Quita
www.
del dominio (el punto escapado\.
indica punto literal)
- Quita
\/.*
- Elimina todo desde la primera barra
/
.*
significa “todo lo que sigue”, por lo que elimina la ruta de la URL
- Elimina todo desde la primera barra
\?.*
- Elimina los parámetros de consulta, como
?ref=newsletter
\?
escapa el carácter?
- Elimina los parámetros de consulta, como
\#.*
- Elimina los fragmentos/anclas, como
#section3
\#
escapa el símbolo#
- Elimina los fragmentos/anclas, como
- Resultado final:
- Queda un dominio limpio, como
datablist.com
- Queda un dominio limpio, como
Luego, arrastre la esquina inferior derecha para aplicar la fórmula a toda la lista.
¡Listo!
🔎 Dato interesante: Regex replace no es solo para Google Sheets; también funciona en Excel si usa la versión nueva o Excel en el navegador.
Tercer método: extraer nombres de dominio de URLs con IA
Ahora veamos cómo usar IA para acortar aún más el proceso.
Este video muestra cómo extraer dominios de URLs con IA en menos de un minuto.
Para este ejemplo, usaré Datablist.com, un AI-Copilot para la gestión de datos.
No necesita una fórmula ni código complejo — funciona con un solo prompt.
Guía paso a paso: cómo extraer dominios de URLs con IA
Primero, cree su cuenta en Datablist.
Ahora importe su archivo con las URLs de las que desea extraer los dominios.
Tras subir su archivo, haga clic en "Edit" y seleccione "AI Editing"
Escriba un prompt o use el mío debajo de esta imagen, y la IA hará todo por usted.
Aquí tiene el prompt para obtener los dominios de la lista de URLs:
Extract all the domains from this list without the subdomains.
Use {{URL}} as a reference.
Antes de aplicar cambios, la IA le mostrará una vista previa para que pueda verificar los resultados.
Cuando haya revisado los elementos, haga clic en "Run on items" para aplicar el cambio a todos.
Listo, el script se ha ejecutado y ha extraído todos los dominios de mi lista de URLs de empresas.
Así queda el resultado:
Conclusión
Las fórmulas de Excel y los scripts de Google Sheets funcionan bien para extraer dominios de URLs y muchos otros casos, pero pueden ser complejos. Como con IA estas tareas se resuelven en menos de un minuto, mi recomendación es probar primero con IA.
Preguntas frecuentes sobre la extracción de dominios
¿Cuáles son las mejores herramientas para extraer dominios de una lista de URLs?
Existen tres métodos potentes: fórmulas de Excel para quienes trabajan en hojas de cálculo, la función REGEXREPLACE de Google Sheets para trabajo en la nube, y herramientas con IA que automatizan todo el proceso.
¿Cómo limpio URLs desordenadas en una hoja de cálculo?
Puede limpiar dominios con fórmulas de Excel que eliminan "http://", "www." y todo lo que viene tras la primera barra. En Google Sheets, REGEXREPLACE ofrece una forma potente de limpiar URLs automáticamente.
¿Hay forma de extraer masivamente dominios de múltiples URLs?
Sí, la extracción masiva puede hacerse con fórmulas en hojas de cálculo o con herramientas de IA. Las hojas sirven para listas pequeñas; la IA procesa miles de URLs en segundos con mayor precisión.
¿Cómo quito los subdominios de las URLs?
Las fórmulas de extracción y los patrones regex pueden configurarse para eliminar subdominios y dejar solo el dominio principal. Es muy útil al analizar datos web o limpiar listas de URLs.
¿Cuál es la forma más rápida de obtener el nombre del sitio a partir de URLs largas?
Las herramientas con IA son la solución más rápida: extraen nombres de sitios a partir de listas completas en segundos. Si prefiere el método manual, las fórmulas también automatizan este proceso.
¿Cómo extraigo dominios sin conocimientos técnicos?
Las herramientas modernas con IA lo hacen accesible para cualquiera, sin conocimientos técnicos. Solo cargue su lista de URLs y deje que la IA haga la extracción automáticamente.