Je déteste utiliser les formules Excel pour extraire des noms de domaine d'URLs... et c’est la même chose pour Google Sheets, car c'est fastidieux et cela complique tout inutilement.
Cela force à manipuler des formules compliquées et du regex alors qu’on a parfois juste besoin d’extraire le nom de domaine d’une liste d’URLs.
Si vous devez obtenir le domaine d’une URL, ce guide est pour vous :
- Comment extraire un nom de domaine d'une liste d'URLs dans Excel
- Comment extraire des domaines dans Google Sheets
- Comment le faire avec l’IA et éviter toutes ces formules et regex
Première méthode : Extraire les domaines des URLs avec une formule Excel
Allons-y ! La première méthode utilise Microsoft Excel. Importez ou collez vos URLs dans une feuille Excel.
Collez ensuite cette formule dans une autre cellule pour extraire le nom de domaine de chaque URL :
Ma formule : =SUBSTITUTE(LEFT(MID(B5,FIND("//",B5)+2,LEN(B5)),FIND("/",MID(B5,FIND("//",B5)+2,LEN(B5))&"/")-1), "www.", "")
Appuyez sur “Entrée” pour appliquer la formule dans la cellule.
Explications sur la formule :
FIND("//", B5)+2
- Localise la position de
://
et se place juste après (ex : danshttps://
) - Sert à déterminer le début du domaine
- Localise la position de
MID(B5, FIND(...) + 2, LEN(B5))
- Récupère tout après
://
jusqu’à la fin de l’URL - Cela inclut domaine, path, etc.
- Récupère tout après
FIND("/", ..., &"/")
- Trouve le premier
/
après le domaine &"/"
sécurise la formule pour éviter les erreurs si/
absent
- Trouve le premier
LEFT(..., ..., -1)
- Tronque pour ne garder que le domaine (avant le premier
/
)
- Tronque pour ne garder que le domaine (avant le premier
SUBSTITUTE(..., "www.", "")
- Enlève le “www.” éventuel du domaine
Enfin, faites glisser le coin inférieur droit pour appliquer la formule à toute la liste, comme sur la photo :
💡 Astuce : Si vous utilisez Google Sheets, vous pouvez également coller cette formule pour un résultat identique.
Deuxième méthode : Extraire les domaines avec une formule REGEXREPLACE dans Google Sheets
La fonction =REGEXREPLACE()
intégrée dans Google Sheets permet d’extraire facilement les domaines d’URLs.
**Ce n’est pas très technique **et vous pouvez adapter la formule au besoin.
Importez ou collez une liste d’URLs en colonne A.
Ajoutez cette formule en colonne B :
=REGEXREPLACE(A2,"https?\:\/\/|www\.|\/.*|\?.*|\#.*","")
Validez avec “Entrée”.
Comment ça marche ?
REGEXREPLACE(...)
- Exploite les expressions régulières pour trouver/retirer certaines parties du texte (ici : l’URL)
- Chaque motif (séparé par
|
) est ce qui va être supprimé
https?\:\/\/
- Retire
http://
ethttps://
- Le
s?
permet de matcher les deux cas \:
et\/
servent à échapper (syntaxe regex)
- Retire
www\.
- Retire “www.” du domaine
\/.*
- Efface tout après le premier
/
- Efface tout après le premier
\?.*
- Supprime les paramètres d’URL
?exemple
- Supprime les paramètres d’URL
\#.*
- Efface les ancres/sections
#section
- Efface les ancres/sections
- Résultat final :
- Il ne reste que le nom du domaine (ex :
datablist.com
)
- Il ne reste que le nom du domaine (ex :
Étirez le coin de la cellule pour traiter toute la liste.
Voilà !
À noter : Regex replace fonctionne aussi dans Excel (version récente/web).
Troisième méthode : Extraire les noms de domaine grâce à l’IA
Voyons maintenant comment l’IA simplifie tout ça sans formule ni code.
La vidéo ci-dessous montre comment extraire des domaines en moins d’une minute grâce à l’intelligence artificielle.
Pour l’exemple, j’utilise Datablist.com, AI-Copilot pour la gestion de données.
Aucune formule, aucun code : une simple prompt suffit.
Guide étape par étape : extraire les domaines d’URLs avec l’IA
Créez votre compte Datablist.
Importez votre fichier contenant les URLs à transformer.
Après l’upload, cliquez sur "Edit" puis sur "AI Editing"
Tapez une prompt ou utilisez celle ci-dessous :
Prompt exemple :
Extract all the domains from this list without the subdomains.
Use {{URL}} as a reference.
Avant validation, l’IA vous montre un aperçu pour vérification.
Quand tout vous convient, cliquez "Run on items" pour appliquer la transformation !
Et voilà : le script a extrait tous les domaines de vos URLs.
Votre résultat final :
Conclusion
Formules Excel, scripts Google Sheets… ça fonctionne pour extraire les domaines, mais c’est vite technique. Aujourd’hui, l’IA va plus vite et sans prise de tête : à essayer d’urgence si vous ne connaissez pas !
FAQ — Foire aux questions sur l’extraction de domaines
Quels sont les meilleurs outils pour extraire des domaines d’une liste de liens ?
Trois méthodes efficaces : formules Excel, REGEXREPLACE Google Sheets ou les nouveaux outils IA qui automatisent tout.
Comment nettoyer des URLs compliquées dans un tableur ?
Les formules Excel suppriment “http://”, “www.”, et tout ce qui suit le premier / ; sur Google Sheets, REGEXREPLACE fait le ménage automatiquement.
Peut-on extraire en masse les domaines d’une grande liste d’URLs ?
Oui : pour les petits fichiers, une formule de tableur suffit ; pour de gros volumes, privilégiez l’IA, bien plus rapide et fiable.
Comment supprimer les sous-domaines lors de l’extraction ?
En adaptant vos formules ou votre regex, vous pouvez supprimer les sous-domaines pour ne garder que le domaine principal.
Quel est le moyen le plus rapide d’obtenir un nom de site depuis une URL longue ?
L’IA surpasse tout : elle extrait vos noms de site sur des listes entières en quelques secondes. Manuellement, une formule de tableur reste aussi possible.
Puis-je extraire des domaines sans aucune compétence technique ?
Oui : avec un outil IA moderne, vous importez votre liste, et l’outil fait tout automatiquement — aucune connaissance technique nécessaire !