很多工具都声称可以“轻松”抓取 Shopify 店铺数据,但实际用起来,你往往还是会被复杂的 API、看似可视化却依然需要技术背景的操作界面困住。

问题在于: 这些工具都在卖“简单”,最后给你的却是另一种形式的技术折磨。

这篇指南不一样: 我们会教你一种真正 no-code 的 Shopify 抓取方法。这里说的 no-code,是真的不需要写代码。你不用配置 API,也不用研究网页元素,只需要用自然语言告诉 AI 你想要什么数据即可。

📌 给赶时间的你:快速总结

这篇文章会告诉你,如何在没有技术负担的情况下抓取 Shopify 店铺数据。如果你时间不多,先看这里:

问题: 市面上很多网页抓取工具都自称“no-code”,但实际上还是要求你操作 API,或者理解网页结构和元素,本质上只是换了一种方式增加技术门槛。

为什么这是个问题: 如果你想找一个真正简单的方法来抓取 Shopify 店铺,就不该先学一堆技术知识,或者花几个小时看教程。

解决方案: 使用 Datablist 的 AI Agent。你只需要粘贴 URL,再用自然语言描述你想提取哪些数据。

你将学到什么: 本文会介绍 3 种抓取 Shopify 店铺的方法,教你如何确认一个网站是否基于 Shopify 搭建,如何在手头没有目标网站时找到 Shopify 店铺,以及一些常见问题解答。

为什么选择 Datablist: 3 个很实际的理由

  1. 真正的 no-code,只要描述你的需求
  2. 自动处理分页,能抓完整个商品目录
  3. 一个平台即可使用 60+ Lead Generation 工具

本文会讲什么

如何抓取 Shopify 店铺

如果不考虑写代码的方案,抓取 Shopify 店铺主要有 3 种方法。但要注意,并不是每种方法都能真正避开技术门槛,很多工具依然存在明显的学习成本。

这一部分你会看到以下几种方法:

  1. 使用 AI 抓取:真正 no-code,几乎没有学习成本
  2. Click & Point 工具:不用写代码,但需要基础 HTML 知识
  3. Scraping API:不用写代码,但 API 本身并不简单

下面我们逐一来看。我们会从最简单的 Shopify 抓取方式讲起,再到相对更复杂的方案。

Datablist 的 AI Agent

这才是真正意义上的 no-code 抓取。你只需要用自然语言说明想要什么数据,粘贴一个 Shopify 店铺 URL,剩下的交给 AI。

  • 不用配置 API
  • 不用理解网页元素
  • 不用花时间看教程

它可以自动处理分页商品列表、渲染依赖 JavaScript 的页面,并准确提取你需要的数据。

The process of scraping with Datablist
The process of scraping with Datablist

Click & Point 工具

这类工具主打可视化操作,号称你只要点一点、选一选就能完成抓取。但现实是:你通常还是得理解网站结构、HTML 元素和 CSS selector。

虽然它们确实比自己写代码简单一些,但你大概率还是得花至少一小时看教程,再慢慢摸清楚怎么配置才对。

Easier than coding doesn’t mean no headaches
Easier than coding doesn’t mean no headaches

使用 Scraping API

有些平台把自己包装成“no-code”,但实际上还是要你去设置和配置 API。严格来说,API 确实不等于写代码,但对非技术用户而言,API 很多时候只是“换了个名字的代码”。

Nice explanation
Nice explanation

💡 为什么 AI 抓取更值得用

传统爬虫一旦网站改版,往往就会失效。AI scraper 识别的是数据的含义(比如“这是商品价格”),所以即使页面布局变化了,它也依然能找到对应信息。这样不仅更稳定,也几乎不需要后续维护。

用 AI 抓 Shopify,而不是写代码:详细步骤

前面说 Datablist 很好上手,并不是营销话术,实际流程真的只有几个步骤,简单说就是点几下就能开始。开始之前,先确保你已经准备好:

  1. 你要抓取的 Shopify 店铺 URL
  2. 你想提取哪些商品信息

第 1 步:注册并创建 Collection

  1. 注册 Datablist.com

    Datablist home page
    Datablist home page

    Datablist 首页

  2. 创建一个 New Collection

    Datablist’s starting page
    Datablist’s starting page

    Datablist 起始页面

第 2 步:进入 AI Agent

  1. 点击 See all sources
Empty collection in Datablist
Empty collection in Datablist
  1. 向下滚动,选择 AI Agent - Site Scraper
Datablist sources, AI scraping agent
Datablist sources, AI scraping agent

现在你会看到 AI Agent 界面,在这里可以配置你的抓取任务。

第 3 步:配置 Shopify 抓取任务

  1. URL to scrape 字段中粘贴 Shopify 店铺 URL
Datablist AI scraping agent, URL settings
Datablist AI scraping agent, URL settings
  1. 编写一个 prompt,告诉 AI 你想抓取哪些数据。下面是一段可直接修改使用的示例 prompt。
Datablist AI scraping agent, prompt cofiguration
Datablist AI scraping agent, prompt cofiguration
Goal: I want to extract all products from this Shopify store.
===
What I want you to do: Visit the store and get me all displayed products with their information.
===
Here's the information I am looking for (with examples):
- Product Name (Classic T-Shirt; Running Shoes Pro)
- Product Link (full URL to the product page)
- Original Price in the displayed currency ($29.99; €25.00)
- Sale Price if available (return "N/A" if no discount)
- Product Category (Men's Clothing; Women's Footwear)
- Product Description (brief description if available)
- Image URL (absolute link to the main product image)
- Availability (In Stock; Out of Stock; Pre-Order)
===
How to handle data inconsistencies:
- Return only one piece of information for each type
- Return "N/A" if the data isn't available
===
Mistakes to avoid:
- Don't return anything that doesn't fall in the mentioned data types e.g. call to actions, reviews, etc.
- Not all pages are structured in the same way but the products are labeled well enough that you should be able to recognize the distinctions between the data points
  1. 开启 Pagination,并将 Max Pages 设置为你想抓取的页数
Datablist AI scraping agent, pagination settings
Datablist AI scraping agent, pagination settings

📘 关于 Pagination(分页)

大多数 Shopify 店铺每页会展示 20 到 50 个商品。如果一个店铺有 500 个商品,你通常需要抓取 10 到 25 页。Datablist 的 AI Agent 可以自动处理分页页面,所以你不需要手动一页页抓。

第 4 步:配置 Outputs

对于每一项你想抓取的信息,都需要创建一个 output 字段:

  1. 向下滚动到 Outputs 区域
  2. Output Name 中填入 “Product Name”
  3. Output Description 中填入 “The name of the product”
  4. 点击 More 添加更多 output 字段
Datablist AI scraping agent, output configuration
Datablist AI scraping agent, output configuration

针对每一个数据字段重复这个过程:Product Link、Original Price、Sale Price、Category、Description、Image URL 和 Availability。

第 5 步:设置高级选项并运行

  1. 勾选 Advanced Settings
  2. 选择 OpenAI: GPT 4.1 mini(性能和价格比较均衡)
  3. Max iterations 设为 10
  4. 勾选 Website Scraper Option: Render HTML(想完整抓取商品时,这一步很关键)
  5. 点击 Continue
Datablist AI scraping agent, advanced settings
Datablist AI scraping agent, advanced settings

第 5 步:选择 Outputs 列

  1. 点击 ⊕ Icons,为每个 output 新增一列
  2. 点击 Run Import Now 开始抓取
Datablist AI scraping agent, outputs selection
Datablist AI scraping agent, outputs selection

几分钟后,你的 Collection 中就会出现这个 Shopify 店铺的完整商品数据。

Scraped product data
Scraped product data

💡 实用建议:避免重复导入

如果你之后还会重复抓取同一家店铺,为了避免同一个商品被导入两次:

  1. 选择唯一标识字段(如 Product Link 或 Product Name)
  2. 点击列标题,然后选择 Rename - Settings - Delete
  3. 勾选 Do not allow duplicate values
  4. 点击 Save Property

这样一来,后续再次运行时,你只会新增新商品,不会重复导入旧数据。

如何确认一个网站是不是 Shopify 店铺

判断一个网站是否使用 Shopify,其实并不难。只是根据你的使用场景不同,适合的方法也不一样。这一部分会介绍 3 种简单方法。

使用 Datablist 的 Technology Enrichment

批量验证效率最高

如果你需要一次性验证多个网站是否运行在 Shopify 上,Datablist 的 Technology Finder 是效率最高的方案。你可以:

  1. 上传一份网站 URL 列表
  2. 点击 Enrich,然后在 enrichment library 中搜索 Identify Technologies on Website
Datablist’s technology enrichment
Datablist’s technology enrichment
  1. 使用这个 technology enrichment 一次性检查所有网站
  2. 筛选出 Shopify 店铺
  3. 导出结果

如果你正在处理 lead list,或者做大规模竞品研究,这就是最合适的方法。你不需要一个个去检查网站,几分钟内就能验证几百甚至几千个站点。

使用 WhatRuns

一次检查一个网站操作简单

WhatRuns 是一个免费的浏览器扩展,可以快速告诉你某个网站用了哪些技术栈。使用方法如下:

  1. ChromeFirefox 安装 WhatRuns 扩展
  2. 打开你想检查的网站
  3. 点击浏览器工具栏中的 WhatRuns 图标
  4. 在识别出的技术列表中查找 “Shopify”

如果你只是临时浏览某个网站,想快速确认它是不是 Shopify,这个方法非常方便。但如果你要验证几十个或几百个网站,它就不太适合了。

WhatRuns is simple and effective enough
WhatRuns is simple and effective enough

检查网站源码

一次检查一个网站中等难度

很多人第一次打开网页源码时,看到几千行代码会有点发怵。但只要按下面的步骤做,其实并不复杂:

  1. 打开你想检查的网站
  2. 在页面任意位置右键,选择“查看网页源代码”
  3. 按 Ctrl+F(Mac 上是 Cmd+F)打开搜索
  4. 在搜索框中输入 “Shopify”
  5. 如果你看到 “cdn.shopify.com” 或 “myshopify.com” 之类的内容,就说明这个网站使用了 Shopify
Website source code
Website source code

如果你平时完全不接触代码,那检查源码这件事可能还是会让人不太舒服。所以如果你不想折腾,直接用前两种方法就可以。

一开始要怎么找到 Shopify 店铺

和很多事情一样,找出哪些公司在用 Shopify,也有不止一种方法。该用哪种,主要取决于你要找多少 Shopify 店铺,以及你希望多快拿到结果。

**这一部分会快速带你了解如何找到 Shopify 店铺,**一共介绍 3 种方法。

  1. 方法 1:用 Datablist 在几分钟内找到数千家使用 Shopify 的公司
  2. 方法 2:使用 Google Search Operators,从 SERP 中查找并提取店铺
  3. 方法 3:通过 MyIP.ms 获取运行在 Shopify IP 段上的公司

如果你想更深入了解,这里有一篇如何找到使用 Shopify 的公司详细指南 👈🏽

Datablist Technology Finder

速度最快、覆盖最全面的方法

Datablist 的 Technology Finder 由 Wappalyzer 驱动,可以让你访问超过 56 万个已验证的 Shopify 店铺。 这无疑是目前寻找 Shopify 公司最快的方法。它还提供丰富的筛选条件和搜索设置,比如:

  • 国家和语言
  • 首页关键词
  • 流量规模
  • 公司规模与行业

使用方法如下:

  1. 注册 Datablist.com
  2. 创建一个新的 Collection
  3. 点击 Find Companies By Technologies
  4. 在技术列表中选择 “Shopify”
  5. 添加其他筛选条件(国家、关键词等)
  6. 点击 Continue,然后点击 Run import now

几分钟内,你就能拿到一份符合条件的 Shopify 店铺列表,并附带公司信息、联系方式和网站元数据。

Results using Datablist’s Technology Finder
Results using Datablist’s Technology Finder

💡 拿到这些数据后,你可以做什么

有了 Shopify 店铺名单之后,你可以:

Google Search Operators 方法

你也可以通过 Google Search Operators 手动寻找 Shopify 店铺。这个方法免费,但比较耗时。下面是几个常用搜索语句:

  • site:myshopify.com - 查找使用 Shopify 默认域名的店铺
  • inurl:myshopify.com - 查找 URL 中包含 myshopify.com 的页面
  • intext:"Powered by Shopify" - 查找页脚显示这句话的店铺
  • site:myshopify.com + [niche] - 例如:"site:myshopify.com fashion"

如果你只是想找少量店铺,这个方法还算可用;但一旦你需要建立一个较大的店铺名单,就会变得非常低效。而且你还需要手动验证和整理结果。

Google Search Operators method
Google Search Operators method

MyIP.ms 方法

MyIP.ms 是一个提供 IP 查询服务的网站。由于不少 Shopify 店铺会共享特定的 IP 地址段,你可以从 Shopify 的 IP 入手去找店铺。

操作方法如下:

  1. 访问 MyIP.ms
  2. 搜索以下任一 Shopify IP:
    • 23.227.38.32
    • 23.227.38.36
    • 23.227.38.6523.227.38.74
  3. 查看托管在该 IP 上的域名列表
  4. 手动验证哪些是活跃的 Shopify 店铺
  5. 对每个 IP 地址重复以上步骤
Myip.ms results
Myip.ms results

这个方法的局限也很明显:

  • 你需要逐个搜索 IP 地址
  • 每个域名都需要手动验证
  • 导出和整理数据可能要花上几天
  • 数据本身不包含 business information

除非你时间无限、预算为零,否则这个方法通常不值得优先考虑。

结论:用 AI,省时间,而且可以持续复用

如果写代码不是你的工作,那你就不该为了抓几个 Shopify 店铺,先逼自己学一套技术栈。因为抓取 Shopify 店铺,本来就不该这么复杂。

选对工具,差别真的很大。

传统抓取方法通常要求你理解 API、CSS selector,或者复杂的 Click & Point 配置逻辑;而像 Datablist 这样的 AI 驱动工具,已经把这个流程变成了大多数人都能直接上手的事情。

你只需要记住下面几点:

  • 如果你要抓商品数据: 用 Datablist 的 AI Agent,直接写自然语言 prompt
  • 如果你要确认一个网站是不是 Shopify: 快速检查用 WhatRuns,批量处理用 Datablist
  • 如果你要寻找 Shopify 店铺: 想要最完整、最高效的结果,直接用 Datablist 的 Technology Finder

关键在于,选择最符合你需求的方式。如果你重视时间成本,也希望在不碰技术细节的前提下拿到稳定结果,AI 抓取会是更合适的选择。

Shopify 抓取常见问题 FAQ

用 Datablist 最多可以抓取多少商品?

使用 Datablist 时,单个 Collection(表)最多可以抓取 100,000 个商品。如果真的碰到上限,直接新建一个 Collection,再重复同样流程即可。这个上限对于绝大多数 Shopify 店铺来说已经完全够用,哪怕是大型电商站点也不例外。

Datablist 的 AI Agent 可以抓取带分页的店铺吗?

可以。Datablist 的 AI Agent 支持自动处理分页店铺。单次运行最多可以抓取 5,000 页,基本足以一次性抓完整个电商网站。大多数 Shopify 店铺的页数,远远达不到这个上限。

可以用 Datablist 的 AI Agent 抓取 Amazon 吗?

可以。Datablist 的 AI Agent 同样支持抓取 Amazon 商品列表,流程和抓取 Shopify 店铺几乎完全一样。你只需要提供 Amazon 搜索结果页 URL,并说明你想提取哪些商品信息,AI 就会自动处理分页和数据提取。

如何抓取电商网站里的商品数据?

如果你想抓取任意电商网站的商品数据,可以直接使用 Datablist 的 AI Agent。只需要提供网站 URL(或某个分类页链接),再用自然语言说明你需要哪些商品信息,AI 就会帮你完成提取。

Datablist 的 AI Agent 能抓取不是 Shopify 搭建的电商网站吗?

可以。Datablist 的 AI Agent 不只支持 Shopify,也能抓取其他电商平台搭建的店铺,流程完全一样:提供 URL,描述你要抓哪些数据,它就会自动完成。哪怕你的目标列表里混合了不同平台的网站,也一样可以处理。