item_get获得商品详情
item_review获得商品评论列表
item_search按关键字搜索商品
请求地址: http://wechat:17610352720.cn
 
数据采集
采集的字段包括:商品名、商品id、原价、现价、一级分类、二级分类、店铺id、销量等;
 
 上图是监控的temu数据中月销售额Top10的产品
数据用途:
- 量化分析
 - 投资分析
 - 跨境电商选品分析
 - 练手学习
 

 上图为temu单品销量Top10,由于销量最大显示10万+,所以该统计意义不大。
def send_request(url):
    proxy = ProxyClient.random_ip()
    session = requests.Session()
    proxies = {
        "http": f"http://{proxy}",
        "https": f"http://{proxy}"
    }
    cookies = {
        'region': '211',
        'language': 'en',
        'currency': 'USD',
        'timezone': 'Asia%2FShanghai',
        'shipping_city': '211%2C211000000022022',
    }
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/112.0',
        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8',
        'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
    }
    response = session.get(
        url,
        headers=headers,
        proxies=proxies,
        cookies=cookies,
        # params=params,
        timeout=10,
        allow_redirects=False
    )
    # html = response.text
    raw_data1 = re.findall(r"window\.rawData\s*=\s*(\{.+?\});", response.text, re.DOTALL)
    raw_data = json.loads(raw_data1[0])
    print(raw_data)
 
联系
全量数据 定制开发
感谢观看~










