0
点赞
收藏
分享

微信扫一扫

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?


当我们选择HTTP代理的时候,经常看到人说,

“芝麻代理不错,就是贵了点。”

“芝麻代理的还可以,如果预算够的话”

……

但如果我们在互动社区,也能常常看到又朋友说不行的。

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_测试运行

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_HTTP_02

吐槽的时长跨度好几年的,看到这我生出一种疑问,目前市面上很多HTTP代理都有提供试用,购买之前大部分人都会使用,如果测试结果不行,为什么会购买?

秉着对真相的探究,我自费购买芝麻网络HTTP代理进行测试供大家参考。那一起看看测试结果吧!


1.测试HTTP代理的注意事项

在测试之前,我们需要注意的是:

  • 测试环境应该符合实际应用环境
  • 测试频率要符合我们日常做数据采集的使用习惯
  • 测试IP的节点范围要广
  • 不同应用场景下的不同需求,需要选择适合的测试方法和指标


2.HTTP代理测试项目

本次主要测试这几个方面:稳定性、匿名程度、响应速度、IP池可用率以及带宽等问题,通常我们会结合多种测试方法和工具,以此来全面评估这家HTTP代理的质量,衡量是否值得购买。


  • 响应速度

通过测量HTTP代理与目标服务器之间的响应时间,评估HTTP代理的连接速度。在测试的时候,可以统计一下所有的时间,然后测算平均响应时间。如果这个HTTP代理能够更快地传输请求和接收响应,证明这个HTTP代理速度越快。

  • 可用率

一个可用性高的HTTP代理意味着它在大部分时间内都能正常工作,并且能够顺利传递请求和响应。我这设置成30秒,意思就是使用这个HTTP代理访问网站超过30秒还是得不到响应,就默认为这个HTTP代理无效了。

假设我们一次性提取1000个HTTP代理,如果这1000个HTTP代理在我们使用的时候,有50个超过30秒得到不到响应/无法传递请求,则认为这个可用率为(1000-50)➗1000=95%。

  • 稳定性

在数据抓取的时候,我们会用到大量的HTTP代理,一个稳定的HTTP代理能够长时间保持连接,并且不会频繁断开或出现连接错误,才能有效助力我们数据抓取。

  • 带宽

对于大部分的用户来说,HTTP代理的带宽高低也很影响使用体验,而影响HTTP代理的带宽高低的因素蛮多的,如:HTTP代理的使用人数、厂商对HTTP代理带宽的限制、代理服务器的性能等。


ps:大家如果想要自己测试,可以根据实际需求和应用场景稍作调整。


3.测评环境

良好的测试环境,需要在稳定的网络环境下测试,以及,至少跑得动的设备,手动加狗头。

这次测评,我是使用 python 30个线程池进行多线程测试,其中电脑配置如下:

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_测试运行_03



4.测试链接

是我们熟悉的,度娘


5.测试数量

选择提取1000个HTTP代理进行测试。

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_代理服务器_04




6.测试过程

这次,我把响应速度和可用率结合在一起,测试芝麻代理对百度站点的连通性和请求延迟。

  • 有效性+延迟代码如下:

import logging
import time
from concurrent.futures import thread
import requests
thread_pool = thread.ThreadPoolExecutor(max_workers=30)
session = requests.session()


# 测试代理ip有效性核心代码
def test_proxy_usability(proxy_ip,thread_id):
    target_url = 'http://www.baidu.com'
    headers = {
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36"
    }
    proxies = {
        'http': f'http://{proxy_ip}',
        'https': f'http://{proxy_ip}'
    }
    try:
        status = "失败"
        resp = session.get(target_url,headers=headers, proxies=proxies, timeout=5)
        res = {
            "thread_id":thread_id,
            "ip":ip.replace('\n',''),
            "target_url":target_url,
            "error_info":"",
            "resp_code":resp.status_code,
            "ms":resp.elapsed.total_seconds() * 1000,
        }
        if resp.status_code == 200:
            status = "成功"
        else:
            pass
        res["status"] = status
        print(res)
    except Exception as e:
        failed_reason = "访问失败:%s" % (e)
        res = {
            "thread_id":thread_id,
            "ip":ip.replace('\n',''),
            "target_url":target_url,
            "error_info":failed_reason,
            "resp_code":"",
            "ms":"",
            "status":status
        }
        print(res)

if __name__ == '__main__':
    ips = [
        "125.78.226.82:37175",
        "123.189.96.163:12565",
        "222.90.149.59:46327",
        "59.58.209.253:60819",
        "122.232.195.108:11051",
        "182.34.34.209:51063",
        "115.213.205.160:40613",
        "117.93.187.241:39562",
        "60.19.171.147:10698",
        "182.204.178.41:30182",
        "119.41.193.136:14093",
        "123.189.102.203:12565",
        "49.64.209.99:58886",
        "121.227.34.220:52161",
    ]
    for i,ip in enumerate(ips):
        thread_pool.submit(test_proxy_usability,ip,i)
    time.sleep(30)


测试运行如下:

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_ip_05

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_HTTP_06



  • 稳定性:利用平均响应速度方差分析,我们可以发现稳定性如何较高。

计算公式如下:

S^2=1/n[(x1-x)^2+(x2-x)^2+……+(xn-x)^2]


简单来说,excel的里面的方差计算公式VAR()可以帮助我们秒计算。善用excel~


  • 带宽测试代码如下:

import logging
import time
from concurrent.futures import thread
import requests
thread_pool = thread.ThreadPoolExecutor(max_workers=30)
session = requests.session()


#测试带宽核心代码
def test_proxy_bandwidth(auth_key,ip,proxies,thread_id,source_url):
    res = {
        "thread_id":thread_id,
        "ip":ip.replace('\n',''),
        "target_url":source_url,
    }
    file_size = 10 * 1024 * 1024  # 10 MB
    start_time = time.time()
    downloaded_size = 0
    try:
        response = requests.get(source_url, proxies=proxies, stream=True, timeout=30)
        dirname = f"./{auth_key}_{ip}"
        with open(f'{dirname}', 'wb') as f:
            for chunk in response.iter_content(chunk_size=8192):
                f.write(chunk)
                downloaded_size += len(chunk)
                f.flush()
                if downloaded_size >= file_size:
                    break

        elapsed_time = time.time() - start_time
        download_speed = downloaded_size / elapsed_time / 1024   # KB/s
        update_res = {
            "down_status":1,
            "download_s":elapsed_time,
            "download_speed":int(download_speed),
            "download_size":downloaded_size,
        }
        res.update(update_res)
        print(res)

    except Exception as e:
        elapsed_time = time.time() - start_time
        download_speed = downloaded_size / elapsed_time / 1024  # MB/s
        update_res = {
            "down_status":0,
            "download_s":elapsed_time,
            "download_speed":int(download_speed),
            "download_size":downloaded_size,
        }
        res.update(update_res)
        print(res)


测试运行如下:

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_ip_07

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_HTTP_08


最后根据我们的平均下载速度,来计算带宽。

带宽的计算公式:

带宽=平均下载速度*1024*8/1000/1000


7.芝麻代理测试结果

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_ip_09



8.特点

  • 老牌,已经运营8年了,也做了很多家平台,如太阳代理,e变代理,智游代理,黑洞HTTP,智连代理,极光代理都是他们家的
  • 芝麻代理的贵似乎是业内众所周知的特点之一,等一个有缘人打下来~


9.总结

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_HTTP_10


来总结一下:

综合测试数据来看,芝麻代理的成功率还是可以的,但短板也非常明显,带宽不够高,稳定性还行,但是已经在3这个数值了。

值得注意的是,芝麻代理HTTP代理使用时间越长,费用越贵,这使用时间成本就摊在了我们用户上,说不难受是假的。

诚然,芝麻代理是HTTP中的贵族,需要我们投入较大的成本,于中小企业和个人开发者而言可能不是那么划算。

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_代理服务器_11


相对来说,同样是做HTTP代理这么久的青果网络:

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_ip_12

目前HTTP代理的使用场景,都能有对应的产品。

与芝麻代理有个明显区别,青果网络HTTP代理存活周期30分钟内人任选时段,用户的成本都是不变动的,有需要的uu可以自己去看看。

在HTTP代理资源池,还分了企业池和普通池,这样既能照顾到企业对HTTP代理质量有更高的需求,也能满足很多个人开发者的需求。

这次测试我们也可以发现,青果网络的各项测试数值,也表现得很优异,响应速度快,方差1.9稳定度高,带宽2左右比之芝麻0.74的不可谓不高,还能保持99.9%的可用率。

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_HTTP_13

称它为优秀学生代表不为过。

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_HTTP_14


希望此系列测试文章,能够帮到那些在观望HTTP代理哪家强的人。


最后的最后,芝麻代理的后台,是不是该优化了?

实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_ip_15


实操 | 芝麻代理IP测试,最新代理IP质量测试,代理IP有推荐的吗?_测试运行_16


多次重复重新登录验证,这种用户体验感可不算妙。


举报

相关推荐

0 条评论