用 Casablanca 库重新编写一个 C++ 爬虫程序，来采集苏宁的视频-CFANZ编程社区

用 Casablanca 库重新编写一个 C++ 爬虫程序，来采集苏宁的视频_ios

昨天我们讲了一个采集苏宁易购视频的程序，有粉丝说有点复杂，那么今天我就用casablanca库重新编写一个C++爬虫程序，来采集苏宁的视频，这个可更加简单，一起来学习一下吧。

#include <iostream>
#include <string>
#include <vector>
#include <algorithm>
#include <sstream>
#include <cstdlib>
#include <fstream>
#include <boost/algorithm/string.hpp>
#include <curl/curl.h>
#include <casablanca/http/client.hpp>
#include <casablanca/http/cookies.hpp>
#include <casablanca/http/messages.hpp>
#include <casablanca/http/requests.hpp>
#include <casablanca/http/responses.hpp>
#include <casablanca/http/cookies.hpp>
#include <casablanca/http/headers.hpp>
#include <casablanca/http/status_codes.hpp>
#include <casablanca/uri.hpp>
#include <casablanca/ssl.hpp>

namespace http = casablanca::http;
namespace io = boost::iostreams;
namespace ssl = casablanca::ssl;

using casablanca::URI;

int main() {
    // 创建一个CURL上下文
    CURL *curl = curl_easy_init();
    if (!curl) {
        std::cerr << "curl_easy_init failed, exiting" << std::endl;
        return 1;
    }

    std::string video_url = "https://www.suning.com/";  // 待爬取的视频地址

    std::string proxy_host = "https://www.duoip.cn/get_proxy";  // 转发代理服务器地址
    int proxy_port = 8000;  // 转发代理服务器端口

    // 设置转发代理
    curl_easy_setopt(curl, CURLOPT_PROXY, proxy_host.c_str());
    curl_easy_setopt(curl, CURLOPT_PROXYPORT, proxy_port);

    // 设置要爬取的网站地址
    curl_easy_setopt(curl, CURLOPT_URL, video_url.c_str());

    // 设置请求方法
    curl_easy_setopt(curl, CURLOPT_CUSTOMREQUEST, "GET");

    // 设置文件流
    std::stringstream buffer;
    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, &write_callback);
    curl_easy_setopt(curl, CURLOPT_WRITEDATA, &buffer);

    // 执行请求
    CURLcode res = curl_easy_perform(curl);

    if (res != CURLE_OK) {
        std::cerr << "curl_easy_perform failed: " << curl_easy_strerror(res) << std::endl;
        return 1;
    }

    // 输出爬取到的视频
    std::cout << buffer.str();

    // 关闭CURL上下文
    curl_easy_cleanup(curl);

    return 0;
}