8000 GitHub - LordVoldemt/Spider_XHS: 小红书爬虫数据采集,小红书全域运营解决方案
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

LordVoldemt/Spider_XHS

 
 

Repository files navigation

🎀Spider_XHS

⭐功能列表

image

✨ 专业的小红书数据采集解决方案,支持笔记爬取,保存格式为excel或者media

✨ 小红书全域运营解决方法,AI一键改写笔记(图文,视频)直接上传

🌟 功能特性

  • 多维度数据采集
    • 用户主页信息
    • 笔记详细内容
    • 智能搜索结果抓取
  • 🚀 高性能架构
    • 自动重试机制(失败自动恢复)
  • 🔒 安全稳定
    • 小红书最新API适配
    • 异常处理机制
  • 🎨 便捷管理
    • 结构化目录存储
    • 格式化输出(JSON/EXCEL/MEDIA)

🎨效果图

处理后的所有用户

image

某个用户所有的笔记

image

某个笔记具体的内容

image

保存的excel

image

🛠️ 快速开始

⛳运行环境

  • Python 3.7+
  • Node.js 18+

🎯安装依赖

pip install -r requirements.txt
npm install

🎨配置文件

配置文件在项目根目录.env文件中,将下图自己的登录cookie放入其中,在浏览器f12打开控制台,点击网络,找一个接口点开。 image

🚀运行项目

python main.py

🍥日志

日期 说明
23/08/09 - 首次提交。
23/09/13 - api更改params增加两个字段,修复图片无法下载,有些页面无法访问导致报错。
23/09/16 - 较大视频出现编码问题,修复视频编码问题,加入异常处理。
23/09/18 - 代码重构,加入失败重试。
23/09/19 - 新增下载搜索结果功能。
23/10/05 - 新增跳过已下载功能,获取更详细的笔记和用户信息。
23/10/08 - 上传代码☞Pypi,可通过pip install安装本项目。
23/10/17 - 搜索下载新增排序方式选项(1、综合排序 2、热门排序 3、最新排序)。
23/10/21 - 新增图形化界面,上传至release v2.1.0。
23/10/28 - Fix Bug 修复搜索功能出现的隐藏问题。
25/03/18 - 更新API,修复部分问题。

🧸注意事项

本项目仅供学习与交流,侵权必删

🛹额外说明

  1. 感谢star⭐!不时更新。
  2. 有问题可以加QQ(992822653)或者微信(CVZC15751076989)交流!
  3. 感谢赞助!如果此项目对您有帮助,请作者喝一杯奶茶~~ (开心一整天😊😊)
  4. thank you~~~
微信赞赏码支付宝收款码

📈 Star 趋势

Star History Chart

About

小红书爬虫数据采集,小红书全域运营解决方案

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • JavaScript 98.8%
  • Python 1.2%
0