歌曲封面 未知作品

网站已运行 1 年 305 天 9 小时 11 分

Powered by Typecho & Sunny

2 online · 44 ms

歌曲封面 未知作品

网站已运行 1 年 305 天 9 小时 11 分

Powered by Typecho & Sunny

4 online · 47 ms

小野博客 小野(Hirono)博客的个人网站,主要讲述关于小野的一些陈芝麻烂谷子事。网络、生活、我的主张,也是一个自留地
Title

利用DeepSeek写一个js链接抓取工具

小野

·

📟前端日记

·

Article

明天就是除夕了,小野博客在这里祝各位网友,站长,新春快乐,阖家欢乐~~!

最近在抖音刷到了国产的DeepSeek智能ai特别火,听说都是散户养大的 ^ ^,所以打算看看能不能用它来完成一个小小的前端项目。让我们拭目以待吧。

0x01·访问DeepSeek

DeepSeek

国内可以微信扫码登录或手机号验证码登陆。网页版免费使用

0x02·给ai喂食

我这准备了一份js链接抓取的项目结构,直接发送给它吃,计划写的比较详细


1.创建一个前端项目,包含以下功能:

  • 输入url并爬取目标页面的所有js链接

    • 将js链接保存到当前目录下的txt文件中
    • 对获取的js链接进行敏感信息匹配
    • 将结果输出到页面中,需要分隔开

2.项目结构需要:

  • index.html 主页面
  • style.css 样式文件
  • js.js 主要逻辑
  • js.txt 保存js链接

3.需要使用的技术:

  • html/css构建页面
  • JavaScript 实现爬取和正则匹配
  • fetch api 获取页面内容
  • dom 操作显示

4.正则表达式需要匹配的敏感信息:

  • api密钥
  • 密码
  • 邮箱
  • 手机号
  • 身份证号

5.当前目录为空,需要创建所有文件

这里我把深思熟虑R1开启了,新模型,免费。ps:白嫖的心理在作怪。白嫖总是最好的

经过了几分钟的等待,终于完成。
补贴一个html

♾️ html 代码:
<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <title>JS链接分析工具</title>
    <link rel="stylesheet" href="style.css">
</head>
<body>
    <div class="container">
        <h1>JS链接分析工具</h1>
        <div class="input-group">
            <input type="url" id="targetUrl" placeholder="输入目标URL (需支持CORS)">
            <button onclick="startCrawl()">开始爬取</button>
            <button onclick="saveLinks()">保存链接</button>
        </div>
        <div id="resultContainer"></div>
    </div>
    <script src="js.js"></script>
</body>
</html>

测试环境下看看长什么样吧

0x03·修修补补的成果

在接下的个把小时里面,不停的修修补补,比如手机端没法分析抓取,点击也没反应。

最后改的还算满意。

0x04·评价

总体还算可以,就是需要多喂养。

再让他给完整代码的时候(这种方式循环5-6遍),容易产生css样式改变。

js抓取涉及到CORS跨域问题。我用了公共的代理地址,时好时坏的。稳定就是容易限流。

也可以自建CORS代理,利用GitHub里面的cors-anywhere项目部署到 **Vercel
**
可永久使用代理地址。

现在已有 24 次阅读,0 条评论,6 人点赞

广告

页底广告 页底广告
Comment:共0条
发表
搜 索 消 息 足 迹
你还不曾留言过..
你还不曾留下足迹..
博主 网站设置有【CDN】缓存,留言等评论内容需要12小时才能显示! 不再显示
博主