CVE-2026-41481LangChain 的 langchain-text-splitters 组件在 1.1.2 版本之前存在服务端请求伪造(SSRF)漏洞。该组件的 HTMLHeaderTextSplitter.split_text_from_url() 函数虽然对初始 URL 进行了验证,但在处理 HTTP 重定向请求时未对重定向目标进行二次校验。攻击者可利用此缺陷绕过 SSRF 防护机制,诱导服务器向内网、本地主机或云元数据端点发起请求,进而可能导致敏感信息泄露。
该漏洞的根源在于 HTMLHeaderTextSplitter.split_text_from_url() 方法的安全检查逻辑不完整。方法首先调用 validate_safe_url() 对用户提供的初始 URL 进行安全校验,以防止访问内网地址。然而,在后续的网络请求中,代码使用了 requests.get() 并默认启用了重定向跟随功能。由于程序未对重定向后的目标 URL 再次执行安全校验,攻击者可以构造一个指向恶意服务器的 URL,该服务器在响应中返回 302 重定向指令,将请求指向内网敏感资源(如 127.0.0.1 或云元数据服务)。LangChain 会自动跟随重定向获取内容并将其解析为文档对象。如果应用程序随后将这些文档内容或其衍生数据直接返回给攻击者,便构成了完整的数据泄露路径。