CVE-2026-23516CVAT是一款开源的交互式视频和图像标注工具,广泛应用于计算机视觉领域的数据标注工作。该工具在2.2.0至2.54.0版本中存在严重的存储型跨站脚本(XSS)漏洞。攻击者通过在CVAT任务或项目中精心构造恶意标签,或上传包含恶意代码的SVG图像文件,可以在受害用户的浏览器会话中执行任意JavaScript代码。由于CVAT通常部署在企业内部网络且承载大量敏感的训练数据集和标注成果,攻击成功后将导致攻击者获取受害用户的所有访问权限,包括查看、下载、修改项目数据等操作。此漏洞的利用门槛相对较低,只需攻击者拥有创建标签的低级权限即可发起攻击,但需要一定的用户交互(如编辑标签或查看特定形状)才能触发。
该漏洞属于存储型XSS(Stored Cross-Site Scripting)漏洞,攻击向量主要包括三个入口点:
1. **恶意标签注入**:攻击者在创建或编辑CVAT任务/项目的标签时,嵌入恶意JavaScript代码。由于系统未对标签名称进行充分的输入过滤和输出编码,当其他用户编辑该标签或查看引用该标签的标注形状时,恶意代码会在其浏览器上下文中执行。
2. **SVG图像注入**:CVAT支持骨架标注功能,允许用户上传SVG格式的图像来配置骨架模板。攻击者可以利用SVG文件的特殊结构(如<script>标签、事件处理器onload/onerror等)嵌入JavaScript代码。当受害用户上传或预览该SVG文件时,恶意代码被执行。
3. **利用后果**:攻击者成功执行JavaScript后,可以窃取用户会话Cookie、读取页面DOM内容、模拟用户操作、向外部服务器传输敏感数据,甚至在特定条件下进一步横向移动获取更多权限。
漏洞根源在于CVAT前端对用户输入的HTML/SVG内容缺乏严格的sanitization(消毒)处理,以及后端API未对输出内容进行充分的安全编码。