译文语言

Snyk VulnBench JavaScript 1.0：大语言模型能两次发现相同的漏洞吗？

该文介绍了Snyk VulnBench JavaScript 1.0基准测试，旨在评估大型语言模型（LLM）在JavaScript代码中重复识别相同安全漏洞的能力。研究通过对比LLM在不同测试轮次中的表现，探讨了模型在漏洞检测中的一致性和可靠性，为自动化代码安全审查提供了重要参考。

相关报道