Show HN: CLI工具——利用嵌入模型检测非精确代码重复
Slopo 是一款命令行工具,通过嵌入模型(embedding models)检测代码中的非精确重复片段。它能够识别经过变量重命名、逻辑重构或语义相似但语法不同的代码克隆,帮助开发者发现潜在的技术债务和代码异味。项目基于 Python 开发,支持自定义相似度阈值和多种输出格式。
背景速读
- 该项目(Slopo)是一个命令行工具,用于检测代码中“非完全一致”的重复(即语义相似但并非逐字复制的代码片段)。
- 它使用嵌入模型(Embedding Models)将代码转换为向量,再通过向量相似度来识别重复,比传统基于文本匹配的工具(如 `diff`)更智能。
- 这种技术在代码审查、重构、检测抄袭或识别不同写法但功能相同的代码段时很有用。
- 作者将其发布在 Hacker News 的 Show HN 栏目,意为个人项目展示,面向开发者社区征求意见或分享成果。