Reproducing Hacker News writing style fingerprinting
Hacker Newsのコメントにおけるユーザーの執筆スタイルを、単語使用頻度のベクトルとコサイン類似度を用いて識別する手法を再現。Redisの新しいベクトルセット機能を活用し、Burrows-Delta法によるスタイル検出を実装した。これにより、同一ユーザーの複数アカウントや類似した執筆スタイルを持つユーザーを特定できる。
Hacker Newsのコメントにおけるユーザーの執筆スタイルを、単語使用頻度のベクトルとコサイン類似度を用いて識別する手法を再現。Redisの新しいベクトルセット機能を活用し、Burrows-Delta法によるスタイル検出を実装した。これにより、同一ユーザーの複数アカウントや類似した執筆スタイルを持つユーザーを特定できる。