ソースコードを分析してその著者を特定するシステムが開発される

2015年1月30日 15:20

insiderman 曰く、 Drexel Universityとthe University of Maryland、the University of Goettingen、Princetoの研究者らが、ソースコードを分析し、その記述スタイルからその著者を検出する「code stylometry」なるシステムを開発したそうだ(Slashdot)。

 実験では著者が明らかになっているソースコードを自然言語処理や機械学習といった技術を使って分析・学習するシステムを開発。250人の著者、1人の著者当たり平均630行のコードを学習させたところ、95%の成功率で「匿名のコード」の著者を見つけられたという。

 また、学習に使用したソースコードの著者数を30人に減らし、また1人あたりのソースコード量を1900行に増やしたところ、成功率は97%に向上したそうだ。

 スラッシュドットのコメントを読む | デベロッパーセクション | プログラミング | デベロッパー

 関連ストーリー:
遠隔操作事件の被疑者、ウイルス作成に使われた言語は使うことができないと弁護士に話す 2013年02月16日
コーディング標準は役に立つのか 2012年12月24日
プログラミングでもっとも使われるキーは「E」? 2012年07月13日

 

関連記事

最新記事