2026 年 4 月 28 日公開・基準日 2026-04-28

コードレビュー AI ベンチ：同一 PR を 5 ツールに渡した結果

コードレビューを AI に任せるのは「動けばよい」というわけではなく、「見てほしい部分だけ見て、見逆しない」ツール選びが重要。同一 PR を 5 ツールに渡し、指摘の質を並べたベンチを公開します。

ベンチ条件

※ 1回のケースしかやっていないため参考値。チーム・言語ごとにベンチし直しを推奨。

Cline（BYOK Claude）は検出数 4/4 だが、誤检出も 3 と出ている。「見つける」以上に「見逸さず」「誤检出しない」両者のバランスが重要。ノイズが多いツールはチームを疲させる。

Cursor は結果だけでなく「ファイル間の文脈」まで読み込んでレビューしてくれるため、「ここを修正したら他も壊れる」というたぐい付きも可能。Web チャットだけではやりにくい「複数ファイルをまたぐ PR」のレビュー品質は、IDE 統合型が明らかに上。

コードレビュー主務は Cursor + Claude もしくは Web の Claude。Copilot は提言品質が高い代わりに見逃しが多いため、シニアの Web チェックとセットで使うのが現実解。

※ ベンチは 1 ケースの参考値。チームコードベースと言語に依存して結果は変わります。