N-Day-Bench

無料

WinFunc | AI開発プラットフォーム | 2026年〜

★★★★☆4/5

LLM（大規模言語モデル）が実際のコードベースから真の脆弱性を発見できるかを評価するベンチマークツールです。従来の合成的なテストではなく、実際のオープンソースプロジェクトの既知の脆弱性を使用してAIのセキュリティ監査能力を測定します。開発者やセキュリティ研究者がAIツールの実用性を客観的に評価するための重要な指標を提供します。

公式サイトへ →

主な機能

実コードベース評価脆弱性検出テスト客観的指標研究用データセット比較分析

メリット・デメリット

✓ メリット

+実際の脆弱性でテスト
+客観的な評価が可能
+研究に有用
+無料で利用可能

✗ デメリット

-専門知識が必要
-限定的な用途
-セットアップが複雑

料金プラン

研究用

無料

✓ベンチマーク実行
✓評価指標
✓データセット提供

こんな人におすすめ

1セキュリティ研究者
2AI開発者
3コードセキュリティ担当者

最終更新: 2026-04-14