N
N-Day-Bench
無料WinFunc | AI開発プラットフォーム | 2026年〜
★★★★☆4/5
LLM(大規模言語モデル)が実際のコードベースから真の脆弱性を発見できるかを評価するベンチマークツールです。従来の合成的なテストではなく、実際のオープンソースプロジェクトの既知の脆弱性を使用してAIのセキュリティ監査能力を測定します。開発者やセキュリティ研究者がAIツールの実用性を客観的に評価するための重要な指標を提供します。
公式サイトへ →主な機能
実コードベース評価脆弱性検出テスト客観的指標研究用データセット比較分析
メリット・デメリット
✓ メリット
- +実際の脆弱性でテスト
- +客観的な評価が可能
- +研究に有用
- +無料で利用可能
✗ デメリット
- -専門知識が必要
- -限定的な用途
- -セットアップが複雑
料金プラン
研究用
無料
- ✓ベンチマーク実行
- ✓評価指標
- ✓データセット提供
こんな人におすすめ
- 1セキュリティ研究者
- 2AI開発者
- 3コードセキュリティ担当者
最終更新: 2026-04-14