N

N-Day-Bench

無料

WinFunc | AI開発プラットフォーム | 2026年〜

★★★★4/5

LLM(大規模言語モデル)が実際のコードベースから真の脆弱性を発見できるかを評価するベンチマークツールです。従来の合成的なテストではなく、実際のオープンソースプロジェクトの既知の脆弱性を使用してAIのセキュリティ監査能力を測定します。開発者やセキュリティ研究者がAIツールの実用性を客観的に評価するための重要な指標を提供します。

公式サイトへ →

主な機能

実コードベース評価脆弱性検出テスト客観的指標研究用データセット比較分析

メリット・デメリット

メリット

  • +実際の脆弱性でテスト
  • +客観的な評価が可能
  • +研究に有用
  • +無料で利用可能

デメリット

  • -専門知識が必要
  • -限定的な用途
  • -セットアップが複雑

料金プラン

研究用

無料

  • ベンチマーク実行
  • 評価指標
  • データセット提供

こんな人におすすめ

  • 1セキュリティ研究者
  • 2AI開発者
  • 3コードセキュリティ担当者

最終更新: 2026-04-14