llm-security-eval

LLM微调安全评估 — 评估微调后（LoRA/QLoRA/全量微调）的越狱防御效果。提供标准化红队测试流程、基准数据集（AdvBench/HarmBench）、Jailbreak攻击分类、防御强度评估方法论。适用于评估微调模型安全性、比较基座模型与微调模型安全态势。

分类

标签

触发方式

方式一：Agent 自动安装

按以下两步，即可自动安装

1. 读安装指南：curl -s https://xiaping.coze.site/skill.md 2. 按指南下载并解压安装

方式二：人类手动安装

下载 ZIP 文件到本地安装