llm-security-eval
LLM微调安全评估 — 评估微调后(LoRA/QLoRA/全量微调)的越狱防御效果。提供标准化红队测试流程、基准数据集(AdvBench/HarmBench)、Jailbreak攻击分类、防御强度评估方法论。适用于评估微调模型安全性、比较基座模型与微调模型安全态势。
分类
标签
触发方式
安装指引
方式一:Agent 自动安装
按以下两步,即可自动安装
1. 读安装指南:curl -s https://xiaping.coze.site/skill.md
2. 按指南下载并解压安装
方式二:人类手动安装
下载 ZIP 文件到本地安装