← 返回常用skill
研究与学习★ 11k
huggingface-community-evals
在 Hugging Face 模型卡中添加和管理评测结果。
🔥 出自合集 huggingface/skills (10.6k stars)
它能帮你做什么
支持从 README 内容提取 eval 表格、从 Artificial Analysis API 导入分数,以及用 vLLM/lighteval 运行自定义评测。适合维护模型卡评测数据、补齐基准成绩、统一管理评估结果的场景。
怎么装它
帮我安装这个 skill: https://github.com/huggingface/skills/tree/main/skills/huggingface-community-evals复制这句话,发给你的 Claude Code / Codex 等 AI Agent,它会自动帮你装好。
源码 / 详情:https://github.com/huggingface/skills/tree/main/skills/huggingface-community-evals
怎么用它
装好后,在 AI Agent 里直接说下面任意一句就能唤起它(点一下可复制):
「往模型卡添加评测结果」
「提取/导入 eval 分数」
「用 vLLM/lighteval 跑评测」
「管理 benchmark 表格」