kylearn
← 返回常用skill
研究与学习11k

huggingface-community-evals

在 Hugging Face 模型卡中添加和管理评测结果。

🔥 出自合集 huggingface/skills (10.6k stars)

它能帮你做什么

支持从 README 内容提取 eval 表格、从 Artificial Analysis API 导入分数,以及用 vLLM/lighteval 运行自定义评测。适合维护模型卡评测数据、补齐基准成绩、统一管理评估结果的场景。

怎么装它

帮我安装这个 skill: https://github.com/huggingface/skills/tree/main/skills/huggingface-community-evals

复制这句话,发给你的 Claude Code / Codex 等 AI Agent,它会自动帮你装好。

源码 / 详情:https://github.com/huggingface/skills/tree/main/skills/huggingface-community-evals

怎么用它

装好后,在 AI Agent 里直接说下面任意一句就能唤起它(点一下可复制):

往模型卡添加评测结果
提取/导入 eval 分数
用 vLLM/lighteval 跑评测
管理 benchmark 表格