研究与学习★ 11k

huggingface-community-evals

在 Hugging Face 模型卡中添加和管理评测结果。

🔥 出自合集 huggingface/skills (10.6k stars)

它能帮你做什么

支持从 README 内容提取 eval 表格、从 Artificial Analysis API 导入分数，以及用 vLLM/lighteval 运行自定义评测。适合维护模型卡评测数据、补齐基准成绩、统一管理评估结果的场景。

帮我安装这个 skill: https://github.com/huggingface/skills/tree/main/skills/huggingface-community-evals

复制这句话，发给你的 Claude Code / Codex 等 AI Agent，它会自动帮你装好。

装好后，在 AI Agent 里直接说下面任意一句就能唤起它（点一下可复制）：

「往模型卡添加评测结果」

「提取/导入 eval 分数」

「用 vLLM/lighteval 跑评测」

「管理 benchmark 表格」