XSCT Bench 评测用例库
浏览所有评测维度和用例,查看各模型的生成结果对比
测试类别
XSCT Bench 包含以下三大测试类别,点击可查看该类别下的所有用例:
用例列表
以下是当前分类下的测试用例,点击用例名称可查看各模型在该用例上的完整评测结果:
A-DocContent
A-DocData
A-DocFormat
A-DocMultiTurn
A-DocPolish
A-DocPresentation
A-DocQA
L-OpenClawAgentOrchestration
L-OpenClawChannel
- Telegram Bot 接入
- Discord Bot 接入
- Slack App 接入
- WhatsApp Web 登录
- Signal 接入
- iMessage 接入
- Matrix 接入
- 群组中仅 @ 触发
L-OpenClawFileOps
L-OpenClawGateway
L-OpenClawPlugin
L-OpenClawSlides
L-OpenClawWeb
当前类别的评测维度
当前类别:xsct-a
点击维度名称可筛选该维度下的所有用例: