ModaGPT |
简介 |
排行榜 |
提交模型 |
提问 |
AgentBench是第一个系统性的基准测试,用于评估LLM作为智能体在各种真实世界挑战和8个不同环境中的表现。
Models |
微信扫一扫
ModaGPT |
简介 |
排行榜 |
提交模型 |
提问 |
AgentBench是第一个系统性的基准测试,用于评估LLM作为智能体在各种真实世界挑战和8个不同环境中的表现。
Models |
相关推荐