中文通用大模型基准(SuperCLUE) – 针对中文可用的通用大模型的测评基准

SuperCLUE 能看出什么问题

▫️这些模型不同任务的效果情况
▫️相较于国际代表性模型做到了何种程度
▫️这些模型与人类的效果对比如何

📄让我们一起恭喜「人类」,暂时还没有模型可以超越之!

地址:https://github.com/CLUEbenchmark/SuperCLUE

圈主 管理员

热门评论
:
该帖子评论已关闭
图片审查中...
编辑答案: 我的回答: 最多上传一张图片和一个附件
x
x
个人中心
今日签到
有新私信 私信列表
搜索