SuperCLUE最新中文大模型测评结果出炉,全球第一梯队被海外模型牢牢占据,国产表现最好的三款模型,只能在全球第五名的位置上激烈竞争。本次测评覆盖21款国内外主流模型,测评集包括六大任务:数学推理、科学推理、代码生成、智能体(任务规划)、精确指令遵循、幻觉控制,共492题。 阅读全文

Full article body is being fetched in the background. Refresh in a moment to see the complete paragraphs. For now this page shows a summary and AI analysis.