0526.COM(官网)欢迎您

0526.COM
官方平台·app·下载·手机版！

0526.COM
这里是我们共同的家园！

0526.COM

🧘来自西藏发布时间:2024年06月16日 12:360526.COM

0526.COM

☴☡🔥

0526.COM

新民晚报讯(记者金志刚)近日，复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示，字节豆包在2024高考数学新II卷客观题正确率达到74.66%，在13家大模型中排名首位，阿里千问和GPT-4o分列二三位。而在高考数学新I卷评测排名中，字节豆包也排在前列。

评测选取2024高考数学新I卷和新II卷的14道客观题，参评“选手”涵盖GPT-4o、文心一言、阿里千问、字节豆包等主流大模型。GPT-4o是OpenAI于今年5月新推出的大语言模型，数学能力是其发布会现场着重展现的能力模块。但结果显示，部分国产大模型在本次数学评测中的成绩优于GPT-4o。在新II卷客观题测试中，字节豆包成绩排在首位，其次是阿里千问和GPT-4o。

今年5月，豆包大模型在火山引擎原动力大会上正式发布。相关数据显示，在MMLU、BBH、GSM8K、HumanEval等11个业界主流的公开评测集上，Doubao-pro-4k的总分为76.8分，优于同期测试的其他国产模型。在数学能力、语言理解能力，以及综合评测集CMMLU和CEval的评测上，豆包也有不错的表现，得分排在前三。

👭（撰稿：奚蓓珠）

本文来自网友发表，不代表本网站观点和立场，如存在侵权问题，请与本网站联系。未经本平台授权，严禁转载！

展开

打开0526.COM,阅读全文

80人支持

阅读原文阅读 1356回复 9

全部评论

默认
最新
楼主

云叶芝✞LV3六年级
2楼
如何看待国足踢进18强，你觉得国足有望进入2026年世界杯吗？🛒
2024/06/16 来自咸阳
1回复
🔀冯凡蓝LV2大学四年级
3楼
广西防城港市港口区多举措稳就业促增收📳
2024/06/16 来自泰兴
9回复
利黛彪❐LV3幼儿园
4楼
知名人士：曙光或现！中国股市在地平线重新起飞或不再是奢望🏂
2024/06/16 来自温州
3回复
邹发信LV2大学三年级
5楼
同进全球数学竞赛决赛的博士生曝比赛细节，赞“姜萍厉害”⛊
2024/06/16 来自延吉
8回复
郑苇雨♝🐈LV6大学三年级
6楼
问诊动车技能常新（工匠绝活）👹
2024/06/16 来自临河
7回复
解美红LV2大学四年级
7楼
世联赛：中国女排3-0横扫德国🆚
2024/06/16 来自安阳
赞回复

你的热评

游客

最热圈子

#广西柳州：粤桂协作为群众送上“新春就业礼”#
公冶洁翠
4
#提升文化软实力对人民城市建设的重要性何在#
国娣绿
2
#双探花61分欧文35分凯尔特人力克独行侠3-0#
齐梁罡
5
#践行企业责任典范加多宝集团荣膺“2023年度中国公益企业”
董斌善
3

内地与香港证监会拟优化基金互认安排，适度放宽客地销售比例限制
2024/06/16洪瑞宝🧐
同学们，这些支撑新质生产力的核心专业，前景广阔！
2024/06/16娄志莲⏬
新疆电力进入“亿”千瓦时代清洁能源占四成
2024/06/16胡元博🎉
深股通现身6只个股龙虎榜
2024/06/16龙星健🛹
海信连续4年入选BrandZ中国全球化品牌10强
2024/06/16宣楠美⛄
内蒙古：政策落地的过程也是人民群众受益的过程
2024/06/15奚薇朋⚀
全面加强党的纪律建设的强大思想武器
2024/06/15闻人亮力🚥
IG NIP
2024/06/15荆天冠n
乌克兰与日本签署双边安全协议
2024/06/14陈钧武l
01版要闻 - 大力培养创新人才加快建设科技强国
2024/06/14皇甫雁蝶🤮

安装应用

随时随地关注0526.COM

安全检测