8145.COM·(中国)官方网站

8145.COM
官方平台·app·下载·手机版！

8145.COM
这里是我们共同的家园！

8145.COM

🥡来自慈溪发布时间:2024年06月16日 13:448145.COM

8145.COM

🏔🚠✖

8145.COM

新民晚报讯(记者金志刚)近日，复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示，字节豆包在2024高考数学新II卷客观题正确率达到74.66%，在13家大模型中排名首位，阿里千问和GPT-4o分列二三位。而在高考数学新I卷评测排名中，字节豆包也排在前列。

评测选取2024高考数学新I卷和新II卷的14道客观题，参评“选手”涵盖GPT-4o、文心一言、阿里千问、字节豆包等主流大模型。GPT-4o是OpenAI于今年5月新推出的大语言模型，数学能力是其发布会现场着重展现的能力模块。但结果显示，部分国产大模型在本次数学评测中的成绩优于GPT-4o。在新II卷客观题测试中，字节豆包成绩排在首位，其次是阿里千问和GPT-4o。

今年5月，豆包大模型在火山引擎原动力大会上正式发布。相关数据显示，在MMLU、BBH、GSM8K、HumanEval等11个业界主流的公开评测集上，Doubao-pro-4k的总分为76.8分，优于同期测试的其他国产模型。在数学能力、语言理解能力，以及综合评测集CMMLU和CEval的评测上，豆包也有不错的表现，得分排在前三。

⚉（撰稿：鲁奇明）

本文来自网友发表，不代表本网站观点和立场，如存在侵权问题，请与本网站联系。未经本平台授权，严禁转载！

展开

打开8145.COM,阅读全文

8人支持

阅读原文阅读 7534回复 4

全部评论

默认
最新
楼主

路翔顺🌄LV2六年级
2楼
新春走基层｜了不起的小镇：小汉服走俏春节大市场🥑
2024/06/16 来自莆田
4回复
👯朱惠家LV1大学四年级
3楼
异地组网方案如何实现医疗设备如何远程维护？💒
2024/06/16 来自三门峡
2回复
戴蝶超🍦LV2幼儿园
4楼
历尽沧桑，归来还是少年⛽
2024/06/16 来自焦作
7回复
庄环彩LV1大学三年级
5楼
多银行取超5w需预约⏯
2024/06/16 来自大庆
0回复
别秀馨📮🕔LV7大学三年级
6楼
记者：足协征集国足18强赛主场举办地，工体几乎又要无缘国足主场⚖
2024/06/16 来自双鸭山
4回复
闻人菊平LV2大学四年级
7楼
巴塞尔艺术展上的东方作品 | FT中文网| FT中文网🌮
2024/06/16 来自宁德
赞回复

你的热评

游客

最热圈子

#【长三角日报】安徽这位新任副省长，已任省公安厅党委书记#
邓枝羽
6
#机构称当前指数安全边际较高，新质生产力或为投资主线#
郑娥茂
2
#国务院联防联控机制：返乡防疫盲目加码就是“懒政”#
孙玲璧
4
#夜读丨家乡的栀子花开了
申庆鸣
8

他们风头正盛他们即将告别他们渴望一球成名
2024/06/16古弘亨❣
首个沪喀青少年艺术基地成立
2024/06/16堵爽婕😣
在注意力碎片化的时代，流量为王，还是产品为王？
2024/06/16潘菁馥✫
大和：予周大福“买入”评级全年净利润低于市场预期
2024/06/16聂磊瑾♦
【五一小长假农家也快乐】晋州总十庄大集
2024/06/16路固竹🌿
我国第四批预备航天员选拔工作顺利完成港澳地区各有1人入选
2024/06/15甄瑗莉⛅
欧盟对华电动汽车加征关税被多方反对！中方：将采取一切措施捍卫中企合法权益
2024/06/15耿灵翰❣
女子骑车被急流冲走遗体被找到
2024/06/15左山梵q
香港理工大学研发太空仪器助力嫦娥六号月背采样
2024/06/14鲍彪绍f
红树林基金会（MCF）温家怡：善因营销可有效促进公益品牌建设
2024/06/14荆阅弘👆

安装应用

随时随地关注8145.COM

安全检测