🍆😄☊
0731.
0731平台网
0736zpw
07362
0730ib07cn
07361
073w.
0735aj
0731信息网
07385
新民晚报讯(记者金志刚)近日,复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。而在高考数学新I卷评测排名中,字节豆包也排在前列。
评测选取2024高考数学新I卷和新II卷的14道客观题,参评“选手”涵盖GPT-4o、文心一言、阿里千问、字节豆包等主流大模型。GPT-4o是OpenAI于今年5月新推出的大语言模型,数学能力是其发布会现场着重展现的能力模块。但结果显示,部分国产大模型在本次数学评测中的成绩优于GPT-4o。在新II卷客观题测试中,字节豆包成绩排在首位,其次是阿里千问和GPT-4o。
今年5月,豆包大模型在火山引擎原动力大会上正式发布。相关数据显示,在MMLU、BBH、GSM8K、HumanEval等11个业界主流的公开评测集上,Doubao-pro-4k的总分为76.8分,优于同期测试的其他国产模型。在数学能力、语言理解能力,以及综合评测集CMMLU和CEval的评测上,豆包也有不错的表现,得分排在前三。
✒(撰稿:从裕妹)中信消费金融被罚120万元:综合利率等产品信息披露不规范等
2024/06/16聂建凝🚭
蔚来总裁秦力洪谈欧盟加征关税:是当地新能源汽车发展相对滞后的表现
2024/06/16寇晴彪🐈
全国妇幼健康职业技能竞赛决赛成功举办
2024/06/16管菊仪📢
刘晓宁:以高水平制度型开放塑造一流营商环境
2024/06/16欧阳才晴➦
经验交流 | 50多年过去了,不变的仍是那一杯咖啡| 50多年过去了,不变的仍是那一杯咖啡
2024/06/16纪承露🏌
四川银行股份有限公司副行长杨朝晖接受审查调查
2024/06/15沈枫敬🧜
秀我中国|天水呱呱与伏羲庙:味觉与历史的交融
2024/06/15东方成钧🙈
中信证券:科技巨头加大投入 机器人行业发展全面加速
2024/06/15太叔超顺n
杭州行散记(四)
2024/06/14印光琰b
香港放宽新冠疫苗接种年龄限制 明年将采购新一代疫苗
2024/06/14封星和🎏