着手:新浪科技开云体育(中国)官方网站
新浪科技讯 1月30日晚间音书,阿里云书记通义千问旗舰版模子Qwen2.5-Max升级发布。
Qwen2.5-Max模子是阿里云通义团队对MoE模子的最新探索铁心,预查验数据越过20万亿tokens。该模子展现出极强项的玄虚性能,在多项公开主流模子评测基准上录得高分,全面高出了当今民众最初的开源MoE模子以及最大的开源宽广模子。
据悉,当今成就者可在Qwen Chat(https://chat.qwenlm.ai/)平台免费体验模子,企业和机构也可通过阿里云百真金不怕火平台径直调用新模子API事业。
Qwen2.5-Max在学问(测试大学水平学问的MMLU-Pro)、编程(LiveCodeBench)、全面评估玄虚才气的(LiveBench)以及东说念主类偏好对王人(Arena-Hard)等主流巨擘基准测试上,展现出民众最初的模子性能。通义团队鉴识对Qwen2.5-Max的辅导(Instruct)模子版块和基座(base)模子版人性能进行了评估测试。
辅导模子是统统东说念主可径直对话体验到的模子版块,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基准测试中,Qwen2.5-Max并排Claude-3.5-Sonnet,并果真全面高出了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
基座模子响应模子裸性能,由于无法探望GPT-4o和Claude-3.5-Sonnet等闭源模子的基座模子,通义团队将Qwen2.5-Max与当今最初的开源MoE模子 DeepSeek V3、最大的开源宽广模子Llama-3.1-405B,以及雷同位列开源宽广模子前哨的Qwen2.5-72B进行了对比。在统统11项基准测试中,Qwen2.5-Max沿路高出了对比模子。
当今,Qwen2.5-Max已在阿里云百真金不怕火平台上架开云体育(中国)官方网站,模子称呼qwen-max-2025-01-25`,企业和成就者都可通过阿里云百真金不怕火调用新模子API。同期,也不错在全新的Qwen Chat平台上中使用Qwen2.5-Max,径直与模子对话,好像使用artifacts、搜索等功能。