商汤发布日日新5.0大模型
4月23日消息,商汤科技今日发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,全面对标GPT-4 Turbo。
[本文作者佚名,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]
4月23日消息,商汤科技今日发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,全面对标GPT-4 Turbo。