每经AI快讯,3月4日,阶跃星辰官微宣布开源Step3.5 Flash的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。据了解,Step3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。
每日经济新闻
上一篇:阿里全面开放桌面Agent,AI从对话走向接管电脑
下一篇:AI算力需求爆发,信创ETF易方达涨1.37%