10月15日深夜,零一万物的yi-lightning大模型在lmsys盲测竞技场的投票数超过一万次,拿到了这个国际权威测试榜单的入场券,“出来的结果是,我们排在全球第六”,10月16日上午,零一万物ceo李开复向媒体宣布时一字一顿。为了强调,他还补充,“我们和马斯克(特斯拉ceo)的xai grok打平,并列第六,按公司算零一万物排在全球第四名”。
当天,李开复还向媒体公布并演示了to b战略下的行业应用产品ai 2.0数字人,这一产品聚焦零售和电商等场景。“to b就做国内,做有利润的尊龙ag旗舰厅官网的解决方案。”李开复目标明确,面对国内c端(用户)市场,零一万物则会非常谨慎,“先不推出中国本土新的to c的应用”。
训练成本是对手的1%
“任何一个新的模型要有一万次投票才会进入这个榜单,昨天(10月15日)晚上,yi-lightning模型在lmsys上终于达到了一万次以上的投票。”李开复邀请媒体体验lmsys这个大模型擂台。
作为一个公益项目,lmsys被认为是“大模型最强盲测”,援引这一榜单的科技大佬不止open ai的ceo山姆·奥特曼和谷歌首席科学家杰夫·迪恩。
根据李开复公布的总榜单,零一万物的yi-lightning排在open ai、google和xai的大模型之后,全球排名第六。具体到分榜,在中文分榜,yi-lightning与o1-mini等模型并列排名世界第二;在多轮对话分榜,排名第三;数学、代码分榜上,yi-lightning分获第三、第四名;艰难提问、长提问榜,yi-lightning都取得第四名。
据了解,yi-lightning是零一万物开发的yi系列大语言模型,支持上下文16k,是零一万物最新高性能模型。根据内部评测数据,在8xh100算力基础下,以同样的任务规模进行测试,yi-lightning的首包(从接收到任务请求到系统开始输出响应结果之间的时间)时间是yi-large的一半,最高生成速度提升近四成。
李开复介绍时,则向媒体重复强调了成本。
“我们知道xai在训练grok时是几万张的gpu(图形处理器),现在囤了10万张gpu。我们这次预训练只用2000张gpu训练一个半月,花了300多万美元,做出来的预训练模型跟grok打平,却只花了它的1%或2%的成本。”李开复表示满意。
他也再次重申,“零一万物绝不放弃预训练。做好预训练是一个技术活,要非常多有才华的人在一起慢工出细活。如果一个公司有幸拥有懂芯片的、懂推理的、懂基础架构的、懂模型的,有很多的做算法的人才能跨领域合作,我相信中国绝对可以做出世界排名前十的预训练通用模型”。
把时间差保持在6个月
“但做这件事的成本比较高,以后可能做预训练的大模型公司会越来越少。”李开复话锋一转,“据我所知,大模型‘六小虎’(包括零一万物、百川智能等六家独立大模型初创公司)的融资额都是够的,我们做一次300万美元,这个钱头部公司也付得起。”
还是围绕着榜单做对比。gpt-4o是open ai在5月14日推出的大模型,在最新的lmsys总榜中,排在yi-lightning之后。“我们在10月把gpt-4o打败了,所以零一万物和美国顶尖模型的时间差只有5个月。”李开复说。
时间差是个老话题,从2023年初国内大模型扎堆上线,被一个又一个大佬回答过。这个问题重要与否见仁见智。不论得到的时间是多少,都证明了一点——差距依然存在。
“缩短时间差非常困难,毕竟人家10万张gpu,我们2000张。能达到这个效果是因为团队优秀、再加上研发有特色,用这套方法把时间差保持在6个月左右,已经是很好的结果了。如果要破局,可能需要一个前所未有的算法才有机会。”李开复同时告诉媒体,“千万不要认为落后6个月是很羞耻的事情,如果用类似零一万物的打法,我认为可能不只我们一家能把时间差控制在6个月,但难度不低。”
不参与价格战
另一个层面的控制体现在价格上。目前,yi-lightning已在yi大模型开放平台上线,0.99元/100万tokens。
一般来说,国内大模型企业普遍用1000tokens定价。以科技大厂阿里云为例,尊龙凯时最新官网列举的通义千问系列大模型qwenturbo相对较低,营销活动后的输入价格是0.0003元/1000tokens、输出价格0.0006元/1000tokens,即分别是0.3元/100万tokens、0.6元/100万tokens。
“这个定价确实具有显著优势,在竞争激烈的ai市场中,价格优势往往能成为吸引用户的关键因素。”北京市社会科学院副研究员王鹏向北京商报记者表示。
在和媒体沟通时,李开复三次提到这个价格,他承认这是白菜价,但也直言“零一万物还是有利润空间的,不参与价格战”。
除了性能、价格,零一万物对市场也有自己的坚持。
当天零一万物推出to b新产品ai 2.0尊龙ag旗舰厅官网的解决方案,把yi lightning实践于具体行业尊龙ag旗舰厅官网的解决方案。基于以yi lightning模型为代表的yi模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座。
在回答to b、to c选择的问题时,李开复告诉媒体,“一个大模型公司同时做to b、to c是很辛苦的,需要多元化的管理方式。选择在国内做to b,是因为我们找到了一些破局的空间,比如用数字人来做零售、餐饮等,能做一个完整的尊龙ag旗舰厅官网的解决方案。我觉得这样的to b只能在中国做,to b就做有利润的尊龙ag旗舰厅官网的解决方案,而不只是卖模型,不只是做项目制”。
对于to c,零一万物的主要布局在海外。在他看来,流量成本是大模型to c的很大问题,“在这样的挑战环境里我们会非常谨慎,先不推出中国本土新的to c的应用,已有的产品还会继续维护”。
零一万物的思路适合整个大模型行业吗?“c端用户没有很强的付费需求和意愿。想依靠他们来实现盈利,短期来看是不切实际的。”瑞达恒研究院经理王清霖告诉北京商报记者,“b端市场为了提高效率、跟上时代步伐、吸引投资人的注意力,可能有一些是相对刚需的购买意愿。如真的能够切入某一类或者某一个领域,了解他们的需求,是有可能抢占市场先机的。”
在美国,waymo 是特斯拉 robotaxi 技术上的劲敌,uber 是其服务上的对手,那么中国市场,谁才是 robotaxi 的竞争者?
马斯克称:“我们很可能会失去在巴西的所有收入,但原则比利润更重要。”有声明显示,如果x未能遵守封锁某些账号的裁决,公司将面临每天10万雷亚尔(约14.3万元)罚款。
马斯克认为,未来人形机器人的数量可能会超过人类,可能达到100亿至200亿个。网友:没想到擎天柱也要打工了。