亲自下场8个月 李开复收获AI独角兽,“进军世界第一梯队”还需多久?
间隔公布亲身了局大模子创业“不只仅要做中文ChatGPT”仅仅8个月,李开复和他的AI公司迎来实质性盼望。
11月6日,李开复带队开办的AI 2.0公司零一万物正式开源宣布首款预实习大模子Yi-34B,同时公布启动下一个千亿参数模子的实习。今朝该AI大模子已开放商用申请,并在阿里云魔搭社区ModelScope首发。
《逐日经济消息》记者同时获悉,零一万物已完成由阿里云领投的10亿美元融资。今朝,零一万物估值已超10亿美元,跻身独角兽队列。这也就意味着,创业8个月,李开复再收成一家AI独角兽公司。
本年以来,天生式AI成为成本市场最大的热门和风口。海内大模子创业赛道中涌现出上百家创业公司,多个科技大厂也亲身了局。现在跟着越来越多头部企业宣布产物并延续得到融资,海内大模子鏖战也进入新的阶段。
浙江大学国际连系商学院数字经济与金融创新研究中心联席主任、研究员盘和林在接管《逐日经济消息》记者采访时暗示,大模子现在正泛起百舸争流、千帆竞渡的情况,实质上大模子的基本算法并不难,难的是通过数据进修和参数蕴蓄形成一个通用人工智能,并被用户普及承认,现阶段大模子企业要脱颖而出,应该在用户口碑中拔得头筹,大模子企业要抢占先机,推出应用要快,要早。
可处理赏罚40万字文本要进军“天下第一梯队”
据零一万物先容,此次开源宣布的Yi系列模子,包括34B和6B两个版本。在Hugging Face英文测试果真榜单Pretrained预实习开源模子排名中,Yi-34B各项机能以70.72的分数位列环球第一,果真资料表现,Hugging Face是环球最受接待的大模子、数据集开源社区,被以为是大模子规模的GitHub,在大模子英文手段测试中具有相等势力巨子性。
值得一提的是,作为国产大模子,Yi-34B更“懂”中文。比拟大模子标杆GPT-4,在CMMLU、E-Eval、Gaokao三个首要的中文指标上,Yi-34B也具有上风,能更好地满意海内市场需求。
各评测集得分:Yi模子v.s.其他开源模子 图片来历:零一万物
《逐日经济消息》记者从零一万物相识到,此次开源的Yi-34B模子,将宣布环球最长、可支持200K超长上下文窗口(context window)版本,可以处理赏罚约40万汉字超长文本输入。对比之下,OpenAI的GPT-4上下文窗口只有32K,笔墨处理赏罚量约2.5万字。
据相识,在说话模子中,上下文窗口是大模子综合运算手段的金指标之一,对付领略和天生与特定上下文相干的文本至关重要,拥有更长窗口的说话模子可以处理赏罚更富厚的常识库信息,天生更连贯、精确的文本。
另外,在文得魅择要、基于文档的问答等下流使命中,长上下文的手段施展着要害浸染,行业应用场景辽阔。在法令、财政、传媒、档案清算等诸多垂直场景里,更精确、更连贯、速率更快的长文本窗口成果,可以成为人们更靠得住的AI助理,让出产力晋升。
然而,受限于计较伟大度、数据完整度等题目,上下文窗口局限扩充从计较、内存和通讯的角度存在各类挑衅,因此大大都宣布的大型说话模子仅支持几千tokens的上下文长度。为了办理这个限定,零一万物技能团队实验了一系列优化,包罗:计较通讯重叠、序列并行、通讯压缩等。通过这些手段加强,实现了在大局限模子实习中近100倍的手段晋升,也为Yi系列模子上下文局限下一次跃升储蓄了富裕“电力”。
李开复暗示,零一万物强项进军环球第一梯队方针,从招的第一小我私人,写的第一行代码,计划的第一个模子开始,就一向抱着成为‘World's No.1’(天下第一)的初志和刻意。
“我们构成了一支有潜力对标OpenAI、Google等一线大厂的团队,经验了近半年的厚积薄发,以不变的节拍和环球齐平的研究工程手段,交出了第一张极具环球竞争力的刺眼后果单。Yi-34B可以说不负众望,一鸣惊人。”李开复暗示。
10亿级参数局限大模子已超80个“百模大战”竞争剧烈
创业8个月,现在跟着首款大模子的宣布,大模子赛道再添新的竞争力。
《逐日经济消息》记者在零一万物官网发明,零一万物猜测,AI 2.0期间将降生比移动互联网大十倍的平台机遇,将把既有的软件、行使界面和应用重写一次,改写用户的交互和进口。AI 2.0期间将降生新一批AI-first(AI为先)的应用,催生以AI为内核的应用生态,催生将来的超等App及极新的贸易模式。
这或者也是李开复亲身了局插手AI大模子创业并以最快速率推出首款产物的首要缘故起因。
本年以来,大模子赛道吸引了包罗阿里、百度、字节跳动等头部大厂和李开复、王慧文、王小川等科技大佬的存眷,环绕大模子的创业和竞争非常剧烈。按照创业邦研究中心宣布的《2023年H1 AIGC财富陈诉》,2023年上半年,海内AIGC规模的融资变乱共57起,已披露融资总额63.13亿元,涉及投资机构数66家。
到了下半年,海内大模子创业公司也进入了产物的麋集宣布和融资要害期。果真数据表现,制止2023年8月,我国已宣布的大模子已经到达156个,10亿级参数局限以上大模子超80个,“百模大战”蓄势待发。
不外,在大模子创业海潮下,许多业内人士难免担忧行业泡沫的题目,大模子创业公司澜舟科技首创人兼CEO周明在接管媒体采访时果真暗示,中国对新技能的追求和自驱手段较强,可是行业必要留意泡沫题目。“花很大的工夫实习一个欠好不赖的模子,对厂商本身是一个进修熬炼的进程,但对社会也许不必然有效。哪怕创业,也许白白挥霍了许多创业成本和投入。”周明说。
盘和林则以为,当前海内AI大模子,固然许多,但可以或许被用户承认的大模子还不多,许多大模子仅仅在测试中可以或许对标ChatGPT等海外产物,且当前海内的大模子成长也受制于算力。
“我以为现阶段大模子企业要脱颖而出,应该在用户口碑中拔得头筹,这个用户口碑的要害照旧C端用户,对用户来说,好玩和有效的对象才气普及撒播,而一旦某个大模子用户作育了行使风俗,则此大模子将成为一种新的互联网生态产物,继而得到马太效应,以是,大模子企业要抢占先机,推出应用要快,要早。”盘和林暗示。