全球科技大厂“混战”AI大模型

2023-07-27 09:28:19

最近几个月,全球AI大模型的激战程度可以用“神仙打架”来形容。


目前,中国和美国研发的大模型数量占全球总数的80%以上。在美国,以OpenAI、Anthropic等初创企业和以微软、Google为代表的科技巨头带领着美国在AI大模型的道路上蒙眼狂奔,最大参数已卷到5620亿。在中国,10亿级参数规模以上大模型已超80个,大模型产业将进入“百模大战”时代。


01

AI大模型的“战火”再次点燃


脸书母公司Meta表示,将发布其开源大模型LLaMA的商用版本,为初创企业和其他企业提供了一个强大的免费选择,以取代OpenAI和谷歌出售的昂贵的专有模型。


让像Llama这样复杂的模型广泛地供企业免费使用,这意味着,可能会颠覆OpenAI等公司在新生的人工智能软件市场上建立起来的早期主导地位。


与此同时,Meta也与高通宣布,Llama 2将能够在高通芯片上运行。这样一来,市场上英伟达、AMD处理器对AI产业的垄断也将被打破。


一位软件开发平台的CEO表示:商业版Llama可能会改变这种局面。我们公司80%以上的项目都在使用OpenAI的模型。“开源模式的任何渐进式改进都在蚕食闭源模式的市场份额,因为你可以以更低的成本运行它们,而且依赖性更小,”他补充说。


此外,早前对ChatGPT稍显克制态度的苹果,也被曝内部测试“苹果GPT”。


美东时间7月19日周三,有媒体爆出,苹果在开发自己的生成式AI工具,去年就创建了打造大语言模型的自有框架,名为“Ajax”,它旨在统一苹果的机器学习开发。借助Ajax,苹果开发了一种类似ChatGPT的聊天工具人服务,被内部工程师称为“苹果GPT”。


资料显示,苹果的大语言模型基础框架叫做“Ajax”,是基于谷歌JAX机器学习框架构建而来,所以这个框架也放在谷歌云上,用来创造苹果自己的大语言模型和聊天机器人。Ajax是在去年做出来的,目的是为了整合苹果在机器学习领域的进展。


据报道,借着自家的大语言模型,苹果内部有一个小型工程师团队在去年底开发了一款聊天机器人。最初,苹果公司以安全隐患为由叫停了这个项目,但之后又恢复了更大规模的内部使用。现在内部员工要使用该系统必须经过特殊的审批,同时还有一个非常重要的规矩:该机器人生成的任何东西,都不能用来开发面向客户的功能。


另外还有知情人士透露,苹果的AI、软件工程和云服务团队,目前正在展开多项跨部门的AI提案合作,这也将会是未来苹果AI功能的基础。这名知情人士相信苹果将会在明年公布一项与AI有关的重大声明。


02

中国企业逐鹿AI大模型


近年来,中国AI大模型产业化发展加速,百度、阿里、华为、腾讯、字节跳动等巨头厂商先后进行战略布局,陆续发布自己的大语言模型产品。此外,许多科技企业、人工智能企业积极试水整合大模型能力,提升自身产品功能。以生成式语言模型为代表的大模型发展,基本宣告了AI走上了一个重工业时代。


在监管层面,近日国家网信办联合国家发改委、教育部、科技部等七部门公布《生成式人工智能服务管理暂行办法》,自8月15日起施行。其中提出,鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新,平等互利开展国际交流与合作,参与生成式人工智能相关国际规则制定。总体体现了意在促进人工智能产业发展创新的“呵护式”监管思路。


可以展望,AI大模型及下游应用爆发,将推动数字基础设施建设加快,芯片、服务器、数据中心、先进封装、算力租赁等领域迎来利好。


  • AI芯片:在政策与需求的双轮驱动下,中国AI芯片厂商正在奋起直追,尤其是在ASIC(专用集成电路)路线上加大投入。目前,国内已经涌现出寒武纪、华为昇腾、海光信息、燧原科技等优秀AI芯片厂商,AI算力性能显著提升,未来有望实现超预期发展。


  • 服务器:AI大模型训练和推理运算所用的GPU服务器功率密度将大幅提升。相比自然风冷,液冷具备明显优势。在需求推动下,浪潮信息、中兴通讯等服务器厂商大力布局液冷服务器产品,产业化进程有望加速。


  • 先进封装:AI算力需求将推动先进封装技术与数据中心建设进一步发展。目前,国内先进封装相关厂商包括通富微电、长电科技、甬矽电子、华天科技等。


来源:国际电子商情微信公众号