AI大模型持续迭代,关注终端智能进展
上海证券 吴婷婷
周观点
海外科技巨头持续推动大模型迭代。(1)xAI:3月12日,马斯克宣布将开源大模型Grok,Grok-1开发时长约四个月,上下文长度为8192,训练数据截至2023年第三季度;在GSM8K、HumanEval和MMLU等一系列基准测试中,Grok-1的表现超过了Llama-2-70B和GPT-3.5。(2)OpenAI:据OpenAI CTO米拉·穆拉蒂透露,Sora将于今年晚些时候正式发布,计划加入音频功能并允许用户编辑Sora生成的视频内容。此外,一款号称是GPT-4.5Turbo的模型同时出现在了Bing、谷歌、DuckDuck Go的搜索结果里,根据预告信息,GPT-4.5Turbo的上下文窗口相较GPT-4-Turbo翻了一倍,达到256k(约20万个单词),知识也更新到了2024年6月。(3)Meta:3月13日,Meta公布了训练Llama3的H100集群细节—两个24k GPU集群(共49152个H100)。Meta规划到2024年底将拥有35万个H100GPU,未来算力储备将达到60万个H100。(4)苹果:3月15日,苹果发表《MM1:Methods,Analysis&Insights from Multimodal LLMPre-training》,并公布MM1多模态大模型,其参数最高可达300亿,由密集模型和混合专家(MoE)变体组成,图像识别和推理能力较强,在预训练指标中实现SOTA,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。此外,苹果收购了加拿大基于视觉技术的AI初创公司DarwinAI,并将其并入AI部门。
OpenAI机器人诞生,终端智能化进展不断。(1)OpenAI机器人:3月13日,Figure发布了第一个OpenAI大模型加持的机器人Figure01,充分展示了和人类以及环境交互的能力,它会说会看,还能给人类递食物、捡垃圾、收拾碗筷,还能够推理,自行识别、计划和执行有用的任务。由OpenAI提供视觉推理和语言理解,Figure01的神经网络,会提供快速、低等级、灵巧的机器人动作。(2)AI PC:根据Windows Central,微软将于3月21日发布新款Surface Pro和SurfaceLaptop,其中Intel版本搭载号称“AI CPU”的全新Intel Core Ultra。两款新品将搭载“AI Explorer”功能,可在任何应用程序上运作,用户可以使用自然语言搜索文档、网页、图像和聊天。AMD也将于3月21日在北京召开“AMD AI PC创新峰会”,苏姿丰将携手产业链重量级嘉宾们,展示AMD AI科技的实力。我们认为,AI大模型持续迭代,不仅带动底层算力基础设施的变化,智能终端作为“人工智能+”的重要载体,AI大模型的发展必将推动智能终端人机交互模式的升级变革,生成式AI赋能之下,人形机器人、AI手机、AI PC等终端的商业化前景广阔。