AI大模型持续迭代，关注终端智能进展

ralf 2024-03-20 10:47:38

上海证券吴婷婷

周观点

　　海外科技巨头持续推动大模型迭代。（1）xAI：3月12日，马斯克宣布将开源大模型Grok，Grok-1开发时长约四个月，上下文长度为8192，训练数据截至2023年第三季度；在GSM8K、HumanEval和MMLU等一系列基准测试中，Grok-1的表现超过了Llama-2-70B和GPT-3.5。（2）OpenAI：据OpenAI CTO米拉·穆拉蒂透露，Sora将于今年晚些时候正式发布，计划加入音频功能并允许用户编辑Sora生成的视频内容。此外，一款号称是GPT-4.5Turbo的模型同时出现在了Bing、谷歌、DuckDuck Go的搜索结果里，根据预告信息，GPT-4.5Turbo的上下文窗口相较GPT-4-Turbo翻了一倍，达到256k（约20万个单词），知识也更新到了2024年6月。（3）Meta：3月13日，Meta公布了训练Llama3的H100集群细节—两个24k GPU集群（共49152个H100）。Meta规划到2024年底将拥有35万个H100GPU，未来算力储备将达到60万个H100。（4）苹果：3月15日，苹果发表《MM1:Methods,Analysis&Insights from Multimodal LLMPre-training》，并公布MM1多模态大模型，其参数最高可达300亿，由密集模型和混合专家（MoE）变体组成，图像识别和推理能力较强，在预训练指标中实现SOTA，在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。此外，苹果收购了加拿大基于视觉技术的AI初创公司DarwinAI，并将其并入AI部门。

　　OpenAI机器人诞生，终端智能化进展不断。（1）OpenAI机器人：3月13日，Figure发布了第一个OpenAI大模型加持的机器人Figure01，充分展示了和人类以及环境交互的能力，它会说会看，还能给人类递食物、捡垃圾、收拾碗筷，还能够推理，自行识别、计划和执行有用的任务。由OpenAI提供视觉推理和语言理解，Figure01的神经网络，会提供快速、低等级、灵巧的机器人动作。（2）AI PC：根据Windows Central，微软将于3月21日发布新款Surface Pro和SurfaceLaptop，其中Intel版本搭载号称“AI CPU”的全新Intel Core Ultra。两款新品将搭载“AI Explorer”功能，可在任何应用程序上运作，用户可以使用自然语言搜索文档、网页、图像和聊天。AMD也将于3月21日在北京召开“AMD AI PC创新峰会”，苏姿丰将携手产业链重量级嘉宾们，展示AMD AI科技的实力。我们认为，AI大模型持续迭代，不仅带动底层算力基础设施的变化，智能终端作为“人工智能+”的重要载体，AI大模型的发展必将推动智能终端人机交互模式的升级变革，生成式AI赋能之下，人形机器人、AI手机、AI PC等终端的商业化前景广阔。

暂无

<<没有了

谷歌发布开源模型Gemma，端侧生成式AI或现增量需求>>

AI大模型持续迭代，关注终端智能进展

您可能还会对下面的文章感兴趣：

相关文章