记者 袁传石 近期,百度、步星、阿里巴巴、DeepSeek、Kimi等各大科技公司密集推出自研的大规模模型,涵盖OCR识别、多模态理解、具身智能、推理能力等多个前沿领域。这些新模型大多选择开源路径。总体而言,业界认为,中国的AI开源生态正在从“可用”走向“好用”,并处于“领先”的关键阶段。同时,国家开源生态系统的逐步扩大和完善,将加速我国人工智能领域的发展。大公司动作频繁。近期,大型车型的内销步伐明显加快。 2月2日,Stepstar发布了Step 3.5 Flash。使用建筑专家 (MoE) 的模型分散了 1.96 亿米的总参数伊洛内斯,单独激活 1100 万个代币参数。特别是代理工作中的各种情况,可以显着提高操作效率,保证推理能力。至于轻量级模型,智普于2月3日正式开放GLM-OCR。 Es un modelo pequeño con alone 900 millones de parámetros y grante marcos de inferencia convencionales como vLLM, SGLang y Ollama, lo que significa que el umbral de adopción se cutificativamente. 1月29日,百度发布PaddleOCR-VL-1.5文档分析模型。与 liviana 的独立设计一样,有 90 百万个参数,该模型使用 1 个 OmniDocBench 文档分析评估列表。在V1.5中,我们的整体性能排名全球第一,整体准确率达到94.5%。与此同时,具身智能也成为新的热点话题。 UBTECH 接收刚刚推出自主研发的“具身大脑”Thinker模型。这就是所谓的“小参数、高性能、完全开放”。它的特点是“源码”。在多模态领域,DeepSeek推出了新的OCR2模型,Dark Side of the Moon推出了Kimi K2.5模型等等。据悉,上述模型涵盖文本、图像、语音、体控、多模态融合等多个维度,将于2026年1月至2月上旬密集上线,且大部分模型将重点优化特定场景下的性能,如文档分析、工业机器人响应、智能体协作等。 “很多厂商选择在这个时候推出模型,主要是因为大安德斯国产模型经过三年的技术积累,在架构设计、训练方法、工程优化等方面已经形成了比较成熟的技术体系,具备在大型平台上生成高质量模型的能力。广州艾媒数据在接受《证券日报》记者采访时,信息咨询有限公司首席执行官张毅表示,从工业机器人到智慧办公,从金融风险管理到教育医疗,应用场景日趋清晰,后续需求正在推动模型的专业化、减重化、高效化发展。“最重要的是,我们目前正处于人工智能全球竞争的关键时期。大型国家模型不仅是科技产品,也是国家战略科技实力的重要组成部分。 “在密集推出机型的时候,中国企业正在积极争夺技术话语权和环境优势。”张毅表示。开源的主要趋势无论是智普的GLM-OCR、步星的Step 3.5 Flash、Kimi K2.5还是DeepSeek-OCR2,值得注意的是,大家都选择推出这一策略并使其开源。业界普遍认为,这一趋势预示着中国AI产业正在从“闭源竞争”走向“开源协作”。这背后有战略考量和生态逻辑。张毅认为开源可以快速验证一个模型的功能,相信可以帮助它扩大影响。随着模型在性能上变得更加相似,第一个广泛提供给开发人员和企业的模型很可能成为 fac 标准。通过开源,企业可以借助社区的力量进行压测、场景适配、漏洞修复,形成发布-反馈迭代的高效闭环。同时,开源也是构建国家人工智能生态系统的必由之路。目前,中国人工智能产业严重依赖国外基础模型和框架。目前国内开源模型阵列,以Qwen、Zhipu、Kimi为代表,DeepSeek等越来越完善,涵盖语言、视觉、语音、具身智能等多模态,初步形成从基础模型到工具链、从训练到推理的全栈能力。 “这种‘自主可控、开放协作’的模式,既保障了技术主权,又避免了重复建设,有效降低了中小企业和科研机构的创新门槛。”一位业内分析师对《证券日报》记者表示。更重要的是,蓬勃发展的开源生态系统反馈到了模型本身。特别是社区提供的评估数据、优化方案、补充工具等,成为模型不断演化的“养分”。以阿里巴巴的钱文为例。码社区Open AI Hugging Face最新数据显示,阿里钱文衍生模型数量超200个,000。全球开发者每天基于钱文开发衍生模型超过200个,涵盖机器人控制、代码生成、漫画后期制作、多语言翻译等多个方向。从集中发布到全面开源,国家大型模型开始走一条技术创新与环保共建相结合的发展道路。这不仅是中国人工智能产业成熟的重要标志,也为全球人工智能多元化发展增添新动力。在开源浪潮的推动下,更加开放、协作、高效的国家人工智能生态体系正在加速形成。
(编辑:王婉莹)