(网经社讯)5月8日,在苏州召开的2026移动云大会主论坛上,中国移动正式发布移动模型服务平台MoMA,该平台接入超300款业界主流AI模型,模型丰富度处于行业领先水平,首创Token集约化运营模式,致力于推动AI技术像水和电一样“随时可得、随处可用”。
据网经社AI台(AI.100EC.CN)获悉,MoMA平台构建了“一次接入、智能优选、普惠可用、安全可信”的一站式模型服务体系,核心目标是降低AI应用门槛,让不同行业、不同规模的用户都能便捷调用优质模型资源。平台目前已接入中国移动自研“九天”基座大模型,以及DeepSeek、通义千问、豆包、Kimi、GLM等业界优质模型,覆盖文本生成、语音处理、多模态理解等多项核心能力,可满足政务、金融、工业、医疗、教育等多领域的多样化应用需求。
智能调度与成本优化是MoMA平台的突出优势。平台创新推出智能路由引擎,能够自动分析用户需求,灵活切换“成本优先”“效果优先”“均衡优先”三种策略,为用户动态匹配最适合的模型;当模型出现超时、限流或故障时,可实现秒级自动切换,确保业务连续不中断。同时,平台基于国产算力部署自研推理引擎,结合智能路由对长尾模型资源的调度,搭配智能缓存、上下文复用等技术,实现单位Token成本压降约30%,资源占用率降低50%以上,为用户在业务效果与算力成本之间找到最优平衡。
安全可信是MoMA平台的核心支撑之一。针对政务、金融等数据安全要求较高的场景,平台推出“机密模型”服务,将模型部署在机密容器中,依托硬件隔离技术实现计算过程的数据“可用不可见”,覆盖从芯片到应用的全链路机密计算,为敏感场景的AI应用提供可靠安全保障。此外,平台围绕Token全生命周期,构建了完整的运营闭环体系,实现实时精准流式计费,计费端到端时延不超过1分钟,做到“即用即付”,同时搭建专属风控机制,确保Token计费全流程可追溯、可审计、可闭环,杜绝资源挤占、费用超支等问题。
中国移动相关负责人在大会上表示,公司已将通信服务、算力服务、智能服务明确为三大主业,此次MoMA平台的发布,是中国移动加速从通信运营企业向世界一流科技服务企业提能升级的重要举措。移动云总经理孙少陵指出,人工智能发展呈现普惠、多元、信任三大核心特征,MoMA平台作为AI原生时代的核心Token发生器,将依托中国移动通信网、算力网、智能网的综合优势,构建“网络连接算力,算力生产Token,Token提供动能”的价值链,释放Token核心价值。
据了解,MoMA平台目前已形成覆盖模型接入、智能调度、成本优化、安全保障的完整技术体系,日均处理请求量突破亿级,已支持多个领域的智能化转型。业内人士分析,中国移动凭借庞大的算力资源、广泛的网络覆盖以及超300款模型的整合能力,推出MoMA平台将进一步推动AI技术的普惠化、规模化应用,加剧人工智能服务领域的竞争,同时也将带动上下游产业链协同发展,为培育新质生产力提供有力支撑。
此次大会上,中国移动还同步启动算力新动能行动计划,推进AIDC能力跃升,开放万亿级Token服务体验包,与MoMA平台形成协同,构建从算力底座、模型平台到应用落地的完整服务体系。截至发稿,MoMA平台的模型接入数量仍在持续扩充,后续将进一步完善仓储算力布局、优化服务流程,深化与各行业的融合应用。记者将持续关注平台优化进展及行业落地动态,为读者提供最新资讯。


































.png)


