2月28日,由浦软创投携手华为云,联合硅基流动、清昴智能、蜜度科技、蘑菇云创客空间共同举办的《大模型驱动下的AI Infra创新:技术突破与应用拓展》主题会议在上海浦东软件园举行,这场盛会吸引了众多AI领域的大咖齐聚一堂。

1740729162150754.png

《大模型驱动下的AI Infra创新:技术突破与应用拓展》主题会议

本次活动亮点纷呈,不仅有AI Infra领域的前沿洞察分享,还深度探讨了人工智能行业的痛点与解决方案,为参与者提供一场思想的盛宴。无论是关注大模型私有化部署的企业高管,还是AI领域的创业者与技术负责人,亦或是对大模型应用感兴趣的开发者,都能在这里找到灵感与机遇。

1740729184148947.png

会议现场

硅基流动政企商业化负责人分享了在AI应用部署大模型的过程中,开发者面临的四大核心挑战:模型丰富度不足、推理速度瓶颈、推理成本过高、系统可用性风险,为此,AI基础设施需通过模型微调与集成工具链增强多模型兼容性,借助超低延迟架构与调度优化突破算力效率边界,依托芯片适配与吞吐量最大化策略实现硬件降本增效,并通过云原生稳定性架构与开发工具链兼容设计构建全链路可靠性保障,最终形成覆盖“模型-算力-硬件-系统”的闭环解决方案。

清昴智能市场合伙人现场介绍了其玄武智算平台的突破性能力:通过DeepSeek敏捷集群部署方案的自动化优化技术,在Llama系列模型(78/158/308/658)上实现推理速度2-10倍提升、内存占用缩减2-4倍、吞吐量激增10-30倍,同时将模型部署周期从传统3-12个月压缩至1周,在最小化精度损失的基础上,全面兼容国产芯片与英伟达异构算力,以实际案例验证了该方案如何系统性攻克AI应用“高延迟、高成本、长周期”难题,推动行业迈向高效敏捷部署的新阶段。

1740729206252532.png

蘑菇云创客空间的联合创始人夏青主持圆桌论坛并分享看法

蘑菇云创客空间联合创始人夏青主持了圆桌论坛,并分享了对于人工智能基础建设发展的看法,人工智能基础设施(AI Infra)的演进正推动新一轮技术范式重构:在生成式AI与大模型爆发性需求的催化下,行业竞争已从单一算法突破转向系统性效率博弈。头部企业依托资本与生态优势加速构筑技术壁垒,而中小参与者的破局关键在于通过异构计算优化、轻量化架构设计、开源协同生态实现技术普惠化——以分布式训练效率提升降低算力边际成本,以自适应模型压缩打破硬件依赖桎梏,以模块化工具链缩短开发周期。这场变革的本质是算力民主化进程的深化,唯有将底层基础设施的“高门槛、重资产”特性转化为“可扩展、可定制”的服务能力,方能在产业级智能化的浪潮中重塑价值分配格局。