极客邦科技 2026 AICon 上海站收官：以工程之力，赋能产业智变新未来

环球新闻网财经正文

极客邦科技 2026 AICon 上海站收官：以工程之力，赋能产业智变新未来

2026-07-03 11:47 来源：互联网

6 月 26 至 27 日，由极客邦科技旗下 InfoQ 中国主办的 AICon 全球人工智能开发与应用大会·上海站（2026） 圆满落地。两天会程中，近 1500 位开发者、技术专家与产业一线实践者齐聚现场，围绕技术趋势与产业落地深度交流，互动热烈、共识频出。

本次大会邀请到来自快手、蚂蚁集团、模思智能、京东（京东零售）、同盾科技、盛大集团、EverMind、华院计算、华为、支付宝、极佳视界、抖音集团、OPPO、阿里巴巴、Google Cloud、MongoDB、元创文化、美团、MemVerge、腾讯、飞猪、阿里云、火山引擎、涂鸦智能、科大讯飞、菜鸟网络、阶跃星辰、小红书、深信服科技、网易、高德、得物、美图、面壁智能、小盾未来、蚂蚁数科、平安人寿、嘉银科技、大晓机器人、慧博科技、观正资本、清华大学、北京大学、复旦大学、上海交通大学、上海创智学院、上海人工智能实验室等 48 家企业与科研机构的近70+专家与实践者同台分享。他们围绕智能体技术体系、底层基础设施、工程实践与产业场景落地等前沿方向展开深度研讨，多维度拆解 AI 落地路径，推动前沿技术与产业需求深度对接。

大咖论道，输出产业关键洞察

在大会开场致辞中，极客邦科技总编辑赵钰莹围绕「智能体浪潮下的工程人才发展与组织变革」展开解读。她表示， AI 正全面重塑人才能力、团队结构与组织形态，企业需同步升级人才体系、适配组织模式，才能释放 AI 规模化落地的核心价值。

赵钰莹提到，当下工程人才技能重心正向智能体方向迁移，传统工程基石技能已普遍覆盖，多智能体协同、Agent 原生开发等成为核心进阶能力。受业务合规影响，国内企业以豆包、千问、DeepSeek 等通用大模型为主流入口，Cursor、Claude Code 构成工程师专业工具核心阵营。伴随技能体系升级，智能体架构师、FDE 前沿部署工程师等新岗位涌现，“技术 + 业务” 复合型人才占比较两年前提升约 10 个百分点，人才缺口仍存。

她进一步指出AI 正深度重构工程团队：项目交付周期大幅缩短，AI 生成代码大规模应用但质量仍需人工把控；团队整体编制收缩、人效提升，超八成工程师日均工作超 8 小时；岗位结构分化明显，测试、UI 等执行类岗位缩减显著，架构、算法类岗位价值凸显，前后端、产技与业务的边界持续消融。

在组织与人才方面，她强调人才培养已转向 “内生 + 实战” 范式，企业核心骨干以内部培养为主，黑客松、项目实操逐步替代传统课程培训，小团队场景化协同成为交付新范式。同时，组织正向 AI-Native 形态演进，部门墙带来的沟通损耗正吞噬 AI 效率红利，未来将形成超级个体、液态团队与新型管理者构成的组织形态，工作流资产将成为企业核心数字资产，传统过程导向的绩效考核体系将逐步失效。

主题演讲精彩回顾

邱锡鹏《迈向情境智能：MOSS 多模态模型的交互新范式》

复旦大学、上海创智学院、模思智能邱锡鹏教授在《迈向情境智能：MOSS 多模态模型的交互新范式》主题演讲中，从纯文本大模型天然存在信息维度缺失的角度切入，指出多模态是让交互回归自然形态的必然方向，并分享了团队在多模态大模型领域的技术路线演进、核心产品矩阵与工程落地成果，提出以视觉理解、音频理解、语音生成三大能力为支柱，构建面向实时交互的统一情境智能系统。

邱锡鹏认为，传统 “ASR 转文本 + 大模型推理 + TTS 转语音” 的级联语音交互存在架构冗余。团队从第一性原理出发持续迭代：2023 年推出业界首个端到端原生语音对话模型 SpeechGPT，将语音离散为词元直接接入大模型，语音与文本共享同一自回归框架；2024 年发布 AnyGPT，实现 “万物皆 token” 的任意模态输入与输出。进入产业落地阶段，团队将能力拆解为 MOSS-VL、MOSS-Audio、MOSS-TTS 三条专项路线，针对性破解多模态 token 膨胀、时空对齐难度大、推理系统协同要求高等行业共性挑战。

他介绍，MOSS 多模态模型矩阵的三大核心能力各有突破：MOSS-VL 采用 Cross-attention 解耦架构，搭配绝对时间戳与 XRoPE 三维位置编码，视频理解能力全面超越同规模主流模型，长视频时序推理与实时交互场景优势突出；MOSS-Audio 实现六类音频任务统一建模，8B 参数模型性能越级反超多款 30B 级开源方案，ASR 精度、语音描述能力领跑开源社区；MOSS-TTS 依托自研纯 Transformer 音频 Tokenizer 与 Local Transformer 架构，形成覆盖云端、端侧、多角色对话的产品家族，主客观评测均跻身开源第一梯队。

工程层面，团队联合 SGLang 社区完成跨注意力推理内核、长请求显存释放等深度优化，推理性能实现数倍提升，全系列模型已全面开源，累计下载量突破 300 万。邱锡鹏坦言，超长时序理解、多模态安全对齐、统一大模型训练仍是行业开放难题，团队将于年内推出 MOSS-Omni 统一多模态模型，持续推进实时情境智能的技术落地。

周俊《从 Token 数量到 Token 密度：万亿参数规模下的高效智能体》

蚂蚁集团副总裁周俊在《从Token数量到Token密度：万亿参数规模下的高效智能体》主题演讲中提出，当前大模型开发者面临“快、强、智”不可能三角：轻量化模型推理成本低但能力有限，大参数模型能力强但GQA注意力成本随上下文指数增长，聊天模型无法原生支撑智能体能力。三者根源一致，均来自架构、训练、智能体的割裂设计，单点优化会受其余两端制约。针对这一痛点，他分享了团队破解智能体规模化落地成本瓶颈的实践，提出协同设计是大模型范式转移的核心出路。

周俊表示，传统GQA注意力存在结构性算力浪费，256K上下文下超85%的算力消耗在注意力计算上，算力多用于“读取”而非“思考”，万亿参数规模下这一问题无法靠堆砌算力解决。同时，聊天模型与智能体能力存在本质差异：聊天幻觉可逆、可多轮纠正，工具调用错误后果不可逆，仅靠指令微调无法弥补能力鸿沟；模拟器训练如同“泳池里练高山滑雪”，无法覆盖真实环境的异常边界，难以培养原生智能体能力。

针对行业痛点，团队以全链路协同设计破解成本瓶颈。架构层面推出7:1混合线性注意力方案，7层线性注意力将复杂度从平方级降为线性级，1层MLA低秩压缩捕捉关键信息，让256K长上下文成为标准配置；配套优化MoE路由，通过四步迁移法度过架构转换阵痛期，最终模型能力反超传统GQA基线。训练层面采用9.6T Token激进策略，搭建覆盖2400+真实工具的训练环境，推出KPop自适应强化学习算法，实现约4倍Token效率提升且能力不降反升。评测显示，模型长上下文能力提升45%，千亿参数模型智能体表现超越300B+竞品，多轮对话成本差异最高可达10倍。

周俊总结，2026年行业正经历从规模扩张到架构创新、从聊天到智能体、从Token数量到Token密度的三重浪潮，效率与规模并非对立，协同设计是推动大模型范式升级的核心路径。

肇极《2026 下半年中美 AI 创业机会：从技术红利到商业验证》

观正资本管理合伙人肇极博士在《2026下半年中美AI创业机会：从技术红利到商业验证》主题演讲中表示，AI正从风口概念渗透至产业全链路，行业已越过技术震撼期进入商业化验证阶段，创业与投资逻辑正从技术叙事转向场景交付，能否形成可落地、可计费的生产力闭环，成为新阶段的核心评判标准。

肇极指出，全球创投市场呈现资本高度集中、应用验收加速、中美路径分化的核心特征。2026年第一季度全球AI融资规模已超越2025年全年，占全球VC投资份额达80%，资金高度向头部基础模型、算力基础设施、具身智能等平台型项目倾斜；早期项目估值逻辑重构，泛AI工具融资难度上升，资本开始要求真实客户、收入与可量化ROI。

创业机会层面，行业共识赛道覆盖AI基础设施、企业工作流Agent、AI Coding、具身智能、AI治理安全，但竞争激烈需找准垂直切口；非共识方向更接近现金流，包括按效果付费的结果型服务、传统行业流程改造、AI原生服务、新兴市场出海等。

同时，中美AI呈现差异化发展路径：美国依托资本、算力与全球软件市场走前沿平台竞赛路线，中国凭借产业场景纵深、工程效率与成本优势走产业部署路线，在具身智能、行业AI、低成本出海等领域具备差异化竞争力。

肇极最后强调，2026年下半年是AI从融资故事走向生产力兑现的关键节点，技术从业者需跳出模型崇拜转向场景结果导向，从窄场景强痛点切入，深耕流程嵌入与数据闭环，抓住AI部署期的产业红利。未来真正有价值的AI企业，核心是控制高价值流程、实现客户持续付费、沉淀可复制的商业闭环。

冷静文《迈向Token服务新范式——从评测到调度的全链路优化供给》

上海交通大学计算机学院副院长冷静文博士，发表《迈向Token服务新范式——从评测到调度的全链路优化供给》主题演讲。他围绕 Token 调用爆发的产业现状、隐性成本陷阱、行业选型痛点，提出 “评测 + 路由” 的全链路优化方案，并介绍了国产推理引擎落地实践与 Token 产业分层新趋势。

冷静文指出，Agent化成为核心增长驱动，Token即服务已成为AI能力供给的主流模式，但行业同时面临隐性成本陷阱与供需匹配低效两大痛点。一是行业普遍存在“便宜模型账单悖论”：Agent客户端会在请求中插入动态计费内容块，约43%的模型-服务商组合因此出现缓存击穿、命中率归零的情况，导致低价模型单价优势被完全抵消，实际调用成本与旗舰模型持平。二是，当前模型与服务商体系高度分散，同一模型在不同服务商处吞吐、延迟差异可达4至5倍，用户面临效果、成本、服务质量三重选型陷阱，缺乏统一客观的决策标准。

针对行业痛点，团队推出全链路优化方案。网关层统一剥离计费内容块，无需逐一对接服务商，即可将编码场景缓存命中率从20%提升至80%，Token成本最高下降75%；打造AI Ping一站式Token服务平台，聚合600余类大模型与30余家主流服务商，通过7×24小时分布式评测实现服务质量透明化，配套多目标智能路由体系，支持多策略调度，落地后综合成本降低超37%，吞吐提升90%以上；底层依托“赤兔”国产推理引擎，适配多款国产芯片，筑牢自主可控的Token生产底座。

冷静文表示，中国Token服务已进入分层时代，产业价值标尺正从算力转向Token，AI基建核心任务从“提供算力”升级为“构建高效Token流转网络”，评测与路由的协同闭环是提升全链路效率、推动算力普惠的核心路径。

多维研讨，全方位剖析 AI 工程化议题

分论坛方面，本届大会精心开辟了 17 个垂直方向的深度研讨专场，您所关心的每一个工程化议题，几乎都能在这里找到答案。

专题体系涵盖：「人工智能前沿技术探索」、「端侧 AI 、物理与数字空间智能化」、「世界模型与多模态智能突破」、「企业智算架构弹性适配」、「大模型推理优化」、「AI 原生数据工程」、「Agent 系统架构与工程化实践」、「Agent 数据、记忆与运行时基础设施」、「Agent 安全、评测与可信治理」、「企业级 AI 研发：从提效到转型」、「动手实验室：AI 智能体工程实践（AI Lab）」、「AI 时代的工作流重构：从 Coding 到 Anything、Agent 落地的前置解决方案」、「在 AI 时代的iOS、 Android、鸿蒙生态下，如何做好 Coding 这件事」、「iOS 开发体验分享与优秀实践」、「AI 开发生产力重构：Coder to Builder」、「AI 时代的移动端开发范式变迁」、「金融领域大模型落地实践」

展区联动，共筑技术生态全景

技术分享之外，大会展区同样热度不减，各家技术厂商带来 AI 应用、开发工具、云服务平台等最新成果，并设置互动体验，让前沿技术触手可及。

本届 AICon 上海站的成功举办，离不开众多合作伙伴的鼎力支持。

大会特别感谢Qoder、AMD、Snowflake、华为、MongoDB、腾讯云、Google Cloud、Coupang、硅基流动、Netnut、GMI Cloud、viaim、Cloudflare、IPIP对本届大会的倾情赞助，同时感谢众多社区和媒体伙伴的支持。正是因为有这样一群与开发者同行的伙伴，AICon 才能持续成为推动技术创新与工程落地的核心舞台。