极客邦科技 2026 AICon 上海站收官:以工程之力,赋能产业智变新未来

2026-07-03 11:47   来源: 互联网

6 月 26 至 27 日,由极客邦科技旗下 InfoQ 中国主办的 AICon 全球人工智能开发与应用大会·上海站(2026) 圆满落地。两天会程中,近 1500 位开发者、技术专家与产业一线实践者齐聚现场,围绕技术趋势与产业落地深度交流,互动热烈、共识频出。

本次大会邀请到来自快手、蚂蚁集团、模思智能、京东(京东零售)、同盾科技、盛大集团、EverMind、华院计算、华为、支付宝、极佳视界、抖音集团、OPPO、阿里巴巴、Google Cloud、MongoDB、元创文化、美团、MemVerge、腾讯、飞猪、阿里云、火山引擎、涂鸦智能、科大讯飞、菜鸟网络、阶跃星辰、小红书、深信服科技、网易、高德、得物、美图、面壁智能、小盾未来、蚂蚁数科、平安人寿、嘉银科技、大晓机器人、慧博科技、观正资本、清华大学、北京大学、复旦大学、上海交通大学、上海创智学院、上海人工智能实验室等 48 家企业与科研机构的近70+专家与实践者同台分享。他们围绕智能体技术体系、底层基础设施、工程实践与产业场景落地等前沿方向展开深度研讨,多维度拆解 AI 落地路径,推动前沿技术与产业需求深度对接。

大咖论道,输出产业关键洞察

在大会开场致辞中,极客邦科技总编辑赵钰莹围绕「智能体浪潮下的工程人才发展与组织变革」展开解读。她表示, AI 正全面重塑人才能力、团队结构与组织形态,企业需同步升级人才体系、适配组织模式,才能释放 AI 规模化落地的核心价值。

赵钰莹提到,当下工程人才技能重心正向智能体方向迁移,传统工程基石技能已普遍覆盖,多智能体协同、Agent 原生开发等成为核心进阶能力。受业务合规影响,国内企业以豆包、千问、DeepSeek 等通用大模型为主流入口,Cursor、Claude Code 构成工程师专业工具核心阵营。伴随技能体系升级,智能体架构师、FDE 前沿部署工程师等新岗位涌现,“技术 + 业务” 复合型人才占比较两年前提升约 10 个百分点,人才缺口仍存。

她进一步指出AI 正深度重构工程团队:项目交付周期大幅缩短,AI 生成代码大规模应用但质量仍需人工把控;团队整体编制收缩、人效提升,超八成工程师日均工作超 8 小时;岗位结构分化明显,测试、UI 等执行类岗位缩减显著,架构、算法类岗位价值凸显,前后端、产技与业务的边界持续消融。

在组织与人才方面,她强调人才培养已转向 “内生 + 实战” 范式,企业核心骨干以内部培养为主,黑客松、项目实操逐步替代传统课程培训,小团队场景化协同成为交付新范式。同时,组织正向 AI-Native 形态演进,部门墙带来的沟通损耗正吞噬 AI 效率红利,未来将形成超级个体、液态团队与新型管理者构成的组织形态,工作流资产将成为企业核心数字资产,传统过程导向的绩效考核体系将逐步失效。

主题演讲精彩回顾

邱锡鹏《迈向情境智能:MOSS 多模态模型的交互新范式》

复旦大学、上海创智学院、模思智能邱锡鹏教授在《迈向情境智能:MOSS 多模态模型的交互新范式》主题演讲中,从纯文本大模型天然存在信息维度缺失的角度切入,指出多模态是让交互回归自然形态的必然方向,并分享了团队在多模态大模型领域的技术路线演进、核心产品矩阵与工程落地成果,提出以视觉理解、音频理解、语音生成三大能力为支柱,构建面向实时交互的统一情境智能系统。

邱锡鹏认为,传统 “ASR 转文本 + 大模型推理 + TTS 转语音” 的级联语音交互存在架构冗余。团队从第一性原理出发持续迭代:2023 年推出业界首个端到端原生语音对话模型 SpeechGPT,将语音离散为词元直接接入大模型,语音与文本共享同一自回归框架;2024 年发布 AnyGPT,实现 “万物皆 token” 的任意模态输入与输出。进入产业落地阶段,团队将能力拆解为 MOSS-VL、MOSS-Audio、MOSS-TTS 三条专项路线,针对性破解多模态 token 膨胀、时空对齐难度大、推理系统协同要求高等行业共性挑战。

他介绍,MOSS 多模态模型矩阵的三大核心能力各有突破:MOSS-VL 采用 Cross-attention 解耦架构,搭配绝对时间戳与 XRoPE 三维位置编码,视频理解能力全面超越同规模主流模型,长视频时序推理与实时交互场景优势突出;MOSS-Audio 实现六类音频任务统一建模,8B 参数模型性能越级反超多款 30B 级开源方案,ASR 精度、语音描述能力领跑开源社区;MOSS-TTS 依托自研纯 Transformer 音频 Tokenizer 与 Local Transformer 架构,形成覆盖云端、端侧、多角色对话的产品家族,主客观评测均跻身开源第一梯队。

工程层面,团队联合 SGLang 社区完成跨注意力推理内核、长请求显存释放等深度优化,推理性能实现数倍提升,全系列模型已全面开源,累计下载量突破 300 万。邱锡鹏坦言,超长时序理解、多模态安全对齐、统一大模型训练仍是行业开放难题,团队将于年内推出 MOSS-Omni 统一多模态模型,持续推进实时情境智能的技术落地。

周俊《从 Token 数量到 Token 密度:万亿参数规模下的高效智能体》

蚂蚁集团副总裁周俊在《从Token数量到Token密度:万亿参数规模下的高效智能体》主题演讲中提出,当前大模型开发者面临“快、强、智”不可能三角:轻量化模型推理成本低但能力有限,大参数模型能力强但GQA注意力成本随上下文指数增长,聊天模型无法原生支撑智能体能力。三者根源一致,均来自架构、训练、智能体的割裂设计,单点优化会受其余两端制约。针对这一痛点,他分享了团队破解智能体规模化落地成本瓶颈的实践,提出协同设计是大模型范式转移的核心出路。

周俊表示,传统GQA注意力存在结构性算力浪费,256K上下文下超85%的算力消耗在注意力计算上,算力多用于“读取”而非“思考”,万亿参数规模下这一问题无法靠堆砌算力解决。同时,聊天模型与智能体能力存在本质差异:聊天幻觉可逆、可多轮纠正,工具调用错误后果不可逆,仅靠指令微调无法弥补能力鸿沟;模拟器训练如同“泳池里练高山滑雪”,无法覆盖真实环境的异常边界,难以培养原生智能体能力。

针对行业痛点,团队以全链路协同设计破解成本瓶颈。架构层面推出7:1混合线性注意力方案,7层线性注意力将复杂度从平方级降为线性级,1层MLA低秩压缩捕捉关键信息,让256K长上下文成为标准配置;配套优化MoE路由,通过四步迁移法度过架构转换阵痛期,最终模型能力反超传统GQA基线。训练层面采用9.6T Token激进策略,搭建覆盖2400+真实工具的训练环境,推出KPop自适应强化学习算法,实现约4倍Token效率提升且能力不降反升。评测显示,模型长上下文能力提升45%,千亿参数模型智能体表现超越300B+竞品,多轮对话成本差异最高可达10倍。

周俊总结,2026年行业正经历从规模扩张到架构创新、从聊天到智能体、从Token数量到Token密度的三重浪潮,效率与规模并非对立,协同设计是推动大模型范式升级的核心路径。

肇极《2026 下半年中美 AI 创业机会:从技术红利到商业验证》

观正资本管理合伙人肇极博士在《2026下半年中美AI创业机会:从技术红利到商业验证》主题演讲中表示,AI正从风口概念渗透至产业全链路,行业已越过技术震撼期进入商业化验证阶段,创业与投资逻辑正从技术叙事转向场景交付,能否形成可落地、可计费的生产力闭环,成为新阶段的核心评判标准。

肇极指出,全球创投市场呈现资本高度集中、应用验收加速、中美路径分化的核心特征。2026年第一季度全球AI融资规模已超越2025年全年,占全球VC投资份额达80%,资金高度向头部基础模型、算力基础设施、具身智能等平台型项目倾斜;早期项目估值逻辑重构,泛AI工具融资难度上升,资本开始要求真实客户、收入与可量化ROI。

创业机会层面,行业共识赛道覆盖AI基础设施、企业工作流Agent、AI Coding、具身智能、AI治理安全,但竞争激烈需找准垂直切口;非共识方向更接近现金流,包括按效果付费的结果型服务、传统行业流程改造、AI原生服务、新兴市场出海等。

同时,中美AI呈现差异化发展路径:美国依托资本、算力与全球软件市场走前沿平台竞赛路线,中国凭借产业场景纵深、工程效率与成本优势走产业部署路线,在具身智能、行业AI、低成本出海等领域具备差异化竞争力。

肇极最后强调,2026年下半年是AI从融资故事走向生产力兑现的关键节点,技术从业者需跳出模型崇拜转向场景结果导向,从窄场景强痛点切入,深耕流程嵌入与数据闭环,抓住AI部署期的产业红利。未来真正有价值的AI企业,核心是控制高价值流程、实现客户持续付费、沉淀可复制的商业闭环。

冷静文《迈向Token服务新范式——从评测到调度的全链路优化供给》

上海交通大学计算机学院副院长冷静文博士,发表《迈向Token服务新范式——从评测到调度的全链路优化供给》主题演讲。他围绕 Token 调用爆发的产业现状、隐性成本陷阱、行业选型痛点,提出 “评测 + 路由” 的全链路优化方案,并介绍了国产推理引擎落地实践与 Token 产业分层新趋势。

冷静文指出,Agent化成为核心增长驱动,Token即服务已成为AI能力供给的主流模式,但行业同时面临隐性成本陷阱与供需匹配低效两大痛点。一是行业普遍存在“便宜模型账单悖论”:Agent客户端会在请求中插入动态计费内容块,约43%的模型-服务商组合因此出现缓存击穿、命中率归零的情况,导致低价模型单价优势被完全抵消,实际调用成本与旗舰模型持平。二是,当前模型与服务商体系高度分散,同一模型在不同服务商处吞吐、延迟差异可达4至5倍,用户面临效果、成本、服务质量三重选型陷阱,缺乏统一客观的决策标准。

针对行业痛点,团队推出全链路优化方案。网关层统一剥离计费内容块,无需逐一对接服务商,即可将编码场景缓存命中率从20%提升至80%,Token成本最高下降75%;打造AI Ping一站式Token服务平台,聚合600余类大模型与30余家主流服务商,通过7×24小时分布式评测实现服务质量透明化,配套多目标智能路由体系,支持多策略调度,落地后综合成本降低超37%,吞吐提升90%以上;底层依托“赤兔”国产推理引擎,适配多款国产芯片,筑牢自主可控的Token生产底座。

冷静文表示,中国Token服务已进入分层时代,产业价值标尺正从算力转向Token,AI基建核心任务从“提供算力”升级为“构建高效Token流转网络”,评测与路由的协同闭环是提升全链路效率、推动算力普惠的核心路径。

多维研讨,全方位剖析 AI 工程化议题

分论坛方面,本届大会精心开辟了 17 个垂直方向的深度研讨专场,您所关心的每一个工程化议题,几乎都能在这里找到答案。

专题体系涵盖:「人工智能前沿技术探索」、「端侧 AI 、物理与数字空间智能化」、「世界模型与多模态智能突破」、「企业智算架构弹性适配」、「大模型推理优化」、「AI 原生数据工程」、「Agent 系统架构与工程化实践」、「Agent 数据、记忆与运行时基础设施」、「Agent 安全、评测与可信治理」、「企业级 AI 研发:从提效到转型」、「动手实验室:AI 智能体工程实践(AI Lab)」、「AI 时代的工作流重构:从 Coding 到 Anything、Agent 落地的前置解决方案」、「在 AI 时代的iOS、 Android、鸿蒙生态下,如何做好 Coding 这件事」、「iOS 开发体验分享与优秀实践」、「AI 开发生产力重构:Coder to Builder」、「AI 时代的移动端开发范式变迁」、「金融领域大模型落地实践」

展区联动,共筑技术生态全景

技术分享之外,大会展区同样热度不减,各家技术厂商带来 AI 应用、开发工具、云服务平台等最新成果,并设置互动体验,让前沿技术触手可及。

本届 AICon 上海站的成功举办,离不开众多合作伙伴的鼎力支持。

大会特别感谢Qoder、AMD、Snowflake、华为、MongoDB、腾讯云、Google Cloud、Coupang、硅基流动、Netnut、GMI Cloud、viaim、Cloudflare、IPIP对本届大会的倾情赞助,同时感谢众多社区和媒体伙伴的支持。正是因为有这样一群与开发者同行的伙伴,AICon 才能持续成为推动技术创新与工程落地的核心舞台。

新程再启,共赴八月深圳盛会

随着 2026 AICon 上海站顺利收官,技术探索的热度将接力至 8 月深圳 AICon。期待与更多开发者再相聚,共赴智能时代的下一程探索。详细了解演讲专题 aicon.infoq.cn

1783044719317918.png



责任编辑:Linda
【慎重声明】凡本站未注明来源为"环球新闻网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!

未经许可任何人不得复制和镜像,如有发现追究法律责任 粤ICP备2020138440号