Nano Banana 2 、GPT-5.1 系列齐齐疑似泄露?“杭州六小龙”乌镇对话:聊 AI、机器人;硕士论文火了,宇树科技王兴兴回应;全网吵翻了!字节跳动年薪百万招聘机器人算法专家;字节豆包 PC 端负责人齐俊元离职;淘宝“双 11”期间霸屏广告遭市监调查;每年 10 亿美元!苹果 Siri 被曝将使用谷歌 1.2 万亿参数 AI 大模型;史上最高!马斯克 1 万亿美元薪酬方案获批准,还计划自建超大型芯片厂;阿里前高管空降山姆引热议:App 被吐槽变得“盒马化”……
近日,一款疑似为谷歌 Nano Banana 2 的新图像生成模型在网络流传。AI 博主 leo 表示,这款疑似“Nano Banana 2”的模型在处理包含大量文本的复杂提示词时表现出色,并能准确生成名人面孔。不过他也指出,目前流传的版本似乎未加载内容审核机制,即便真是该模型,正式对外发布时也有一定可能会有更多限制。leo 还用经典的“时钟基准测试”验证了模型能力。
他给出提示词“时钟指向 11 点 15 分,酒杯斟满”,模型成功在单张图像中同时准确呈现了时钟的正确时间和装满的酒杯——这两项测试此前一直是图像生成模型的难点。
![]()
另一位测试者 Angel 展示了模型的图像编辑能力,通过简单的“把水变成粉红色”指令,对比了疑似初代版本和新版本的效果差异。
开发者 pomterre 表示,流传的版本看起来是一个没有护栏机制的早期检查点,并提醒用户需要注意生成内容与现实的区别。目前该模型可通过特定网站体验,但访问链接已被部分屏蔽。
![]()
从测试结果来看,这款疑似 Nano Banana 2 的模型在文本渲染、物理常识理解和图像编辑精度上都表现出色。但由于其真实来源和版本信息尚未得到证实,与可能的正式版本之间的差异也有待进一步验证。有网友称,Nano-banana 2 现已在 medio.io 上架。
![]()
根据代码中的时间戳,GPT-5.1 系列预计 11 月 24 日面向企业用户正式对外发布。个人 Plus 和 Pro 用户可能提前获得访问权限。
测试版本疑似 GPT-5.1 测试版本Polaris Alpha已在 OpenRouter 平台上线k 上下文窗口。用户可前往 OpenRouter 体验该模型。社区测试反馈显示,该模型在创意写作和基准测试中表现优异,输出特征与 GPT-5 接近。
11 月 7 日,世界互联网大会乌镇峰会上,宇树科技、强脑科技、群核科技、云深处科技、游戏科学、深度求索六家“杭州六小龙”企业负责人首次同台,在王坚院士主持下探讨技术创新与产业突围。
宇树科技王兴兴强调机器人发展源于“全球共创”——中国公司可以提供廉价高性能硬件平台,全球开发者共同开发软件和算法。他认为相比核聚变等技术,具身智能和人形机器人更接近梦想实现。
强脑科技韩璧丞分享脑机接口“从痛到大”的产品化路径,先帮助残疾人,再推广至睡眠、体重管理等大众市场。最大挑战是解析大脑 860 亿到上千亿个神经元的数据。他举例说,给失去右手几十年的大伯做假肢时,对方已完全忘记手指感觉,只能用 AI 模型让其像婴儿一样重新学习。
群核科技黄晓煌阐述空间智能价值,发现 Scaling Law 在空间模型上同样适用。公司战略从“向人类收费”转向“向机器收费”,因为 AI 让创意岗位减少,但替人工作的机器会增加十倍。
云深处朱秋国强调应用场景驱动。2018 年机器狗用于电力巡检时,现场测试发现橡胶垫磨损、机器发热、遇雨损坏等问题,团队据此一直在改进,今年发布全球首台可走向室外的防护型人形机器人。
游戏科学冯骥指出,《黑神话:悟空》成功是中国游戏产业十年积累的结果。多个方面数据显示,去年全球收入前 10 游戏中,4 款来自中国团队研发,另有 3 款有中国公司参与。
深度求索陈德里表示,DeepSeek 核心优势就是长期主义,坚持做前沿智能突破这条主线,而在这样的一个过程中,DeepSeek 也舍弃了很多支线上的事情,不做那些短平快的支线事情。
就未来挑战和社会影响方面,王兴兴认为机器人最大挑战是具身智能 AI 模型。与大语言模型不同,机器人领域硬件各异、数据分散、传感器位置无统一标准。朱秋国细化了两大挑战:具身移动(无先验知识的导航)和具身操作(双手完成复杂任务)。他坦言路径不清晰,需创新模型架构,降低算力和数据需求。韩璧丞指出,人类 36% 医疗花销与大脑相关,但阿尔茨海默病、自闭症等无药可治。脑机接口数据采集和解析难度极大。他看到“美妙闭环”:AI 理论受大脑启发,现在 AI 反过来帮助攻克脑科学难题。
冯骥从宏观层面思考两个社会挑战:一是 AI 是否会让少数公司垄断科技优势;二是 AI 超越人类后怎么样应对恐慌。他因 DeepSeek 的开源实践变得乐观,认为 AI 能赋能普通人创造更多高质量内容。
陈德里强调这轮 AI 革命与工业革命本质不同——发明的不是工具而是智能体,会比人类更聪明。“AI 革命成功的标志,就是它取代了绝大多数人类工作。”但他对技术乐观,认为 AI 解决“锯齿智能”问题后,将通过多模态和具身智能实现持续学习,迎来跨越式发展。
在第八届虹桥国际经济论坛人形机器人创新发展合作分论坛上,总台央视记者独家对话了宇树科技创始人王兴兴。
最近,一个网友考古出了王兴兴的硕士论文上了热搜,大家发现原来在 2016 年,他就已经有了宇树机器狗的雏形,大家惊叹于他对技术和趋势的预判力。王兴兴首次回应了这篇论文。
王兴兴称,“这个想法是很早的,当时那款机器狗是 2013 年想到的方案,我想到方案的时候就想着要不要辍学出来创业,但是当时只是想想而已,因为东西都没有,后来就把这样的一个东西给做出来了。我们公司在过去的至少四足机器人的部分业务和发展趋势,2014 年、2015 年都已经想过了,然后把它给实现了。2009 年我自己就做过小的人形机器人,做好了以后我觉得全世界都看不到希望,没办法商业化也没什么实用价值,很多年我们公司都没有去做人形机器人。后来整个机器人的 AI,包括大模型的 AI 技术进步有目共睹,把大家的想象空间又重新打开了,能够正常的看到最近这些年人形机器人的发展速度很快。”
对于一些技术的创业者的建议,他表示,“科技领域都是超前的,你要去想象未来应该做什么方向的,你只要方向不错,必然是可以成功的。但是也因为这样的领域现在比较超前,你可能开始起步比较难,起步难也有好处,因为别人也进不来,可能这样的领域只有你能做,反而厚积薄发的潜力依旧很大的。我认为这个时代对年轻人,对所有有梦想,尤其有科技梦想的人都是很友好的。像我们 2016 年创业的时候,无论是公司估值、关注度跟现在完全不是一回事,至少差了几十倍甚至上百倍,所以现在反而容易很多,挑战也会大很多,但是我觉得反而每个人有更多的机会去实现各自的梦想。”
11 月 5 日,在 2025 小鹏科技日活动上,小鹏发布了新一代 IRON 人形机器人。由于其高度拟人化的外观和步态,甚至有人质疑其为线% 真人在里面”“臀部似乎有肌肉在动。”
昨日上午,小鹏汽车 CEO 何小鹏发了一条“一镜到底”的视频澄清,并笃定坦言:“我们的机器人绝对是做出来的,IRON 机器人里面没有真人。”视频里,何小鹏先是让 IRON 走几步“猫步”,随后让工作人员把机器人的衣服皮套拉开,显示出机器人的构造和零部件,又让已经拉开皮套的 IRON 机器人走“猫步”。但该视频发布后,质疑声浪并未平息。网络评论转而质疑“为什么后背的拉链拉的不彻底”,甚至怀疑视频系“AI 合成”。
为回应质疑,何小鹏在昨晚“小鹏 X9 鲲鹏超级增程技术发布会”上,再次请出 IRON,全程直播中工作人员现场拆解其外壳和“肌肉”,展示内部机械结构为其正名。
何小鹏在现场一度哽咽,并表示,“当我今天早上回到这里,当 IRON 机器人的拉链被打开,去验证自己是个机器人的时候,说实话,当时我有一点点心酸,因为竟然我们要向别人证明机器人的确不是一个真人,某种角度让我们回忆起一部电影叫让子弹飞,有时要验证自己只吃一碗饭是要剖开肚子的。”
近日,字节跳动旗下火山引擎团队启动了一项高规格招聘,寻求“操作算法资深专家(具身智能)”,该岗位明确专注于“人形具身机器人”的研发,月薪待遇高达 95-120K(即每月 9.5 万至 12 万元人民币),远超行业平均水平。
招聘页面显示,该岗位将主导研发人形具身机器人的操作算法,包括但不限于“主导研发人形具身机器人的操作算法”、“参与具身大模型的预训练与部署”以及“推动算法在硬件上的系统集成与部署”等。职位要求应聘者拥有硕士或博士学历,专业方向为计算机科学、自动化、人工智能等相关领域。除了操作算法资深专家,字节跳动同时也在招聘具身智能数据开发工程师、具身智能推理性能优化工程师等具身领域相关岗位。
此外,据新闻媒体报道,字节跳动正在试点推进一项“豆包长期激励计划”。该计划为豆包相关大模型业务建立了一套“虚拟股”机制,通过授予豆包股及类似字节期权的回购机制,加强对大模型人才的长期吸引和激励。知情的人偷偷表示,“豆包股”现阶段的估值仅参考了业务投入成本,会以很划算的价格授予参与该计划的员工。未来,“豆包股”将结合豆包、大模型 toB 等业务发展状况重新估值,让激励与大模型业务表现挂钩,员工能更好地分享业务成长的红利。
在此之前,据新闻媒体报道,字节跳动近期还为旗下 Seed 部门大模型方向技术员工发放津贴,根据职级绩效情况,每月发价值 10 万元左右的津贴。“与津贴相比,‘豆包股’激励人群范围更大,也会有更大的增值空间。豆包股授予价格很优惠,而且也和字节期权一样有回购机制。”前述知情的人说,“这项计划不涉及业务拆分,也不会进行外部融资,其核心目的是为人才提供更长期、更大想象力的激励。”据悉,“豆包长期激励计划”目前已在 Seed 部门试点推行,预计在未来一段时间可能扩展到与豆包大模型业务紧密相关的其他团队。
据报道,字节旗下豆包 PC 端产品负责人齐俊元已经离职。另据业内人士透露,多家美元基金曾积极接触齐俊元,不仅因为他拥有成功创业的履历,更因为他在豆包产品上的深度经验与对 AI 应用产品化的独特理解。但也有消息表明齐俊元暂时还没有创业打算。
齐俊元本科毕业于上海交通大学信息管理系,大学期间,他创立的 Teambition 是国内最早一批协同办公 SaaS 产品。该项目于 2019 年被阿里巴巴以 1 亿美元收购,随后其加入阿里巴巴担任阿里云盘负责人。2023 年初齐俊元加入飞书,2024 年齐俊元转岗至 Flow,负责豆包 PC 端产品。
9 月 24 日,字节 AI 条线人力资源负责人赵祺转岗至 Spring - 产品部门(包括 Flow、Ocean 等团队),负责豆包产品工作,统领豆包 mobile/PC 的用户产品、模型策略产品,向字节产品副总裁 Alex(朱骏)汇报。同时,豆包原有的 PC(齐俊元)、移动端(陆游)、模型策略产品负责人改为向赵祺汇报。同时,为加强豆包与飞书的办公套件协同,飞书产品负责人童遥虚线汇报给赵祺。
近期,有用户反映打开多款手机 App 时,手指触碰或机身晃动会被强制跳转至淘宝“双 11”会场,影响正常使用体验。杭州市余杭区市场监督管理局证实已收到相关举报,交由网监分局展开调查。此外,淘宝曾多次因违规宣传被当地监管部门处罚,2021 年 6 月和 7 月分别因广告违背法律规定的行为案、未制止平台商家广告违法被处以 50000 元顶额罚金。
每年 10 亿美元!苹果 Siri 被曝将使用谷歌 1.2 万亿参数 AI 大模型
11 月 6 日消息,据外国媒体报道,据知情的人偷偷表示,苹果公司计划每年支付大约 10 亿美元,以使用谷歌开发的一款拥有 1.2 万亿参数的超强 AI 模型。该模型将协助用于支持苹果承诺已久的 Siri 语音助手重大改版。
知情人士称,在经过漫长的评估期后,两家公司将敲定协议,苹果将获得谷歌的技术访问权。眼下,苹果正依靠谷歌的协助来重建 Siri 的底层技术,为明年推出的一系列新功能铺路。这款谷歌模型的 1.2 万亿参数远超苹果当前使用的模型水平。
根据合作协议,谷歌的 Gemini 模型将承担 Siri 的智能摘要与任务规划功能,这些核心组件负责协助语音助手进行信息整合并决策如何执行复杂指令。与此同时,Siri 的部分功能仍将继续沿用苹果自主研发的模型体系。新版 Siri 预计将在明年春季推出。不过,鉴于距离正式对外发布还有数月时间,相关计划与合作伙伴关系仍可能有所变化。苹果与谷歌的发言人均拒绝置评。
北京时间 11 月 7 日,据外国媒体报道,在周四举行的特斯拉年度股东大会上,特斯拉股东投票通过了为 CEO 埃隆·马斯克制定的 1 万亿美元薪酬方案。这是有史以来企业领袖获得的最高薪酬方案。特斯拉表示,超过 75% 的投票支持了这项前所未有的薪酬方案。这一结果标志着,特斯拉董事会、马斯克以及知名散户投资者为争取股东支持而展开的长达数周的行动画上了句号。
马斯克出席了股东大会。他向支持其薪酬方案、投下赞成票的股东表示感谢。“我们即将开启的不仅是特斯拉未来的新篇章,而是一部全新的史诗。”马斯克表示。新的薪酬方案包括 12 个批次的股票奖励。如果马斯克在未来 10 年内达成一系列业绩目标,并将特斯拉的市值扩大至 8.5 万亿美元,他最多可获得特斯拉约 25% 的控制权。目前,该公司的市值约为 1.5 万亿美元。
特斯拉 CEO 埃隆·马斯克周四在公司年度股东大会上表示,特斯拉在大多数情况下要自建一座“超级芯片工厂”来生产人工智能芯片,并公开提及可能与英特尔展开合作。马斯克在会上对欢呼的股东们说:“也许我们会与英特尔合作。虽然还没有签署任何协议,但值得与英特尔进行讨论。”对此,英特尔方面拒绝置评。特斯拉正在设计第五代 AI 芯片以支撑其无人驾驶目标。马斯克解释称,即使按照供应商最乐观的产能预期推算,芯片供应仍然不足。
他透露,特斯拉已经与台积电和三星建立了合作伙伴关系,但这还不够。少量 AI5 芯片将在 2026 年生产,2027 年才能实现大规模量产,而 AI6 芯片预计 2028 年中期量产,性能将提升约一倍。马斯克表示,特斯拉在大多数情况下要建造一座他称之为万亿级芯片厂的设施,规模远超特斯拉现有的超级工厂。这座工厂每月至少要达到 10 万片晶圆投片量。他强调这款芯片将针对特斯拉自有软件来优化,功耗约为英伟达旗舰 Blackwell 芯片的三分之一,制造成本仅为后者的十分之一。我现在对芯片极度专注,你们应该能看出来,马斯克说,我满脑子都是芯片。
山姆变得像盒马话题冲上微博热搜第二,源于山姆的人事变动,前阿里巴巴高管刘鹏加入并担任山姆会员店业态总裁。其空降后山姆 App 大更新,存在白底实物图换高饱和精修图、商品详情页放做好的菜、图片过度美化、交互界面烦琐等问题,还具备凑满减、先用后付等类似老东家的功能,引发网友不满,有人说若继续如此就不续会员卡,甚至分享退卡流程。此外,更新后的 App 商品信息混乱,关键供应商信息被打码,同一商品图文描述不一,部分网友要求新总裁下岗,否则不再续费。
![]()
该事件也进而引发了网上关于“阿里味”的讨论。据一手消息,近期又有几位前阿里员工加入山姆。其中,前阿里 P9 童颜 (杨小梅,前天猫国际美妆负责人) 已于 10 月中旬加入山姆,担任采购运营副总裁,向山姆高级副总裁兼首席采购官张青汇报。此外,前阿里 P11、天猫国际负责人奥文也于近期加入山姆。
市值 430 亿!明略科技赴港上市,拿下全球 Agentic AI 第一股
11 月 3 日,中国最大智能数据应用软件企业明略科技,正式在港交所主板挂牌。作为“全球 Agentic AI 第一股”,在招股阶段,明略科技的香港公开发售部分获得 4452.86 倍超额认购。此次 IPO,明略科技采用不一样投票权架构上市,发行价为 141 港元 / 股,全球发售 721.9 万股,共募集资金约 10.18 亿港元。上市首日,明略科技开盘价为 280 港元,高开 98.6%。有必要注意一下的是,本次香港 IPO,明略科技引入包括腾讯、郭敏芳、Hundreds Capital、包莉娜、Treasure-stone、GFH、晶泰控股等在内的基石投资者。其中,腾讯作为明略科技上市前第一大股东,再次表现出支持态度。
明略科技自创立至今已经 19 年,创始人吴明辉当时更是被称为北大数学系才子。算上不久前上市的云迹科技,吴明辉在一个月内便收获了两个 IPO。如果按照明略科技和云迹科技的最新市值粗略计算,上市前分别持股 10.82% 和 3.99% 的他,目前身价超过 49 亿港元。
字节、腾讯旗下 AI 编程工具均已移除 Claude 模型,或因 Anthropic 收紧服务条款
11 月 4 日,多位用户在社交平台上分享的邮件内容显示,字节跳动旗下 AI 编程工具 Trae 国际版宣布,由于服务调整,将不再提供 Claude 模型的访问权限。邮件还指出,凭借 GPT-5、Gemini-2.5-Pro、Kimi-K2-0905 和 DeepSeek-V3.1-Terminus 等核心模型,以及 TRAE 在推理质量、代码智能和执行流程上的深度优化,用户依然能够轻松的享受到与以往同样高水准的产品性能。“我们对未来充满信心。”
作为回馈,平台还将向 Pro 会员提供 50% 额外的快速请求额度,即每月新增 300 次请求,有效期至 2026 年 1 月 31 日。然而,在 Reddit、GitHub 等平台上,许多 Trae 用户对移除 Claude 模型的调整表示不满,并称将考虑转向其他同类型的 AI 编程工具。
11 月 5 日消息,报道称 IBM 将在 2025 年第 4 季度进行新一轮裁员,预计波及员工数量,在全球员工总数的占比为“较低的个位数”。据博文介绍,根据 IBM 发布的最新年报,截至 2024 年底,公司在全球共拥有约 27 万名员工。基于此数据推算,即便是最低的 1% 裁员比例,也代表着将有 2700 人失去工作。
不过,IBM 方面同时强调,尽管此次裁员可能波及部分美国本土职位,但公司预计其在美国的总雇佣人数将与去年同期基本持平,这表明公司可能在裁撤部分岗位的同时,也在其他领域进行招聘。IBM 的 CEO 阿尔温德・克里希纳曾在今年 5 月透露,AI 系统已经接管了约 200 名人力资源部门员工的工作。他表示,通过自动化替代重复性劳动,公司得以将资源重新分配,转而招聘了更多急需的销售人员和软件开发者,以推动业务增长。
此次裁员并非孤例,而是当前科技行业整体趋势。包括亚马逊和 Meta 在内的多家科技巨头近期都在进行人员“瘦身”,高管们普遍希望能够通过增加对 AI 工具的依赖来提高生产力。例如,亚马逊在 10 月宣布裁减 14000 名公司员工,而 Meta 的 AI 部门也削减了 600 个职位。行业一致认为,利用 AI 降本增效已成为巨头们的核心战略之一。
2025 年的科技浪潮令人应接不暇。技术变化密集、层级交叠,让人眼花缭乱。临近年终,为了把有限的篇幅用在大家最关心的领域,我们今年希望借助投票的方式,选出数个关键领域进行趋势盘点。你们可以勾选出你最想看到的 3 个方向(可多选)。
除此之外,你还想看哪个方向的盘点? 有什么现象或争议点你希望我们“深扒”一下?哪些趋势你觉得太迷,需要专家带你看懂?对于年终盘点,大家有任何想法,都很欢迎在评论区留言告诉我们!
11 月 6 日晚间,月之暗面发布并开源 Kimi k2 thinking,其为具有通用 Agentic 能力和推理能力的思考模型,擅长深度推理。据介绍,Kimi K2 Thinking 具备边思考边使用工具的能力,无需用户干预,可自主实现 300 轮工具调用和多轮思考能力,解决各类复杂的难题。
月之暗面介绍称,Kimi K2 Thinking 在人类终极考试(HLE)中取得了 44.9% 的优异成绩,这一表现超越了包括 GPT-5、Grok-4、Claude 4.5 在内的多个先进模型。Kimi K2 Thinking 采用了开源策略,并发布了模型权重、训练脚本、数据配比与评估工具链,且允许商用。
CNBC 援引知情人士称,Kimi K2 Thinking 模型训练成本仅 460 万美元(约合 3277 万元人民币),要低于 DeepSeek V3 的 560 万美元 。与之形成对比的是,OpenAI 在相关研发上的投入高达数十亿美元。不过,部分网友们对此成本持怀疑态度。
微软今年 10 月推出其首个自研 AI 图像生成模型 MAI-Image-1。11 月 5 日,微软宣布该模型已应用于 Bing Image Creator 和 Copilot Audio Expressions 两款产品中(欧盟暂时除外)。微软 AI 部门负责人 Mustafa Suleyman 介绍称,该模型在生成食物、自然风景、艺术化光效及写实细节等图像方面“表现尤为出色”。
11 月 6 日,宇树发布了全身遥操作平台。视频中,在人类遥操作的控制之下,宇树的 G1 机器人可以有效的进行洗碗、使用扫地机器人清洁、整理衣物、端水等家务活动。
11 月 6 日,在科大讯飞 1024 开发者节上,具备高度多模态交互能力的数字人导览“小飞”正式亮相并已实际上岗。“小飞”突破了简单问答的局限,可以在一定程度上完成多人自由对话、多语种交流,并具备个性化记忆能力,能记住访客历史信息并进行贴心提醒。
微软的 Microsoft AI 组建了一支超级智能团队。该团队将聚焦三个领域:AI 伴侣(价格低的 AI 伴侣,支持学习、行动、提高效率并获得支持)、医疗超级智能(在全方位诊断方面达到专家级水平,同时在临床操作环境中具备高度的规划和预测能力)、充足的清洁能源(帮助创建和管理用于设计和部署新的科学突破的新工作流程)。
11 月 4 日,高德即将公布入局 Robotaxi 业务,同时高德该业务模式将与某汽车厂商展开深度合作。有知情人士称,高德内部对此十分重视,将其作为战略级业务,未来将成为高德重要的增长板块。媒体从多渠道获悉,这家车企预计为小鹏汽车。
两天时间,聊最热的 Agent、上下文工程、AI 产品创新等等话题,与头部企业与创新团队的专家深度交流落地经验与思考。2025 年最后一场,不容错过。