AI News Hub

模型发布 27

国内量子位 · 21 小时前 ★★★★★

开源项目发布 LingBot-VA 2.0，并将其定位为全球首个“具身原生”预训练模型，强调从物理世界感知与交互需求出发，为机器人构建更贴近真实环境的通用“大脑”。从现有信息看，核心亮点在于具身智能方向的模型预训练与开源发布，但具体技术指标、适用场景和性能细节尚未披露。

国内量子位 · 1 天前 ★★★★★

行业首个具身原生世界动作模型来了！蚂蚁灵波发布LingBot-VA 2.0

蚂蚁灵波发布LingBot-VA 2.0，定位为行业首个具身原生世界动作模型。该模型面向机器人等具身智能场景，强调对真实世界感知、理解与动作生成的一体化能力，意在提升复杂环境中的任务执行与交互表现。此次发布显示出大厂在具身智能基础模型方向的持续投入与产品化推进。

媒体 TechCrunch AI · 1 天前 ★★★★★

OpenAI launches its new family of models with GPT-5.6

OpenAI 发布新一代模型家族 GPT-5.6，称其在多项能力上实现提升，覆盖更广泛的应用场景。已披露信息显示，改进重点之一包括网络安全相关能力，反映其继续推进高性能通用模型与专业任务表现的整合。

媒体 Hacker News · 1 天前 ★★★★★

GPT-5.6

OpenAI 发布 GPT-5.6，并同步提供部署安全文档与开发者 API 最新模型指南，显示该模型已进入面向开发者的实际接入阶段。相关消息在 Hacker News 引发广泛讨论，获得 483 点和 312 条评论，反映出社区对其能力、使用方式及安全部署细节的高度关注。

媒体 The Verge AI · 1 天前 ★★★★★

OpenAI rolls out GPT-5.6 after government greenlight — and announces ‘ChatGPT Work’

OpenAI在经历监管争议后，获得美国政府放行，宣布将GPT-5.6从仅限获批机构的有限预览扩大至公众发布。Sam Altman称其为公司迄今最佳模型；同时公司还公布新产品“ChatGPT Work”，显示其正借最新模型进一步拓展面向办公与企业场景的应用布局。

媒体 The Verge AI · 1 天前 ★★★★★

Meta says its new AI model is ready to compete on coding

Meta 宣布推出面向开发者开放的 Muse Spark 1.1，并通过新的 Meta Model API 接入 AI 编程软件，强化其在代码生成与开发工具场景的竞争力。公司称该版本较 4 月发布的首代自研模型实现“跃升式”改进，显示其正加速扩展模型能力与开发者生态。

国内量子位 · 1 天前 ★★★★★

Zero-Shot提升31%！原力灵机DM0.5登场，15万小时数据喂出

原力灵机发布DM0.5，并称其基于约15万小时数据训练，在零样本任务上实现31%的性能提升。现有披露信息强调模型已出现“泛化涌现”，表明其在未见任务上的适应能力增强，但具体评测基准、应用场景与技术细节尚未进一步公开。

官方/研究 OpenAI Blog · 1 天前 ★★★★★

GPT-5.6: Frontier intelligence that scales with your ambition

OpenAI发布GPT-5.6，主打在每个token中提供更高智能密度、以更优成本实现更强性能，并可按需扩展能力以处理高难度任务。现有信息强调其在效率、性价比和复杂工作支持上的提升，但正文片段尚未披露具体技术细节、基准成绩与产品接入方式。

国内量子位 · 2 天前 ★★★★★

刚刚，全球首个具身专属的MoE视频模型，开源了！

一款面向具身智能场景的MoE视频生成模型宣布开源，定位为全球首个具身专属视频模型。文章指出其核心意义不止于视频生成，更在于为机器人提供可用于感知、预测与决策训练的“机器人大脑”能力，体现生成模型向具身智能基础能力延伸的趋势。

国内 36氪 AI · 2 天前 ★★★★★

蚂蚁灵波同日开源两大模型，推动世界模型与具身智能视频生成的双升级

7月9日，蚂蚁灵波科技同步开源LingBot-World 2.0和LingBot-Video两款模型，分别聚焦实时交互世界生成与具身智能视频生成。前者支持小时级实时生成、720p/60fps输出，并引入Agent机制；后者为面向具身智能的开源MoE视频生成基础模型，可用于机器人理解动作、任务及物理环境。

国内量子位 · 2 天前 ★★★★★

世界模型首次迎来“小时级”生成！蚂蚁灵波开源LingBot-World 2.0，支持AI原生多人交互

蚂蚁灵波开源发布世界模型 LingBot-World 2.0，宣称首次实现“小时级”长时序生成，可支持更持续的场景演化与任务过程模拟。该版本聚焦 AI 原生多人交互能力，面向复杂环境中的多主体协同、对话和行为生成，为虚拟空间、智能体训练及交互式应用提供底层能力。

国内量子位 · 2 天前 ★★★★★

蚂蚁灵波开源LingBot-Video，全球首个面向具身的视频基模来了！

蚂蚁灵波宣布开源 LingBot-Video，定位为全球首个面向具身智能的视频基础模型，聚焦机器人等具身体在真实环境中的视觉理解、动作学习与任务执行。该模型以视频为核心训练载体，旨在提升具身场景中的感知与决策能力，开源举措也为相关研究与产业应用提供了可复用基础。

媒体 TechCrunch AI · 2 天前 ★★★★★

SpaceXAI releases Grok 4.5, which Elon describes as an ‘Opus-class model’

马斯克旗下技术公司于周三发布 Grok 4.5，将其定位为“Opus 级”模型。该版本主打以更低成本和更高效率提供接近顶级大模型的能力，目标是作为当前强大 AI 模型的替代方案。现有信息聚焦其性能定位与成本优势，具体基准、功能细节和适用场景尚未披露。

媒体 TechCrunch AI · 2 天前 ★★★★★

OpenAI releases new voice models for more natural live conversations

OpenAI 发布新一代语音模型与语音模式，主打更自然的实时对话体验。新语音模式可同时进行说话与聆听，具备全双工交互能力，这一能力被视为实时翻译等场景的关键基础，可提升连续交流的流畅性与响应效率。

媒体 Hacker News · 2 天前 ★★★★★

SWE-1.7 Reach Near GPT 5.5 and Opus Intelligence

Cognition 发布 SWE-1.7，并宣称其能力已接近 GPT 5.5 与 Opus 等顶级模型水平。现有信息主要来自官方博客与社区转发，正文片段未披露训练方法、基准细节或实际产品形态。该消息反映编程智能体与代码模型竞争持续升温，但当前可验证信息仍较有限。

国内 36氪 AI · 2 天前 ★★★★★

SpaceX AI将于明日向公众开放Grok4.5

马斯克表示，SpaceX AI 旗下模型 Grok4.5 将于明日正式向公众开放。现有信息仅披露发布时间节点，未说明模型能力升级、定价方案、开放范围及接入渠道。该消息显示 Grok 系列正继续推进面向更广泛用户的公开可用进程。

国内 36氪 AI · 3 天前 ★★★★★

OpenAI将于9日正式发布GPT-5.6系列

OpenAI宣布将于当地时间7月9日正式发布GPT-5.6系列，包含Sol、Terra和Luna三个版本。现有信息显示，此次为新一代大模型产品线公开上线，但尚未披露具体参数、定价、能力边界及面向开发者或企业客户的接入方式。

媒体 Hacker News · 3 天前 ★★★★★

GPT-5.6 Sol, along with Terra and Luna, will launch publicly this Thursday

OpenAI 在社交平台预告将于本周四公开发布 GPT-5.6 Sol，并同时推出 Terra 与 Luna。现有信息主要来自官方账号帖文及社区转引，尚未披露模型参数、能力边界、定价与接入方式。由于涉及多款新模型同时上线，该消息已引发开发者社区关注与讨论。

国内 36氪 AI · 3 天前 ★★★★★

蚂蚁灵波具身基座模型LingBot-VLA 2.0开源

蚂蚁灵波科技于7月8日宣布升级并开源具身基座模型LingBot-VLA 2.0。该版本在1.0基础上引入6万小时高质量真实物理数据，覆盖17个主流机器人品牌、20种机器人构型，并新增对头部、腰部、末端执行器和移动底盘等自由度支持，提升了构型泛化能力、自由度适配范围及实际落地效率。

国内量子位 · 3 天前 ★★★★★

60000小时炼出新开源VLA！20多种机器人都能用

蚂蚁发布开源视觉-语言-动作模型 Lingbot-VLA 2.0，称基于约6万小时训练数据打造，面向通用机器人操作场景。该模型支持20多种不同机器人平台复用，突出跨硬件适配与开放生态能力，指向具身智能领域模型通用化和开源落地的最新进展。

国内量子位 · 3 天前 ★★★★★

支持17家机器人厂商20多种构型，蚂蚁灵波LingBot-VLA 2.0正式开源

蚂蚁灵波正式开源 LingBot-VLA 2.0，称已支持 17 家机器人厂商、20 多种机器人构型，面向具身智能与机器人任务训练和部署。该版本有望提升跨平台适配与场景落地效率，降低开发门槛，推动机器人通用模型生态扩展及产业协同。

官方/研究 OpenAI Blog · 3 天前 ★★★★★

Introducing GPT-Live

OpenAI 发布 GPT-Live，定位为新一代语音模型，强调更自然的人机语音交互体验，并已应用于 ChatGPT Voice。该信息表明语音能力正从基础识别与合成走向更实时、更拟人化的对话交互，体现大模型产品在多模态交互上的持续升级。

媒体 The Verge AI · 3 天前 ★★★★★

Meta’s new Muse Image model can pull other Instagram users into AI photos

Meta 发布由其 Superintelligence Labs 打造的首个 AI 图像生成模型 Muse Image，已用于 Meta AI 应用、Instagram 和 WhatsApp 的图片生成工具，并将很快扩展至 Facebook 与 Messenger。该模型属于 Muse 系列，支持在 AI 照片中引入其他 Instagram 用户，强化社交平台内的生成式图像体验。

国内量子位 · 4 天前 ★★★★★

让Skill“有图可依”：openJiuwen首发多模态Skill范式Skill-Omni

openJiuwen发布多模态Skill范式“Skill-Omni”，尝试将传统以文字说明为主的技能表达升级为“有图可依”的多模态经验库。该方案强调把图像等模态信息纳入Skill构建与调用过程，以提升复杂任务的理解、复用和执行能力，面向智能体技能沉淀与应用场景拓展。

国内量子位 · 4 天前 ★★★★★

刚刚，首个空间原生的具身视觉基模开源！机器人更会看我们的世界了

蚂蚁灵波宣布开源“首个空间原生的具身视觉基模”，面向机器人等具身智能场景，强调对真实三维空间与人类环境的视觉理解能力。该模型聚焦提升机器人对场景、物体及空间关系的感知水平，为导航、操作与人机协作等应用提供更强基础能力。

国内量子位 · 4 天前 ★★★★★

机器人视觉迎来新突破！蚂蚁灵波空间感知模型LingBot-Depth 2.0正式发布

蚂蚁灵波发布空间感知模型 LingBot-Depth 2.0，面向机器人视觉场景提升深度估计与三维空间理解能力。该模型旨在增强机器人在复杂环境中的感知、定位与交互表现，为导航、抓取和作业执行提供更稳定的视觉基础，显示具身智能底层感知技术持续迭代。

国内 36氪 AI · 4 天前 ★★★★★

蚂蚁灵波发布空间感知模型LingBot-Depth 2.0

7月7日，蚂蚁集团旗下具身智能公司灵波科技发布空间感知模型LingBot-Depth 2.0，基于1.5亿规模数据训练，在边缘清晰度、细小物体识别、远距离深度估计及复杂场景鲁棒性上升级；同时推出视觉基座模型LingBot-Vision，完善机器人从“看懂”到“看准”的视觉能力链路。

融资动态 27

国内 36氪 AI · 3 小时前 ★★★★★

“鹰瞰智翼”完成数千万元A轮融资

具身智能仿生扑翼飞行机器人公司“鹰瞰智翼”近期完成数千万元A轮融资，由元禾璞华领投，孚腾资本、厚雪资本跟投。这是公司三个月内完成的第三轮融资，资金将用于首款消费级产品量产备货、市场拓展、团队扩充，以及下一代具身智能扑翼机器人和流体仿真引擎研发。

媒体 The Verge AI · 12 小时前 ★★★★★

Nvidia’s biggest RAM supplier just had a trillion-dollar debut on Wall Street

受AI热潮带动内存需求增长，英伟达重要RAM供应商、韩国芯片制造商SK海力士在纽约上市，开盘价170美元，募资265亿美元，超过阿里巴巴创下外国公司在美最大IPO纪录。事件反映资本市场对AI基础硬件与存储产业链前景的强烈看好。

媒体 TechCrunch AI · 12 小时前 ★★★★★

SK Hynix raises $26.5B in the biggest foreign IPO in US history, is urged to build new US fabs

SK海力士完成约265亿美元募资，成为美国史上规模最大的外国企业IPO之一。受AI芯片需求激增推动，资本市场对存储与半导体供应链关注升温。报道同时提到，SK海力士与三星正被敦促在美国建设新晶圆厂，以强化本土制造能力并提升AI芯片供应安全。

国内 36氪 AI · 17 小时前 ★★★★★

SK海力士本周五登陆纳斯达克，募资265亿美元跻身大型IPO

韩国存储芯片巨头SK海力士将于本周五以ADR形式登陆纳斯达克，计划发行1.779亿份美国存托凭证，定价149美元，募资约40万亿韩元（约265亿美元）。此举将拓宽其全球融资渠道，提升国际投资者参与AI基础设施与存储芯片赛道的便利性。

国内 36氪 AI · 21 小时前 ★★★★★

德国推进退役核电站“向核聚变转型”战略，拟重塑欧洲工业核心竞争力

德国启动高风险科技投资，计划将两座因福岛事故后关闭的退役核电站改建为可控核聚变项目，以强化欧洲工业竞争力和能源自主。受战略带动，聚变初创企业融资升温，Proxima Fusion新获4.11亿欧元用于建设首个示范设施，谷歌和XTX Markets参投，Focused Energy今年5月也完成2.4亿美元融资。

国内 36氪 AI · 1 天前 ★★★★★

“Xspark AI”完成近亿元天使轮融资

可信物理智能企业“Xspark AI”（无界智航）完成近亿元天使轮融资，由鼎晖VGC、初心资本、SEE Fund无限基金联合领投，深圳天使母基金、水木校友种子基金等跟投。资金将用于核心技术研发、产品迭代及 Physical AI 的规模化落地。

国内 36氪 AI · 1 天前 ★★★★★

“聆思科技”完成近5亿元B轮融资

端侧AI推理芯片企业聆思科技完成近5亿元B轮融资，由安徽省与合肥市多家国资平台联合战略领投，深报一本、天智投资等机构跟投。资金将主要用于新一代端侧大模型AI推理芯片研发，推动产品体系由感知模型推理芯片向认知大模型推理芯片升级。

国内 36氪 AI · 1 天前 ★★★★★

上海仪电智算私募投资基金登记成立，出资额10.02亿

天眼查信息显示，上海仪电智算私募投资基金合伙企业（有限合伙）近日完成登记成立，出资额10.02亿元。该基金由华鑫宽众投资、上海晋成股权投资基金管理有限公司担任执行事务合伙人，经营范围涵盖股权投资、投资管理和资产管理，出资方包括上海国投先导人工智能基金、云赛智联等。

国内 36氪 AI · 1 天前 ★★★★★

“灵睿智芯”完成新一轮数亿元融资

灵睿智芯宣布完成新一轮数亿元融资，参投方包括张江高科、中科创星、东方富海、壁仞科技等产业机构，元禾璞华、上国投孚腾资本、华山资本等老股东继续加码。资金将用于高性能RISC-V内核应用落地、智能体CPU产品研发，以及AI原生融合计算架构的深化布局，后续融资也已启动。

国内 36氪 AI · 1 天前 ★★★★★

中国电信入股中科睿鉴

工商信息显示，北京中科睿鉴智能科技有限公司近日完成股权变更，中国电信集团投资有限公司新增入股，注册资本由约546.9万元增至562.5万元。中科睿鉴成立于2020年，业务涵盖软件开发、人工智能基础软件开发，公开资料显示其长期聚焦人工智能内容安全赛道。

国内 36氪 AI · 1 天前 ★★★★★

具身智能融资半年破900亿，投资逻辑从“后空翻”转向“搬砖头”

数据显示，2026年上半年国内具身智能赛道融资总额已超900亿元，同比增约5倍，融资事件超300笔、同比增137%，3月和6月单月均超60起，7月仍有多家企业披露10亿元级融资。市场关注点正从机器人炫技转向真实产品线验证、产业生态卡位与可替代性。

媒体 TechCrunch AI · 1 天前 ★★★★★

An AI agent startup just let its agent run its $100 million fundraise

企业级 AI 智能体创业公司 Lyzr 在融资过程中使用自家 AI 代理参与并推动一轮 1 亿美元融资。报道将此举视为其产品能力的直接展示，反映 AI 代理已从演示场景进入企业经营与资本运作流程，也凸显市场对相关赛道的关注。

媒体 TechCrunch AI · 1 天前 ★★★★★

Paris-based AI voice startup Gradium raises $100M seed, backed by Nvidia

法国巴黎AI语音初创公司Gradium宣布完成1亿美元种子轮扩展融资，定位为ElevenLabs竞争对手。现有信息显示，英伟达参与了本轮投资。此次大额早期融资反映出生成式语音赛道仍受资本关注，但披露内容暂未给出更多业务进展、产品细节或估值信息。

媒体 TechCrunch AI · 1 天前 ★★★★★

开源 AI 开发者工具 Ollama 宣布完成 6500 万美元融资。该工具主打让开发者在个人电脑上便捷运行 AI 模型，已在 GitHub 获得 17.6 万星标和近 1.7 万次分叉，用户规模接近 900 万，显示本地化模型运行与开发工具需求快速增长。

媒体 TechCrunch AI · 1 天前 ★★★★★

Nandan Nilekani leaves GP role at Fundamentum as it launches $200M third fund

印度风投机构 Fundamentum 启动规模 2 亿美元的第三期基金，继续聚焦印度市场的 AI 与金融科技初创公司。Infosys 联合创始人 Nandan Nilekani 不再担任普通合伙人，但仍作为基石投资人支持基金；同时机构正扩充领导团队，以推进新一轮投资布局。

国内 36氪 AI · 2 天前 ★★★★★

上汽金石等入股首形科技

首形科技（上海）有限公司近日完成工商变更，引入无锡上汽金石创新产业基金、金石深合（贵州）数字科技股权投资合伙企业等新股东，注册资本由约451.5万元增至约522.6万元。该公司成立于2024年6月，主营智能机器人研发与销售，现由创始团队及新增投资方共同持股。

国内 36氪 AI · 2 天前 ★★★★★

“深度智控”（DeepCtrls）完成数亿元人民币B轮融资

物理AI企业深度智控近期完成数亿元人民币B轮融资，由晶科能源战略投资，国投创新与招银国际联合领投，红杉中国、源码资本等老股东继续跟投。资金将用于核心物理AI算法和产品研发、标准化产品DeepBot规模化拓展，以及东南亚、中东、欧美市场布局。

媒体 TechCrunch AI · 2 天前 ★★★★★

Lovable reportedly in talks to double its valuation to $13.2B

据报道，AI初创公司 Lovable 正洽谈新一轮约3亿美元融资，投后估值有望升至132亿美元，较此前水平实现翻倍。本轮融资预计由 Menlo Ventures 领投，显示资本市场对其增长前景和AI相关业务模式的持续看好。

媒体 TechCrunch AI · 2 天前 ★★★★★

Prime Intellect raises $130M Series A to help enterprises build their own AI agents

Prime Intellect 完成 1.3 亿美元 A 轮融资，由 Radical Ventures 领投，公司成立仅两年，最新估值达 10 亿美元。该公司定位为帮助企业构建自有 AI 代理，反映出企业级智能体基础设施与定制化部署方向持续获得资本关注。

国内量子位 · 2 天前 ★★★★★

50FPS、成本打掉70%，魔芯MoWorld把世界模型带进产业时代

MoWorld聚焦世界模型产业化落地，宣称实现 50FPS 运行效率，并将相关成本降低约 70%，试图解决世界模型在真实业务部署中的算力与成本瓶颈。标题及片段显示其已获华为、联想等产业资本投资，反映出大厂对该方向商业化前景的关注。

媒体 TechCrunch AI · 2 天前 ★★★★★

AI chip maker SambaNova raises $1B at $11B valuation, 5 months after last mega round

AI 芯片公司 SambaNova 完成新一轮 10 亿美元融资，估值达到 110 亿美元，距离上一轮大额融资仅约 5 个月。报道同时提到，数月前曾传出英特尔试图以约 16 亿美元收购该公司的消息，显示其独立融资能力和市场预期显著提升。

国内 36氪 AI · 3 天前 ★★★★★

百度旗下基金等入股智元机器人旗下觅蜂科技

上海觅蜂具身智能科技有限公司近日完成工商变更，新增百度旗下三亚百川致新基金、云锋曜持、均普智能等股东，注册资本由500万元增至约528.8万元。觅蜂科技为智元机器人孵化的具身智能数据平台公司，主要提供具身智能数据服务，经营范围涵盖机器人研发、AI应用软件开发及数据处理等。

国内 36氪 AI · 3 天前 ★★★★★

蚂蚁集团完成对薄荷健康战略投资，持股超28%成最大外部股东

7月8日，蚂蚁集团与薄荷健康宣布达成战略投资合作。交易完成后，蚂蚁集团持股超过28%，成为薄荷健康最大外部股东，创始人兼CEO马海华仍为第一大股东。双方将围绕体重管理等核心场景共建专业级AI健康服务，首期功能已上线蚂蚁阿福App。

国内 36氪 AI · 3 天前 ★★★★★

“德睿智药”完成5200万美元B轮融资

AI驱动新药研发公司德睿智药宣布分阶段完成累计5200万美元B轮融资，由多家投资机构与产业基金共同投资，凯乘资本担任独家财务顾问。资金将用于迭代全链路AI制药引擎MAP，完善多智能体协同与临床数据闭环，并推进口服GLP-1RA小分子MDR-001的Ⅲ期临床开发和商业化，拓展创新药管线。

国内 36氪 AI · 3 天前 ★★★★★

Momenta港股上市，总市值突破700亿港元

7月8日，物理AI公司Momenta在港交所挂牌，代码6880.HK，开盘涨超6%，总市值突破700亿港元。按295.6港元/股定价，若超额配股权全额行使，全球发售约2293万股，募资总额约68亿港元。公司同时披露量产业务搭载规模已超过100万台。

媒体 TechCrunch AI · 3 天前 ★★★★★

Savi’s app aims to protect consumers from realistic AI scams like kidnappers demanding ransom

Savi 针对日益逼真的 AI 诈骗场景推出面向 iPhone 和 Android 的消费者应用，重点防范冒充绑匪索要赎金等高风险骗局。公司同时宣布完成 700 万美元种子轮融资，显示资本看好面向个人安全与反诈的 AI 应用市场需求。

媒体 TechCrunch AI · 4 天前 ★★★★★

US investors will soon get access to SK Hynix, another memory maker riding the AI boom

受益于AI带动的高带宽存储器等需求增长，韩国存储芯片厂商SK海力士迎来业绩与估值提升。报道称其将推进一笔规模达数十亿美元的美国IPO，最快于周五进行，为美国投资者提供直接参与AI硬件产业链的重要标的。

政策法规 19

媒体 The Verge AI · 18 小时前 ★★★★★

Instagram and Facebook will likely require a redesign after EU rules they’re ‘addictive’

欧盟委员会初步认定 Meta 违反《数字服务法》，认为 Instagram 和 Facebook 的“成瘾性”设计及风险评估、未成年人保护措施存在不足。若最终裁定成立，Meta 可能被要求调整两款应用的核心交互设计，并面临最高约 120 亿美元罚款。

国内 36氪 AI · 19 小时前 ★★★★★

国家网信办：截至6月30日累计有988款生成式人工智能服务完成备案

国家网信办披露，截至6月30日，全国累计988款生成式人工智能服务完成备案，598款通过API或其他方式调用已备案模型能力的应用或功能完成登记。2026年5月至6月新增120款生成式AI服务备案，另有68款相关应用或功能由地方网信办完成登记，显示监管备案与登记体系持续推进。

国内 36氪 AI · 1 天前 ★★★★★

广东：拟加快6G、光通信、卫星通信等关键前沿领域技术攻关

《广东省信息通信业“十五五”规划（征求意见稿）》公开征求意见，提出依托鹏城国家实验室和龙头企业，推动6G、光通信、卫星通信、量子通信、智能体通信等前沿技术攻关，研究空天地一体、通感算一体新型网络体系，并推进数字基带芯片、射频前端、6G模组等核心器件研发与产业化。

国内 36氪 AI · 1 天前 ★★★★★

A股注册制包容性改革驱动，港股科创企业掀起“回A”热潮

2026年以来，A股注册制包容性改革推动港股科创企业集中“回A”，已有超10家人工智能和创新药公司启动A股IPO申报或上市辅导。科创板“1+6”改革及创业板第四套上市标准，为未盈利港股企业提供合规回A通道，并促进沪深港市场规则、估值体系和信披机制进一步衔接。

媒体 TechCrunch AI · 1 天前 ★★★★★

New York Times says OpenAI hid evidence in ChatGPT copyright trial

《纽约时报》等新闻出版商在与 OpenAI 的版权诉讼中提出制裁动议，称其隐瞒可识别 ChatGPT 输出中受版权保护新闻内容的工具和数据集。此举使案件进一步升级，争议焦点集中在证据披露义务、训练数据来源及生成内容是否涉及侵权。

媒体 TechCrunch AI · 1 天前 ★★★★★

Google will now disclose which ads are made with AI

谷歌宣布将要求广告主披露广告中是否使用 AI 生成或数字篡改内容。此前这类披露义务主要适用于选举广告。新规延续其对误导性和欺骗性广告的限制，旨在让用户识别合成内容来源，提高广告透明度并降低被误导风险。

媒体 TechCrunch AI · 1 天前 ★★★★★

How did the government decide OpenAI’s frontier model was safe to release?

报道聚焦政府如何判断 OpenAI 前沿模型可安全发布，但现有披露信息有限。文中指出，政府与 Anthropic、OpenAI 之间围绕模型风险、测试与发布条件的具体沟通机制并不透明，外界尚无法清楚了解监管评估流程、标准及企业在安全承诺中的实际责任分工。

媒体 The Verge AI · 1 天前 ★★★★★

ICE agents are making house calls for online critics

报道称，美国移民与海关执法局人员开始上门接触在网上发表批评意见的人士。文章以一名从芬兰返美、入住纽约酒店后被前台通知有人找他的案例切入，指向执法部门对网络言论相关对象的线下接触与施压，引发对言论自由、执法边界及公民权利保护的关注。

国内 36氪 AI · 1 天前 ★★★★★

法国对英伟达反垄断调查接近尾声，最高或面临全球年度营收10%罚款

法国竞争管理局表示，对英伟达的反垄断调查已接近完成，预计将很快发出正式异议声明，指控其在GPU与AI云计算市场存在限制竞争行为。该调查始于2023年，曾突击检查其法国分部；若最终认定违法，英伟达最高或被处以全球年度营收10%的罚款。

国内 36氪 AI · 2 天前 ★★★★★

商务部等9部门：推动消费券发放、结算等环节使用数字人民币

商务部等9部门发布关于加快零售业创新发展的意见，提出支持零售主体开展进销存、物流配送等全链条数字化改造，推动平台向中小商户技术赋能与资源共享，鼓励第三方开发数字化管理系统；同时推广“人工智能+”在智能导购、低空配送、无人售货等场景应用，并推动消费券发放和结算使用数字人民币。

官方/研究 OpenAI Blog · 2 天前 ★★★★★

Our approach to government and national security partnerships

OpenAI介绍其与政府及国家安全机构合作的总体方法，强调在公共安全、民主问责和负责任使用框架下推进AI应用。内容聚焦合作原则与治理边界，旨在说明其在敏感公共部门场景中的部署思路、风险控制要求及政策立场。

国内 36氪 AI · 2 天前 ★★★★★

工信部发布关于防范AI编程工具Claude Code安全后门隐患的风险提示

工信部网络安全威胁和漏洞信息共享平台发布风险提示称，Anthropic 开发的 AI 编程工具 Claude Code 存在严重安全后门隐患。受影响版本为 2.1.91 至 2.1.196，因内置监控机制，可能在未经用户同意情况下向远程服务器回传地域、身份标识等敏感信息。

国内 36氪 AI · 3 天前 ★★★★★

报道称特朗普政府解除对OpenAI的GPT 5.6的限制

据财联社援引报道，特朗普政府已解除对 OpenAI GPT 5.6 的相关限制，美国商务部同时批准其更广泛推出该先进模型。这意味着该模型在美国的发布和应用范围有望扩大，相关审批障碍阶段性消除，或影响后续大模型商业化部署节奏。

国内 36氪 AI · 3 天前 ★★★★★

上海：引导社会力量建设3—5家新型研发机构，新增一批农业产业领域上市企业

上海发布推进乡村全面振兴“十五五”规划，提出围绕农业产业需求组织高校、科研院所与涉农企业联合攻关，贯通基础研究、应用开发和成果转化。规划强调支持涉农科技企业联动高端装备、人工智能企业开展集成创新，建设全国性农业科技应用场景，并引导社会力量新建3至5家研发机构，培育上市与科技型农业企业。

媒体 The Verge AI · 3 天前 ★★★★★

ABC tells the government to get out of its newsrooms

美国广播公司就联邦通信委员会调查《观点》节目播出政治候选人内容一事致函回应，称FCC针对被视为对现政府不友好的节目展开审查，可能干预新闻编辑独立与媒体自主决策。事件焦点在监管机构是否越权介入新闻节目编排及其对媒体环境的潜在影响。

国内 36氪 AI · 3 天前 ★★★★★

SpaceX旗下Colossus数据中心遭关停令，450亿美元协议面临风险

诉讼要求法院下令SpaceX关闭为Colossus 2数据中心供电的燃气轮机，指其在未取得必要许可情况下运行。若法院支持，相关设备或在补办许可期间停运，可能影响数据中心供电，并波及SpaceX与Anthropic一项价值450亿美元协议的部分履约安排。

国内 36氪 AI · 3 天前 ★★★★★

网传“7月1日新规：新车智驾芯片自主化率不低于70%”系谣言

近日网传“7月1日起新车智驾芯片自主化率不低于70%”并称系工信部联合市监总局发布强制新规。经工信部核查，相关《新能源汽车车规级AI芯片技术规范》文件并不存在，主管部门也从未对新能源车芯片技术自主化率作出上述规定，该消息为不实信息。

国内 36氪 AI · 3 天前 ★★★★★

广东省新增11款已完成登记的生成式人工智能服务

据网信广东消息，截至7月7日，广东省新增11款已完成登记的生成式人工智能服务，使全省完成登记的生成式AI服务累计达到64款。该信息反映地方生成式AI服务备案登记工作持续推进，合规管理覆盖范围进一步扩大。

国内 36氪 AI · 4 天前 ★★★★★

防范系统性风险与理财越界，英监管机构评估纳管AI金融服务

英国金融市场行为监管局委托评估指出，ChatGPT、Claude、Gemini等大模型正日益影响消费者财务决策，监管机构因此被敦促考虑将其纳入金融服务监管范围。FCA官员同时警示，行业对少数技术供应商的高度依赖，可能引发系统性风险与理财服务越界问题。

研究论文 194

媒体 Hacker News · 11 小时前 ★★★★★

GPT-5.6 Sol Ultra produces proof of the Cycle Double Cover Conjecture [pdf]

一篇题为《GPT-5.6 Sol Ultra 证明循环双覆盖猜想》的 PDF 在网络传播，并引发社区讨论。该猜想是图论中的经典难题，若证明成立将具有较高学术价值。当前信息主要来自论文链接与社交平台评论，尚未见权威同行评审结果或正式学术确认，真实性与严谨性仍待进一步核验。

媒体 Hacker News · 22 小时前 ★★★★★

AI-generated videos to maximally drive a target brain region

EPFL 的 NEVO 项目展示一种以神经反应为目标的视频生成方法，核心思路是通过优化生成内容，最大化激活特定脑区。当前公开信息主要来自项目页面与社区讨论，文段未披露完整实验细节、模型架构及商业化安排，但可归入神经科学与生成式 AI 交叉方向的研究探索。

媒体 MIT Tech Review AI · 1 天前 ★★★★★

Anthropic found a hidden space where Claude puzzles over concepts

Anthropic 开发名为 Jacobian lens 的新技术，用于观察大语言模型在回答问题和执行任务时的内部表征与推理过程，被称为迄今最清晰的“模型内部视角”之一。研究显示，模型会在隐藏空间中组织概念并进行中间推演，结果既揭示常规机制，也暴露出一些令人不安的潜在行为特征。

论文 arXiv AI · 1 天前 ★★★★★

UniClawBench: A Universal Benchmark for Proactive Agents on Real-World Tasks

UniClawBench 是面向主动式智能体的通用评测基准，聚焦真实动态环境中的五项底层能力：技能调用、探索、长上下文推理、多模态理解和跨平台协同。该基准包含 400 个双语真实任务，在实时 Docker 容器中以分步检查点评估，并引入执行器、隐藏监督者与用户组成的闭环多轮评测框架，同时对比多种模型与代理框架以区分基础模型能力和框架设计影响。

论文 arXiv AI · 1 天前 ★★★★★

OpenCoF: Learning to Reason Through Video Generation

OpenCoF 提出面向视频生成推理的研究框架，围绕“帧链式推理”构建包含 11 类任务的 OpenCoF-17K 数据集，并基于 Wan2.2-I2V-A14B 微调得到 Wan-CoF。在四项视频推理基准上，模型较基线显著提升；研究还引入视觉与文本推理 token，分析其在时空推理和中间状态组织中的作用，相关数据、模型与代码已开源。

论文 arXiv AI · 1 天前 ★★★★★

Ideas Have Genomes: Benchmarking Scientific Lineage Reasoning and Lineage-Grounded Idea Generation

论文提出 IdeaGene-Bench，用于评测 AI 的科学谱系推理与基于谱系的创意生成能力。该基准以 Idea Genome 和 GenomeDiff 表示论文间继承、变异与创新关系，覆盖10个学科，包含1961条谱系轨迹等数据，并设置 IG-Exam 与 IG-Arena 两类评测。对14个基于大模型的“AI 科学家”测试显示，最优系统谱系推理准确率仅27.3%。

论文 arXiv AI · 1 天前 ★★★★★

Score Accuracy Along the Forward Diffusion Does Not Certify Numerical Stability in Diffusion Sampling

论文指出，扩散模型中沿前向扩散分布的分数误差很小，并不能保证反向采样数值稳定。作者构造出在路径空间上接近真实过程、且前向边际误差趋零的平滑分数字段，但其欧拉采样仍出现各阶矩发散、Wasserstein距离发散。针对紧支撑数据，论文提出对去噪器做凸集投影，可保持精度并改善矩界与收敛性。

论文 arXiv AI · 1 天前 ★★★★★

MulTTiPop: A Multitrack Transcription Dataset for Pop Music

MulTTiPop 是面向自动音乐转录评测的流行音乐多轨数据集，包含 572 段、共 3.5 小时音频及对应多轨 MIDI，覆盖 1930 年代至 2000 年代多种风格。数据通过 Lakh MIDI 与 TheoryTab 的元数据匹配、人工对齐锚点、节拍跟踪与 MIDI 时间校正构建。基准测试显示现有最优模型 Onset F1 仅 38%，仍有明显提升空间。

论文 arXiv AI · 1 天前 ★★★★★

SLORR: Simple and Efficient In-Training Low-Rank Regularization

论文提出训练期低秩正则化框架 SLORR，强调无状态、保持原模型架构，并避免对大权重矩阵做昂贵 SVD。方法基于 Hoyer 稀疏度和核范数两种变体，利用适合 GPU 的前反向近似实现低秩约束。在 ResNet、ViT 及 1.35 亿和 5.6 亿参数级 LLM 预训练中，SLORR 在训练开销不足 8% 或平均不足 1% 的情况下，显著提升模型压缩后的性能保持。

论文 arXiv AI · 1 天前 ★★★★★

Using AI-based Learning Assistants in Higher Education: A Large-Scale Descriptive Analysis

研究基于7.75万名远程高等教育学生的客观日志数据，对AI学习助手Syntea的实际使用情况进行大规模描述性分析，比较了性别、年龄、学科集群、学位类型和学习模式下的差异。结果显示该工具已融入不少学生的学习流程，但不同人群与结构情境中的使用模式存在明显差别。

论文 arXiv AI · 1 天前 ★★★★★

Dimensionality Reduction Meets Network Science: Sensemaking on UMAP's kNN Graph

论文关注 UMAP 在降维过程中内部构建的 kNN 图，而非仅使用其二维嵌入结果。作者将 PageRank、k-core 分解和聚类系数等图算法应用于该图，用于识别代表性样本、区分核心与边缘区域及发现高相似邻域，并在 MNIST 与 Fashion MNIST 上进行定量和定性验证，结果显示其效果可与 k-medoids、HDBSCAN 等专用方法互补或相当。

论文 arXiv AI · 1 天前 ★★★★★

AUTOPILOT VQA: Benchmarking Vision-Language Models for Incident-Centric Dashcam Understanding

AUTOPILOT-VQA 提出面向行车记录仪视频理解的事故中心视觉问答基准，聚焦自动驾驶系统对安全关键事件的推理能力评估。数据集围绕真实事故与险情设计结构化问题，覆盖天气光照、道路环境、标识、涉事主体、碰撞位置及可避免性等维度，并作为 AUTOPILOT CVPR 2026 竞赛的一部分发布。

论文 arXiv AI · 1 天前 ★★★★★

ARDY: Autoregressive Diffusion with Hybrid Representation for Interactive Human Motion Generation

ARDY 是一套面向交互式 3D 人体动作生成的流式框架，结合显式根部特征与潜在身体嵌入的混合表示，并采用两阶段自回归 Transformer 去噪器，在保持实时推理的同时支持在线文本提示和长时域运动学约束控制。论文在 HumanML3D 与 Bones Rigplay 数据集上验证了动作质量与约束满足能力，并展示了交互式演示、代码和模型发布。

论文 arXiv AI · 1 天前 ★★★★★

Workflow as Knowledge: Semantic Persistence for LLM-Mediated Workflows

论文提出面向LLM工作流的“语义持久化”概念框架，将工作流定义、实例、推理记录、上下文快照与依赖关系表示为共享知识基底中的持久知识对象。其核心区分 derive 与 infer：前者是基于现有状态的确定性计算，后者是在声明上下文和能力策略约束下由 LLM 执行的判断，从而使工作流可检查、可恢复、可审阅。

论文 arXiv AI · 1 天前 ★★★★★

The Illusion of Equivalency: Statistical Characterization of Quantization Effects in LLMs

论文指出，大语言模型后训练量化的评估长期依赖准确率和困惑度，难以发现行为层面的变化。作者提出“正确性一致率”指标，衡量原模型与量化模型在正确预测上的重合度；在8位到2位多种量化设置中发现，中等量化下即使总体性能接近，行为分歧已出现，并识别出注意力层中Q、K投影较V、O更敏感及低比特下的非线性断点。

论文 arXiv AI · 1 天前 ★★★★★

Super Weights in LLMs and the Failure of Selective Training

论文研究大语言模型中的“超级权重”是否适合被单独训练。结果显示，在 OLMo-1B 和 OLMo-7B 中，仅训练 100 至 8192 个超级权重会使准确率降至接近随机猜测，扩展到 3.6 万邻域参数也无明显改善；相比之下，随机选择同层参数或采用 LoRA 的低秩层级更新则能有效微调，说明参数重要性并不等同于可孤立训练性。

论文 arXiv AI · 1 天前 ★★★★★

Validity of LLMs as data annotators: AMALIA on authority

论文评估葡萄牙公共资助欧洲葡语大模型 AMALIA-9B 作为数据标注器的有效性。其在“权威”道德基础标注上与人工编码一致性接近更大开源模型，但在将整体提示拆解为理论条款后，性能仅恢复约一半，显示其可能依赖表层相关线索而非真正遵循理论构念；对照的多语种开源模型在同一语料上表现更稳健。

论文 arXiv AI · 1 天前 ★★★★★

Pose-to-Biomechanics: Bridging 3D Human Pose Estimation and Biomechanical Attribute Prediction

论文提出 BioModule，一种可接在任意3D人体姿态估计器后的轻量级时序Transformer，基于17关节骨架预测生物力学属性。研究还构建并对齐 Human3.6M 与 Human3.6Mplus 的大规模标注数据，支持逐帧跨模态监督，并在7种先进姿态估计器上系统评测上游姿态误差对下游生物力学预测精度的影响。

论文 arXiv AI · 1 天前 ★★★★★

Latent Memory Palace: Reasoning for Control as Autoregressive Variational Inference

论文提出 Latent Memory Palace（LMP）框架，将连续控制中的“推理”建模为自回归潜变量空间中的变分推断，通过迭代检索实现自适应决策。作者进一步给出潜空间强化学习方法优化变分下界，使策略 LMP-π 在仿真与真实场景中取得较强表现，并支持可解释的测试时算力分配；同时，LMP-tok 作为可变长度动作分词器提升了下游自回归策略性能。

论文 arXiv AI · 1 天前 ★★★★★

Deep Learning for Joint Narrowband Interference Cancellation and Soft Demodulation in OFDM Systems

论文提出面向 OFDM 系统的联合深度学习框架，同时完成窄带干扰消除与软解调。NBI-CNet 以单次前向推理估计并去除多音干扰，在未知干扰源数量下较 EOMP-IDS 最多降复杂度 60%；LLR-CNet 对残差进行结构化白化，提升软信息可靠性。仿真显示，该方法可消除传统方案误码地板，在强干扰下接近最优迭代基线，并具备跨 FFT 尺寸泛化能力。

论文 arXiv AI · 1 天前 ★★★★★

Remember When It Matters: Proactive Memory Agent for Long-Horizon Agents

论文提出面向长时程智能体的主动记忆机制，定义“行为状态衰减”问题：关键任务状态随轨迹扩展被埋没或超出上下文窗口。作者引入与动作智能体并行的记忆代理，维护结构化记忆并按需注入提醒。在 Terminal-Bench 2.0 和 τ²-Bench 上分别带来 pass@1 提升 8.3 和 6.8 个百分点，消融显示选择性干预优于被动检索与持续注入。

论文 arXiv AI · 1 天前 ★★★★★

LTM: Large-scale Terrain Model for Wildfire-prone Landscapes

该论文提出面向野火高风险区域的大规模地形重建框架 LTM，利用过时 DEM 作为几何先验，结合图像进行多模态 3D 重建，并通过基于物理的像素级对齐替代高成本特征匹配。作者还构建真实区域仿真器进行评测，结果显示在保持实时性能的同时，深度图重建精度与计算效率均优于现有方法。

论文 arXiv AI · 1 天前 ★★★★★

MPFlow: Learning Budgeted Max-Flow Optimization on the Lightning Network with Deep Graph Reinforcement Learning

论文提出 MPFlow，面向比特币闪电网络中的流动性配置问题，在固定预算下选择新增通道以最大化节点路由能力。方法将任务建模为预算约束下的图组合优化，并结合消息传递策略网络、PPO 与动作掩码训练强化学习代理；在真实网络快照上优于多种启发式基线，且已用于生产环境，支持 30 个节点完成 4640 次开通决策。

论文 arXiv AI · 1 天前 ★★★★★

Do You Need a Frontier Model as a Citation Verifier? Benchmarking Rubric LLMs for Deep-Research Source Attribution

论文评测 3 个模型家族的 8 个现成 LLM 作为深度研究系统引用质量裁判的能力，在 1248 个标注决策上比较来源相关性与事实支撑两项指标。结果显示低成本模型如 GPT-5-mini 在来源相关性上表现领先，事实支撑差异不显著，但不同裁判在通过率漂移、误报和漏报上偏差明显，说明将引用评分用于强化学习奖励前必须先做校准。

论文 arXiv AI · 1 天前 ★★★★★

ProjAgent: Procedural Similarity Retrieval for Repository-Level Code Generation

论文提出面向仓库级代码生成的 ProjAgent，引入“过程相似性”作为显式检索信号。系统先将目标函数拆解为中间推理步骤，再以代理式流程逐步检索具有相似实现过程的仓库函数，并结合语义检索与静态分析反馈迭代修复代码。在 REPOCOD 上，ProjAgent 的 Pass@1 达到 41.14%，优于现有检索式基线。

论文 arXiv AI · 1 天前 ★★★★★

A Practical Investigation of Training-free Relaxed Speculative Decoding

论文系统研究无需额外训练的宽松投机解码，将多种方法纳入统一框架，并在当代大模型推理场景下进行基准测试。结果表明，相比严格保持分布一致的无损投机解码，宽松方案虽可换取更高速度或能力收益，但需额外开展能力退化评估，且往往依赖较强起草模型，不适合轻量级专用多词预测草稿器。

论文 arXiv AI · 1 天前 ★★★★★

SolarChain-Eval: A Physics-Constrained Benchmark for Trustworthy Economic Agents in Decentralized Energy Markets

论文提出面向去中心化能源市场的可信经济智能体评测基准 SolarChain-Eval，将市场治理建模为兼容 Gymnasium 的马尔可夫决策过程，按小时评估策略在市场效用、物理安全、滑点、动作平滑性、空间公平性与可审计性等维度表现，并引入基于大模型的 Planner/Auditor 记录干预日志。实验显示强化学习可提升效用，但仍可能产生不安全行为。

论文 arXiv AI · 1 天前 ★★★★★

Resample or Reroute? Budget-Aware Test-Time Model Selection for Large Language Models

论文提出“预算感知”测试时模型选择框架，将对已选大模型重复采样与改路由到其他模型视为共享单次查询成本预算的两种竞争策略，并设计在线 RoR 分配策略，依据单位成本带来的正确率边际增益动态决策。基于11个开源模型、4个基准的回放实验显示，该方法在成本-质量帕累托前沿上优于单路由、best-of-K、级联等基线，但效果明显依赖验证器质量。

论文 arXiv AI · 1 天前 ★★★★★

WebSwarm: Recursive Multi-Agent Orchestration for Deep-and-Wide Web Search

论文提出 WebSwarm，用递归式多智能体编排框架提升基于大模型的网页搜索能力。系统通过动态生成搜索节点，将任务分解、递归扩展与协作搜索结合，并依据网页信息组织方式引导扩展、复用同类节点经验。在多个深度、广度及混合搜索基准上，其表现持续优于单智能体和现有多智能体方案。

论文 arXiv AI · 1 天前 ★★★★★

EdgeRefine: Privacy-Utility Balance for Graphs via Jaccard Sampling under Edge Differential Privacy

论文提出面向图数据边级差分隐私的本地隐私框架 EdgeRefine，通过基于 Jaccard 相似度估计边存在概率、对噪声边进行排序移除，并结合隐私预算 ε 分别采样真假边及采样率 k 控制总边数，在隐私保护与图学习性能间取得更优平衡。实验显示其在节点分类与图分类任务上显著优于现有隐私方法，并对图重构攻击具备较强鲁棒性。

论文 arXiv AI · 1 天前 ★★★★★

Formal Mechanisms for Market Stability in Self-Interested Agent Societies: A Marketplace Simulation Study

论文通过18个基于 DeepSeek-V3 的大模型代理市场仿真，研究在自利代理社会中维持市场稳定所需的正式机制。作者比较8种机制在200轮、逐步注入捣乱者条件下的表现，发现“调解”机制最优；进一步用提示优化的对抗性代理红队攻击，最强版本仅使诚实代理效用下降13.3%，未能击溃市场，显示其具备较强鲁棒性。

论文 arXiv AI · 1 天前 ★★★★★

Secure Decentralized Federated Learning via Gossip and Virtual Voting

论文提出去中心化联邦学习框架 gspDAG-FL，将模型传播所用的点对点 gossip 历史直接用于共识构建。方案通过拓扑 DAG、虚拟投票和全节点证书实现模型来源终局性，并结合载荷校验、接收证明校验和私有语义审计提升对拜占庭及惰性节点的鲁棒性。实验在 MNIST 和 Penn Treebank、最高 100 节点网络中显示，其学习效果接近账本式联邦学习，同时降低协调开销并提升吞吐。

论文 arXiv AI · 1 天前 ★★★★★

Multi-Modal, Multi-Environment Machine Teaching for Robust Reward Learning

论文研究面向多环境部署的鲁棒奖励学习，指出传统单环境、仅示范式 IRL 易将奖励与环境动力学耦合，导致跨场景泛化不足。作者从理论上比较多种反馈模态，证明在无限数据下偏好比较提供更强全局约束，并提出分层机器教学算法，先选择信息量高的环境，再在其中查询低成本反馈，在相同预算下显著降低遗憾并提升留出环境泛化。

论文 arXiv AI · 1 天前 ★★★★★

UltraX: Refining Pre-Training Data at Scale with Adaptive Programmatic Editing

论文提出面向大规模预训练语料的数据精修框架 UltraX，通过函数调用式编辑补全“插入、删除、修改”操作空间，实现实例级细粒度优化。方法包含自适应提示优化、文本对齐映射、动态上下文替换及低置信过滤等机制，在多语料实验中以更少训练 token 获得更优或相当表现，提升数据效率与执行可靠性。

论文 arXiv AI · 1 天前 ★★★★★

BiSCo-LLM: Lookup-Free Binary Spherical Coding for Extreme Low-Bit Large Language Model Compression

论文提出 BiSCo-LLM，一种面向大语言模型极低比特压缩的无码本二进制球面编码框架。方法将局部权重映射到单位超球并二值化为紧凑球面码，再用残差 BSQ 编码重建误差，并结合按模块类别的恢复蒸馏降低组装后模型失配；另设少量 8 位保护通道稳定敏感参数，整体预算计入二进制码、解码器、LoRA 与元数据。

论文 arXiv AI · 1 天前 ★★★★★

DominoTree: Conditional Tree-Structured Drafting with Domino for Speculative Decoding

论文提出用于投机解码的训练免费方法 DominoTree，在 Domino 草稿器基础上以最佳优先树搜索结合条件化、非因子化路径校正，并通过限制候选 top-M 与 GPU 原生 CUDA 图构树降低开销。在 Qwen3-4B/8B 多基准测试中，最高实现 6.6 倍加速、单轮接受长度达 10.7 个 token，整体吞吐优于 Domino、DDTree 与 CaDDTree。

论文 arXiv AI · 1 天前 ★★★★★

Steering Neural Network Training through Interpretable Constraints Based on Partial Dependence

论文提出一种基于部分依赖的可解释约束训练方法，在神经网络学习过程中引入函数形式的领域知识，使模型对特征的平均响应符合先验规律。该方法面向回归任务与动态系统预测，实验显示其较无约束模型具备更好性能与数据效率，且生成的解释与用户知识更一致。

论文 arXiv AI · 1 天前 ★★★★★

The complexities of patient-centred conversational artificial intelligence

研究分析2053条真实患者与健康聊天机器人对话，发现用户在情绪表达、沟通方式和叙事策略上差异显著。作者据此构建可分离建模临床内容、情绪状态、交流策略与风格的患者模拟器，并在1164个病例中评估4种大模型分诊表现，结果显示沟通风格会显著影响紧急程度判断。

论文 arXiv AI · 1 天前 ★★★★★

When Structured Sparse Autoencoders Learn Consistent Concepts Across Modalities

论文提出结构化稀疏自编码器 S²AE，面向视觉语言模型中传统 SAE 难以学习跨模态一致概念的问题，引入基于注意力相似性与空间邻近的图像分组，以及组间互斥稀疏和组内组稀疏正则。在 Qwen2.5-VL-7B-Instruct 上，方法在保持 99% 以上重构保真度下提升语义对齐、表征效率及跨模态单义性。

论文 arXiv AI · 1 天前 ★★★★★

Towards Precision Therapy in Hepatocellular Carcinoma: A Clinical-Reasoning LLM for Risk Stratification and Treatment Guidance

研究提出面向肝细胞癌精准治疗的临床推理大模型 HCC-STAR，可读取电子病历叙述并联合输出风险分层、符合指南的治疗排序及个体化生存预测。基于约3万例 SEER 数据扩展训练，并在中国12家医院6668例多中心队列中验证，治疗推荐与分层效果优于指南、GPT-5 和 Gemini-2.5 Pro。

论文 arXiv AI · 1 天前 ★★★★★

It Takes a MAESTRO To Prune Bad Experts

论文提出面向稀疏激活 MoE 语言模型的结构化剪枝框架 MAESTRO，将自回归专家激活轨迹建模为遍历马尔可夫链，用平稳分布刻画跨层路由依赖，从而获得全局感知的专家重要性评估。在安全、偏见、伦理等五类任务上，MAESTRO 在 50% 压缩率下平均性能保持率最高提升 10.61%，且跨任务波动更低。

论文 arXiv AI · 1 天前 ★★★★★

Federated Deep Learning for Privacy-Preserving Cardiovascular Disease Risk Prediction

研究提出一种面向心血管疾病风险预测的联邦深度学习方法，在不共享患者级数据前提下联合 Lifelines 与 Rotterdam Study 两个异质队列建模。结果显示，相比各机构本地训练，联邦训练的深度生存模型在两队列上均提升预测表现，Rotterdam 队列 C-statistic 由 0.728 升至 0.739，Lifelines 由 0.783 升至 0.787。

论文 arXiv AI · 1 天前 ★★★★★

Robust Bayesian Decision Making under Adversarial Uncertainty

论文研究对抗不确定性下的贝叶斯决策实验设计，针对传统决策感知方法依赖模型设定正确、易受隐藏因素扰动的问题，提出面向序贯数据采集的鲁棒贝叶斯设计准则。该方法以最坏情况下的对抗变量变化建模意外效应，优化决策稳定性而非名义最优性，并在合成与真实科学数据上验证了更高可靠性。

论文 arXiv AI · 1 天前 ★★★★★

Spectral Stability of Pseudoinverse-Based Extreme Learning Machine

论文从谱分析角度研究基于 Moore-Penrose 伪逆求解输出权重的极限学习机稳定性，指出隐藏层矩阵最小奇异值决定扰动放大程度，条件数可量化不稳定性。文中比较了基于 SVD 的伪逆计算与迭代 hyperpower 方法，并结合随机特征视角分析网络宽度与病态条件的关系。实验表明，SVD 方法在病态矩阵下更稳健。

论文 arXiv AI · 1 天前 ★★★★★

ImputeViz: A Visual Analytics Dashboard for Diagnosing Missing Data and Comparing Imputation Methods

论文提出可视分析仪表板 ImputeViz，用于诊断缺失模式、配置插补模型并比较结果，集成 MICE、随机森林、XGBoost、kNN 等方法。系统新增结合空间与社会经济距离的 gKNN，支持地理推理与捐赠样本溯源，并通过热图、共缺失概览、分布诊断及误差指标帮助分析人员评估不同插补策略的稳健性。

论文 arXiv AI · 1 天前 ★★★★★

SHAP-Weighted Cross-Modal Expert Fusion for Emotion and Sentiment Recognition: Evidence and Limits

论文研究基于 TreeSHAP 的可解释自适应多模态融合方法，分析不同 SHAP 归约方式在专家特征维度不均衡时的影响。结果显示，sum-abs 能保留跨模态专家贡献，在 MELD 情感识别上几乎追平早期融合，并显著优于晚期融合；在 CMU-MOSEI 情感倾向任务上也略优于早期融合。增益主要来自加入跨模态尤其三模态专家。

论文 arXiv AI · 1 天前 ★★★★★

SMetric: Rethink LLM Scheduling for Serving Agents with Balanced Session-centric Scheduling

论文提出面向智能体服务场景的 LLM 调度方法 SMETRIC。作者基于两类真实轨迹发现，现有缓存感知调度为提升 KV 复用常致少数实例过载、整体 TPS 受限。SMETRIC 采用“会话首请求负载均衡、后续请求缓存感知路由”的会话中心策略，在保留本地 KV 复用的同时改善集群均衡，使集群 TPS 提升 10%至16%，预填充 TPS 提升 2%至34%，且逐 token 延迟更优。

论文 arXiv AI · 1 天前 ★★★★★

Contravariance Theory: Strong Alignment for Minimal Solutions to Hard Tasks

论文提出“逆变理论”，研究在足够困难任务上两个最小化深度神经网络解之间的表征关系。作者证明，若基于仿射映射的“弱对齐”成立，则特权轴会实现“强对齐”，且这种对齐会沿网络层级逐步“拉链式”传播，解释端到端任务优化中关键表征轴的涌现，并讨论其对脑网络与DNN比较及趋同演化的意义。

论文 arXiv AI · 1 天前 ★★★★★

CAAD: Causality-Aware Multivariate Time Series Anomaly Detection via Multi-Scale Alignment and Structural Causal Consistency

论文提出面向工业复杂系统的多变量时间序列异常检测框架 CAAD，将异常检测重构为对格兰杰因果一致性的持续验证。方法以外生变量残差刻画外部干预，结合多尺度对齐建模系统动态，并用基于梯度的矩阵监测内部因果关系破坏，在真实工业数据集上取得优于多数现有方法的高精度表现。

论文 arXiv AI · 1 天前 ★★★★★

CommuniWave:A Machine Learning Model for Quantifying the Degree of Temporary Informal Behavior in Urban Communities

研究提出面向城市社区治理的机器学习模型 CommuniWave，用于从街景视频中检测并量化居民临时性、非正式行为程度。系统结合基于 mmaction2 的行为识别网络、自研 YOLOv10 检测模型和随机森林评估模块，生成行为波动图，支持社区动态监测与更精细的韧性治理决策。

论文 arXiv AI · 1 天前 ★★★★★

Structural Bottlenecks on Frequency Representation in End-to-End Audio Models

论文分析端到端音频模型中多种先进步幅卷积编码器的频率表征能力，指出其存在两类结构性瓶颈：将时频局部基元压缩为混叠等价类、限制滤波器频率分辨率。在受控实验中，基元塌缩率达31%-35%，滤波器带宽高出理论上限10-35倍。作者提出无需重训的 GLRF 方法，将潜变量重构到频率局部基底，在保持重建质量的同时提升音高等属性可控性与可解释性。

论文 arXiv AI · 1 天前 ★★★★★

VocaDet: Sample-Driven Open-Vocabulary Object Detection and Segmentation via Visual Tokenization and Vector Database Retrieval

论文提出开放词汇检测与分割框架 VocaDet，可直接利用用户提供的正负样本学习目标概念，无需重新训练模型。方法基于 DINOv3 提取特征，经聚类生成多粒度视觉词元，并结合向量数据库进行可扩展检索匹配，实现目标定位与分割；同时加入背景过滤机制以提升固定摄像机场景效率。

论文 arXiv AI · 1 天前 ★★★★★

Improving Ad-hoc Search Effectiveness for Conversational Information Retrieval via Model Merging

论文提出将模型合并用于会话式信息检索，作为无需额外训练的统一检索方案，以缓解传统微调成本高和灾难性遗忘问题。作者基于 Model Soup 与 Slerp 等线性、非线性参数合并方法，在标准即席搜索与会话检索数据集上验证，零样本条件下 NDCG@3 最高提升 15%，同时增强会话检索模型的即席搜索能力与跨数据集泛化性。

论文 arXiv AI · 1 天前 ★★★★★

DocMaster: A Hierarchical Structure-Aware System for Document Analysis

DocMaster 是一套面向复杂文档分析的层级结构感知系统，针对现有方法将论文、手册和财报等文档切成纯文本片段、丢失章节、表格、图片和公式结构的问题，构建保留原始布局的文档树与结构化语义索引，支持文档筛选和基于筛选结果的问答，并提供可上传文档集、建立多视图索引和交互分析的网页演示。

论文 arXiv AI · 1 天前 ★★★★★

High-Dimensional Procrustes Matching via Tree Counts

论文研究高维 Procrustes 匹配问题：给定两组经未知置换与旋转后仍具相关性的高斯向量，目标是恢复对应置换。作者提出一种基于“宽树”加权计数的多项式时间精确恢复算法，在 d 至少为 polylog(n) 且 ρ²>√α（α≈0.338）时高概率成功；同时给出更强的信息论可恢复边界，并用低阶分析说明该阈值对树计数方法可能近乎必要。

论文 arXiv AI · 1 天前 ★★★★★

When the Judge Changes, So Does the Measurement: Auditing LLM-as-Judge Reliability

论文将“更换评审模型导致评分变化”定义为测量有效性问题，在四个判断数据集上审计 LLM-as-judge 的可靠性。结果显示，评审升级并不可互换，Qwen3 从 1.7B 升至 4B 才表现出稳健相邻增益，MiniMax 相邻 API 版本未见类似改进；更强评审虽能降低位置与冗长度偏差，但无法根除，并提出应补充切片、偏差探针、误差相关性与协议审计日志。

论文 arXiv AI · 1 天前 ★★★★★

AI-guided stimuli discovery and generation to optimize facial emotion perception studies in autism

研究提出一种AI引导的刺激发现与生成框架，用于优化自闭症人群面部情绪感知实验。作者训练分别预测自闭症与典型发育成人图像级判断的神经网络，筛选出最能放大群体差异的新面孔，并结合GAN将高诊断性图像转化为更易达成一致的版本，验证中分别放大或缩小了行为差异。

论文 arXiv AI · 1 天前 ★★★★★

Stop Guessing When to Stop Testing: Efficient Model Evaluation with Just Enough Data

文章提出以序贯检验替代固定样本基准测试，构建可自适应停止的模型评测框架，面向模型排序、模型选择和开发期测试等不同目标，在效率与统计可靠性之间进行权衡。作者在 Open VLM Leaderboard 上验证，该方法在保持统计显著性的同时，可将评测计算成本最高降低约80%。

论文 arXiv AI · 1 天前 ★★★★★

Systematic Evaluation of Learning Rate Scheduling Strategies Across Heterogeneous Architectures

论文系统评估学习率调度策略对异构神经网络训练效果的影响，在 LEMUR 数据集的 30 种卷积与 Transformer 架构上，通过自动代码注入测试 9 类 PyTorch 调度器家族下 25 种配置，共评估 3938 个 CIFAR-10 模型变体。结果显示调度器效果高度依赖架构，CosineAnnealingWarmRestarts 与 CyclicLR 整体优于基础衰减方案。

论文 arXiv AI · 1 天前 ★★★★★

Cross-seed explainability using Procrustes-conditioned Joint End-to-end Top-K Sparse Autoencoders

该论文提出一种经 Procrustes 旋转条件化的联合端到端 Top-K 稀疏自编码器，用于从独立训练的 BERT 模型中提取跨随机种子一致的通用特征。方法先对不同种子的激活空间做正交对齐，再联合训练 SAE，并加入 Top-K 稀疏约束与失活特征恢复损失。在 10 个 BERT、3 个数据集测试中，其跨种子特征一致性优于事后对齐基线。

论文 arXiv AI · 1 天前 ★★★★★

Cognitive-structured Multimodal Agent for Multimodal Understanding, Generation, and Editing

论文提出认知结构化多模态智能体，通过情景视觉记忆替代将全部历史视觉与文本输入反复塞入上下文窗口，以缓解长程多轮对话中的视觉 token 膨胀与跨轮引用不稳问题。其 8B 模型在 20 轮会话检索准确率达 91.4%，较 32B 基线高 8.2 个百分点，单轮推理时间由 23.1 秒降至 12.7 秒，并开源部署框架与基准。

论文 arXiv AI · 1 天前 ★★★★★

The Context Access Divide: Interaction-Level Architecture as a Complementary Dimension of Agentic Inequality

论文提出“上下文访问鸿沟”概念，补充现有“代理不平等”框架，指出即便用户名义上拥有相同AI代理，若系统不能自主从个人知识库动态检索上下文，而需手动附加资料，其效用会显著下降。作者结合认知心理学与RAG、MCP架构分析，论证该差异会随语料规模和任务复杂度扩大，并影响知识工作分层与平台治理。

论文 arXiv AI · 1 天前 ★★★★★

Ensemble Diversity Optimization for Subjective Supervision

论文提出面向主观性NLP任务的集成多样性优化框架EDO，用统一可微目标联合学习集成权重、有效规模与校准，并通过带符号多样性正则控制保留或抑制标注分歧。其在四个主观文本分类基准上显著改善概率校准，交叉熵较多种基线下降40%至78%，Brier分数更低，同时保持有竞争力的F1表现。

论文 arXiv AI · 2 天前 ★★★★★

Accurate, Interdisciplinary and Transparent Structure-property Understanding with Deep Native Structural Reasoning

论文提出多模态科学基础模型 SciReasoner，用统一结构感知词表离散化坐标、拓扑与周期连接，实现蛋白质、小分子和无机晶体的原生结构推理。该模型在86项基准中有67项达到最优，低同源蛋白GO预测Fmax从0.42升至0.55，单步逆合成准确率从0.63升至0.72，并提供可检视的推理证据链。

论文 arXiv AI · 2 天前 ★★★★★

Co-LMLM: Continuous-Query Limited Memory Language Models

论文提出连续查询有限记忆语言模型 Co-LMLM，将事实知识外置到由连续向量键与文本值组成的知识库，生成时以低成本发起灵活向量检索，并保留可读、可追溯的知识注入。配套标注流程可在任意文本中标记事实片段，不再局限于维基百科；在多规模预训练中，其困惑度与事实准确率均优于既有 LMLM 和常规 LLM。

论文 arXiv AI · 2 天前 ★★★★★

The Key to Going Linear: Analysis-Driven Transformer Linearization

该论文聚焦因果自注意力二次复杂度带来的长上下文推理瓶颈，在冻结主干模型前提下分析线性化关键因素，指出 softmax 依赖与 key 相关的秩1正交投影，解释 delta 类网络优于纯门控累积的原因，并通过 sink token、短卷积和固定预算缓存路由降低近似误差，在最高 32B 的 LLaMA 与 Qwen 上提升 MMLU 和长上下文检索表现。

论文 arXiv AI · 2 天前 ★★★★★

From Noisy Traces to Root Causes: Structural Trajectory Analysis and Causal Extraction for Agent Optimization

论文提出 STRACE 框架，用于在长时程智能体优化中从嘈杂执行轨迹中提取高信噪比优化上下文。该方法先在批量层面挖掘失败模式、筛除冗余轨迹，再在单条轨迹上基于文本依赖图进行因果定位，识别真正根因模块并移除无关步骤。在 VeruSAGE-Bench 形式化验证任务上，成功率由 42.5% 提升至 58.5%。

论文 arXiv AI · 2 天前 ★★★★★

Breaking Database Lock-in: Agentic Regeneration of High Performance Storage Readers for Database Bypass

论文提出 Jailbreak 方法，利用大模型基于数据库源码与文档自动合成存储文件读取器，绕过 JDBC/ODBC 和数据库执行层，直接从 PostgreSQL、MySQL 存储文件生成 Apache Arrow 列式缓冲区，用于分析快照场景。其在 TPC-H 上验证结果正确，并实现端到端分析吞吐最高 27 倍提升。

论文 arXiv AI · 2 天前 ★★★★★

Institutional Red-Teaming: Deployment Rules, Not Just Models, Causally Shape Multi-Agent AI Safety

论文提出“制度化红队测试”方法，评估多智能体系统中部署规则而非仅模型本身对安全性的因果影响，并在 IABench-CA 基准上测试 228 种场景、5 类规则和 7 组模型。结果显示，仅调整后果分配规则即可使平均致死率变化 22 至 58 个百分点；不存在通用安全默认规则，身份指向性淘汰风险普遍存在，匿名化可短暂缓解但难根除。

论文 arXiv AI · 2 天前 ★★★★★

Selective Timestep Weighting and Advantage-Based Replay for Sample-Efficient Diffusion RLHF

论文聚焦扩散模型RLHF反馈效率低的问题，提出两项互补方法：对去噪过程中不同时间步按信息量进行加权优化，以及基于优势值优先重放高价值轨迹，减少重复请求新奖励。作者从PPO收敛性质给出理论联系，并在相同超参数下相较常见基线实现最高6倍样本效率提升。

论文 arXiv AI · 2 天前 ★★★★★

Agon: Competitive Cross-Model RL with Implicit Rival Grading of Reasoning

论文提出 Agon，一种让两种模型在同题对抗中互为评分者的强化学习方法：一方先起草解题过程，另一方读取后继续求解，双方以“胜过对手”为奖励信号，从而无需过程标注或奖励模型即可隐式评估推理质量。在 DeepMath hard split 上，基于 Qwen3 的 Agon 将 pass@1 提升至 GRPO 的约两倍，效果也在竞赛编程与多模型家族上复现。

论文 arXiv AI · 2 天前 ★★★★★

ECGLight: Compute-Light Framework For Paper ECG Digitization and Myocardial Infarction Screening

ECGLight 提出面向纸质心电图数字化与心肌梗死筛查的轻量级端侧框架，可将手机拍照或扫描的纸质 ECG 转换为校准后的 12 导联信号，并结合 SHAP 提供可解释诊断。系统基于 PTB-XL 的 21799 份 ECG 训练，并在 ECG-Matrix 医院数据上验证，CPU 环境下单份处理少于 30 秒，MI 检测准确率达 95.51%，OMI 检测准确率达 88.89%。

论文 arXiv AI · 2 天前 ★★★★★

Neural Operator-enabled Topology-informed Evolutionary Strategy for PDE-Constrained Optimization

论文提出用于偏微分方程约束优化的 NOTES 方法，将基于 DeepONet 的神经算子与 CMA-ES 结合，在具备拓扑先验的潜空间中进行全局搜索，把设计维度从 256 降至 25。该方法在纳米光子束偏转器设计中实现超过 95% 效率，并在结构优化中将柔顺度降至 246，整体优于 CMA-ES、拓扑优化等基线，强调对未知工况的可迁移性。

论文 arXiv AI · 2 天前 ★★★★★

Any-Dimensional Learning by Sampling

论文提出基于随机采样映射的统一框架，用于比较不同规模输入并将大规模样本压缩为小样本，从而分析模型从小尺寸训练数据泛化到未见大尺寸输入的能力，并降低推理成本。方法覆盖序列、图、张量等对象，给出显式泛化与草图误差界，适用于置换不变Transformer、图神经网络及图同态计数等函数类。

论文 arXiv AI · 2 天前 ★★★★★

How Data Shapes RoPE Frequency Usage: From Positional Scale Matching to Length Generalization

论文研究 Transformer 中 RoPE 频率为何被非均匀使用，提出数据驱动解释：模型会选择与训练数据相对距离结构相匹配的频率，并给出最优频率与依赖宽度 W 成反比的结论。作者进一步分析频率缩放与长上下文泛化的关系，指出自然语言在位置尺度上近似自相似，这解释了测试时频率缩放为何能支持更长上下文。

论文 arXiv AI · 2 天前 ★★★★★

SkillCenter: A Large-Scale Source-Grounded Skill Library for Autonomous AI Agents

SkillCenter 发布面向自治 AI 代理的大规模开源技能库，收录 216,938 个结构化技能，覆盖 24 个领域包。其中 114,565 个技能来自论文、ArXiv 和 2.4 万多个技术来源，并通过 SkillGate 质量过滤；另整合 102,373 个 GitHub 与 ClawHub 社区技能。项目强调来源可追溯，每项保留声明均可映射到原文引述，并提供可离线检索的 SQLite FTS5 技能包。

论文 arXiv AI · 2 天前 ★★★★★

Max Out GRPO Signal: Adaptive Trace Prefix Control for Hard Reasoning Problems

论文提出 AdaPrefix-GRPO，针对 GRPO 在高难推理样本上因整组失败而缺乏有效梯度的问题，引入自适应前缀控制机制，动态调节参考解答前缀长度，将样本成功率维持在约50%以最大化训练信号，并在训练后逐步撤除辅助。在相同训练 FLOPs 下，该方法使 0.6B 模型准确率提升 2.1 倍，Qwen3-1.7B 提升 1.6 倍，AIME 提升 1.7 倍，同时约减半推理轨迹长度。

论文 arXiv AI · 2 天前 ★★★★★

MedPMC: A Systematic Framework for Scaling High-Fidelity Medical Multimodal Data for Foundation Models

研究提出医疗多模态数据构建框架 MedPMC，将 610 万篇 PMC 文献自动整理为 1100 万组高保真医学图文对，并公开框架、语料、基准与预训练模型。评测显示其在图像筛选、图文对齐和分类等环节表现稳定，基于该数据训练的模型在 26 项基准、医学视觉问答和临床检索任务上均明显优于现有 PMC 衍生数据方案。

论文 arXiv AI · 2 天前 ★★★★★

PeTeR: Post-Training Robustification of Probabilistic Circuits

论文提出 PeTeR，一种面向概率电路的免数据后训练鲁棒化框架，可在不从头重训的情况下提升预训练模型应对分布偏移的能力。针对传统基于似然学习在噪声、小样本和分布变化下易过拟合、泛化脆弱的问题，PeTeR在多项密度估计基准上对随机与对抗扰动均表现出有效增强，并达到与依赖数据的鲁棒训练方法相当或更优的效果。

论文 arXiv AI · 2 天前 ★★★★★

Does Bielik Know What It Doesn't Know? Activation Dispersion Separates Entity Familiarity from Factual Reliability Across Model Scale

该论文研究波兰语 Bielik 系列 1.5B 至 11B 模型，发现模型在生成前仅凭激活分散度即可高精度区分熟悉、冷门真实与虚构实体，跨领域与跨规模 AUROC 达 0.95 至 1.00，且优于高成本语义熵基线。但实体熟悉度并不等于事实正确性，随模型变大，回答可靠性才明显提升，而模型几乎不会主动拒答。

论文 arXiv AI · 2 天前 ★★★★★

DiaLLM: An Investigation into the Robustness-Generation Gap in English Dialect Adaptation

论文提出 DiaLLM，系统研究英语方言适配中“理解鲁棒性”与“生成能力”脱节问题。作者对三类开源模型进行持续预训练，并结合隐式、显式后训练及三种对齐策略，在澳大利亚、印度和北英格兰英语上对比。结果显示基准分数难反映真实方言生成质量，显式定向适配更易产出可识别方言，但最高方言奖励并不对应最佳人工偏好。

论文 arXiv AI · 2 天前 ★★★★★

Guidance Breaks the Fitted Operator: A Terminal-Fitted Repair for Classifier-Free Guidance

论文从数值分析角度解释扩散与流匹配采样中 classifier-free guidance 在高引导强度下出现过饱和和不稳定的原因，指出 CFG 会破坏终端层的 fitted operator，使残差随 sigma_min 变小而发散。作者提出无需额外 NFE 的单系数修复项，在 CIFAR-10 与 Stable Diffusion 1.5 DDIM 测试中降低放大与饱和，并在测试网格上取得 9/9 的 FID 改善。

论文 arXiv AI · 2 天前 ★★★★★

Recursive Self-Improvement in AI: From Bounded Self-Refinement to Autonomous Research Loops

该论文综述2024至2026年间1250篇arXiv文献，按改进对象与闭环程度梳理AI自我改进研究，区分已在工业界落地的有界自我精炼与开放式递归自我改进。作者强调自评估是核心瓶颈，构建从形式化验证到内在自评的信号层级，并分析自证循环、模型坍塌、多样性坍塌及治理测量缺口。

论文 arXiv AI · 2 天前 ★★★★★

RL Post-Training Builds Compositional Reasoning Strategies

论文研究强化学习后训练是否仅放大基座模型已有原始能力，还是能将其组合成更高层推理策略。作者在可审计的符号重写环境中发现，基于终局二元奖励的RL可显著解决预训练模型难以完成的任务，并通过先强化基本归约、再形成串行与并行组合程序的阶段性机制，沉淀为稳定可复用的推理策略。

论文 arXiv AI · 2 天前 ★★★★★

ALER-TI: Aligned Latent Embedding Retrieval for Time Series Imputation

论文提出时间序列缺失值补全框架 ALER-TI，通过检索增强方式利用历史模式弥补局部时序信息不足。其核心模块 LEA 在潜在空间对齐受损查询与完整历史样本，缓解表示失配，并支持历史嵌入预计算缓存。实验表明，该方法可适配多种补全骨干模型，在六个真实数据集和不同缺失率下稳定提升效果与鲁棒性。

论文 arXiv AI · 2 天前 ★★★★★

An optimal control approach for neural network architecture adaptation with a posteriori error estimation

论文将神经网络训练表述为连续时间最优控制问题，并基于后验误差估计提出按深度自适应增层方法。研究通过误差分解定位层间最大误差处插入新层，引入权重与偏置随层分段线性变化的结构，并借助对偶加权残差给出可计算上界。在Navier-Stokes等科学数据集上，该方法较现有架构自适应方法展现更优泛化性能。

论文 arXiv AI · 2 天前 ★★★★★

QCNN with Rough Path Signature Kernels

论文提出一种面向时间序列分类的量子-经典混合架构，将路径签名核与量子卷积神经网络结合，以缓解时间重参数化不变性带来的特征提取难题。其特征层通过经典或量子变分线性求解器计算参考路径与目标路径间的签名核，并在手写数字二分类任务上评估多种QCNN配置，同时分析VQLS组件的计算限制。

论文 arXiv AI · 2 天前 ★★★★★

Future Confidence Distillation in Large Language Models

论文从时间维度研究大语言模型置信度估计，对比作答前的 FOK 与作答后的 JOL，发现后者在校准性和区分度上更优，且隐藏表示中可恢复的置信信息显著多于模型显式表述。作者提出 future confidence distillation，用后验正确性探针蒸馏前验预测器，在仅用作答前表示推理的情况下显著提升低成本置信度估计，并具备样本效率和同域迁移能力。

论文 arXiv AI · 2 天前 ★★★★★

Higher-Order Geometric Updates for Levenberg-Marquardt Method via Riemann Normal Coordinates

论文提出基于黎曼正规坐标的 Levenberg-Marquardt 优化方法 RNC-LM，针对非线性最小二乘中参数效应曲率导致的有限步更新失真问题，将测地加速度扩展到任意高阶修正，并结合沿 RNC 曲线的线搜索提升重参数化一致性。在经典基准、反应扩散 PINN 及大规模势能面拟合任务中，方法分别提升收敛稳健性、将相对 L2 误差降至 1e-3 量级，并实现较标准 LM 34 倍加速。

论文 arXiv AI · 2 天前 ★★★★★

Towards Agentic AI Governance: A Preliminary Assessment

论文系统梳理了Agentic AI治理的早期研究，指出具备自主规划与执行能力的智能体系统已区别于传统生成式AI，并在2025年加速落地。研究总结了该领域的核心治理议题、可能的治理机制及各类利益相关方角色，为建立负责任且具适应性的治理路线图提供初步框架。

论文 arXiv AI · 2 天前 ★★★★★

Asymmetric Focal Loss Improves Graph Neural Network Prediction of Drug-Drug Interactions

研究评估将非对称焦点损失 ClinicalFocal 引入关系感知图卷积网络，用于药物-药物相互作用预测。在 TWOSIDES 五折验证中，模型在不改变架构、特征和超参条件下，准确率由0.699升至0.892，F1由0.700升至0.894，AUROC和AUCPR也显著提升，假阴性率降至9.1%。

论文 arXiv AI · 2 天前 ★★★★★

CARLA-GS: Decoupling Representation, Reasoning, and Physics Simulation for Autonomous Driving Corner-Case Synthesis

论文提出用于自动驾驶极端场景合成的模块化框架 CARLA-GS，将视觉表征、语义推理与物理仿真解耦并联动。方法基于真实驾驶数据重建可编辑高斯场景，由多智能体 LLM 识别高风险交互并生成意图级轨迹，再交由 CARLA 与 PID 控制器执行，实现具备照片级真实感、时空一致性和物理可行性的角落案例视频生成。

论文 arXiv AI · 2 天前 ★★★★★

Multi-Class vs. Multi-Label BERT for CVE-to-CWE Mapping: How Taxonomy Structure Shapes the Errors

该研究将 CVE 到 CWE 映射建模为文本分类，比较单标签多分类与可多标签两种方案，并测试 BERT Base、SecureBERT、CySecBERT 在 83、47、25 类标签空间上的表现。结果显示多分类整体宏 F1 更高，但标签空间缩小时差距明显收窄；错误主要受 CWE 层级结构影响而非编码器差异，CySecBERT 整体表现最佳。

论文 arXiv AI · 2 天前 ★★★★★

Collaborative Synthetic Data Generation for Knowledge Transfer in Federated Learning

该论文提出面向单轮联邦学习的 FedKT-CSD 框架，利用公开预训练自编码器构建共享潜空间。客户端仅需一次前向编码并上传类别条件潜变量统计，服务器经安全聚合与差分隐私噪声处理后解码生成合成数据，用于训练全局模型。方法兼顾低通信、异构数据鲁棒性与形式化隐私保证，在多数据集和大规模客户端场景下表现具有竞争力。

论文 arXiv AI · 2 天前 ★★★★★

PALS: Percentile-Aware Layerwise Sparsity for LLM Pruning

论文提出面向大模型剪枝的 PALS 方法，依据各层激活幅值第99百分位动态分配层级稀疏率，并将偏移控制在目标稀疏率上下 5% 内。在 LLaMA-2-7B 的 50% 稀疏设置下，PALS 的 WikiText-2 困惑度为 10.96，优于均匀剪枝 Wanda 的 12.92；但在 LLaMA-3-8B 和 Mistral-7B 上收益有限，显示效果依赖模型架构。

论文 arXiv AI · 2 天前 ★★★★★

Think Big, Search Small: Where Capacity Matters in Hierarchical Search Agents?

论文研究分层搜索智能体中模型容量在不同角色间的分配问题，将系统拆分为任务分解、检索执行和答案生成三类角色，并在五个多跳问答基准上做容量对照实验。结果显示，角色分解优于单智能体基线；扩大分解角色可带来约11点EM提升，而扩大执行角色仅提升约2.6点，表明任务分解是关键瓶颈。

论文 arXiv AI · 2 天前 ★★★★★

Avoiding unsafe sets when training with Langevin Dynamics

论文研究将含噪梯度下降视为过阻尼朗之万动力学时，训练轨迹进入预设失效区域的概率界。在强凸平滑损失下，作者给出终态平衡质量、训练过程中的形状无关上界，并指出某些区域虽平衡概率极小，途中仍可能指数级膨胀；为此提出与失效区域相关的局部松弛速率，以更紧地约束全程风险。

论文 arXiv AI · 2 天前 ★★★★★

A Unified Detection Framework for AI-Related Content and Artifacts

该论文提出基于马氏距离分数的统一检测框架，可用于识别大语言模型生成文本、幻觉、水印文本及对抗样本等多类 AI 相关内容与伪影。方法核心是对正类深层表示的协方差矩阵进行稳健估计，作者设计了联合最小协方差行列式估计器及高效优化算法，并证明其收敛性与高崩溃点性质，实验验证了框架有效性。

论文 arXiv AI · 2 天前 ★★★★★

Creativity from Friction: Human-AI Interaction for Exploratory Structural Design

论文聚焦结构设计与建筑等创意领域的人机协作，指出当前生成式 AI 追求消除摩擦、直接给答案，与设计师依赖约束与迭代推进创意的流程不匹配。作者提出基于视觉语言模型的约束式共创设计维度，并通过原型界面与专家研究，验证其可在保留反思性设计摩擦的同时减少重复建模负担。

论文 arXiv AI · 2 天前 ★★★★★

Gradient-free Riemannian Langevin Sampler

论文提出无梯度黎曼朗之万采样器 GRiLS，面向多峰概率分布采样中常见的混合效率低与陷入局部模式问题。方法通过引入黎曼度量重塑局部几何，在无需目标密度梯度的前提下提升跨模态跳转能力，并用交互粒子集估计目标分布均值与协方差。实验显示其在多峰基准上优于现有有梯度和无梯度 MCMC 方法。

论文 arXiv AI · 2 天前 ★★★★★

Fast Rates for Semi-Supervised Learning via Data-Augmentation Graph Regularization

论文从理论上解释半监督/自监督学习为何能以少量标注达到接近监督学习的效果。作者将数据增强视为在无标签数据上诱导相似图，把下游学习刻画为图拉普拉斯正则化学习，并证明相对监督学习O(1/√n_L)更快的O(1/n_L)标注样本收敛率；同时给出误差上界C/n_L+R_DA(y)，明确指出增强跨标签边界越少，所需标签越少。

论文 arXiv AI · 2 天前 ★★★★★

Stability of Flow Models for Graph Signals

论文研究图信号生成中的连续归一化流模型，分析以GNN参数化的流在连续时间ODE及离散数值采样中的置换等变性，并给出生成分布对图结构相对扰动的显式稳定性界。基于理论结果，作者提出正则化的flow matching训练策略，惩罚向量场空间Lipschitz常数，在合成图信号和fMRI脑连接数据上提升了结构噪声鲁棒性且未降低生成质量。

论文 arXiv AI · 2 天前 ★★★★★

Single-Rollout Asynchronous Optimization for Agentic Reinforcement Learning

论文提出面向长时程智能体任务的异步强化学习方法 SAO，通过将 GRPO 的组采样改为单 rollout 采样，并结合价值模型训练设计与严格双侧 token 级裁剪，缓解异步训练中的离策略与稳定性问题。实验显示，其在 SWE-Bench Verified、BeyondAIME、IMOAnswerBench 等基准上持续优于 GRPO 及变体，并已用于开源 GLM-5.2 的 agentic RL 训练。

论文 arXiv AI · 2 天前 ★★★★★

HIVE: Understanding Post-Hallucination Reasoning in Vision Language Models

论文聚焦视觉语言模型的“幻觉后推理”阶段，提出评测框架 HIVE，在 9 类任务和 9 个模型上对真实描述与幻觉描述进行受控比较。结果显示，幻觉语义进入推理上下文后，常提升视觉语言任务表现，但对纯文本任务影响有限或不稳定，并会扩展语义覆盖、改变推理动态。

论文 arXiv AI · 2 天前 ★★★★★

Do LLM-Generated Skills Make Better AI Data Scientists? A Component Ablation Across Data-Science Workflows

论文评估LLM生成技能文件能否提升AI数据科学代理在数据准备、提取、统计分析和报告四类任务中的表现。主实验覆盖56个任务、9种模型配置、3家供应商，共7560次运行，结果显示完整技能及各消融变体相较仅任务提示均无显著提升；补充的1512次对照实验也表明，完整技能与无关技能格式内容效果接近。

论文 arXiv AI · 2 天前 ★★★★★

TimEE: End-to-end Time Series Classification via In-Context Learning

论文提出 TimEE，一种仅 450 万参数的时间序列分类基础模型，基于上下文学习实现端到端推理：输入带标签支持集与查询序列后即可单次前向输出类别分布，无需针对每个数据集单独训练。模型仅在合成任务上元训练，却在 UCR 基准上取得 ROC AUC 第一、准确率第三，显示纯合成预训练在时间序列分类中的潜力。

论文 arXiv AI · 2 天前 ★★★★★

Reward-Adaptive Iterative Discovery: A Case Study on Automated Game Testing for NHL26

论文以 EA SPORTS NHL 26 开发版本为案例，提出用于自动化游戏测试的 Reward-Adaptive Iterative Discovery（RAID）方法。该方案在强化学习训练中引入迭代式奖励自适应机制，缓解传统 RL 只过拟合单一路径的问题，促使模型发现多样化高质量漏洞策略。首次部署中，单次实验即找到 6 种与人工长时间测试结果相近的守门员得分 exploit。

论文 arXiv AI · 2 天前 ★★★★★

GIFT: Geometry-Informed Low-precision Gradient Communication for LLM Pretraining

论文提出 GIFT，一种面向大语言模型预训练的几何感知低精度梯度通信方法。其先将各向异性梯度映射到近各向同性空间，再以 FP8、NVFP4 等格式量化传输，在不改变优化器、训练配方、通信算子和数据格式前提下提升保真度。实验显示，Llama-600M 在 64 个 NVIDIA GH200 上端到端预训练时间缩短 7.6%，下游任务保持性也优于直接欧氏空间 FP8 通信。

论文 arXiv AI · 2 天前 ★★★★★

Search, Fail, Recover: A Training Framework for Correction-Aware Reasoning

论文提出面向纠错推理的训练与推断框架 Pyligent，将推理建模为对部分解链的验证式搜索。框架借助任务验证器为生成分支和失败打标，并转化为继续、完成、回退三类监督目标，在隐藏图、4×4数独、带推理轨迹数独和Blocksworld等任务上相较传统监督微调显著提升求解率。

论文 arXiv AI · 2 天前 ★★★★★

FourierQK: Spectral Preprocessing of Query-Key Projections Improves Transformer Attention

论文提出 FourierQK，在 Transformer 注意力中对已学习的 Query/Key 投影做 FFT 频域预处理，在字符级语言建模上显著优于标准点积注意力。TinyShakespeare 实验中，四个学习频率将验证指标提升至 0.309，较基线降幅约 79%；随机投影无收益，说明改进来自全局频域混合而非度量扰动。

论文 arXiv AI · 2 天前 ★★★★★

Beyond Attack-Success Rate: Action-Graded Severity Scale for Tool-Using AI Agents

论文指出现有智能体越狱评测仅以攻击是否成功的二元指标衡量，无法反映真实危害程度。作者提出基于工具调用轨迹的七级行动危害量表，从可逆性、跨范围影响与权限提升评估后果，并以规则判定器和三模型评审双路径计算。在 AgentDojo 上，该方法揭示了二元指标遗漏的多种风险，评审与规则结果一致性较高。

论文 arXiv AI · 2 天前 ★★★★★

Where to Intervene? Benchmarking Fairness-Aware Learning on Differentially Private Synthetic Tabular Data

该研究系统评测了差分隐私合成表格数据上的公平性干预效果，围绕SOTA边际型DP合成器AIM，在4个数据集、多个群体公平指标和预处理/训练中/后处理三类方法上比较原始、仅DP、仅公平和DP+公平四种流程。结果显示DP会削弱效用与公平性，而公平干预可部分修复，其中后处理在不同隐私预算下表现出更稳定的公平性-效用权衡。

论文 arXiv AI · 2 天前 ★★★★★

SynthAVE: Scalable Synthetic Labeling for E-Commerce with LLM-Arena Validation

论文提出面向电商属性抽取的合成标注方案 SynthAVE，覆盖12726个商品、229类商品、792项属性及西法意德4种语言。作者引入由7个模型家族、3种提示组成的21路多模型评审框架，以多数投票验证合成标签；其结果与人工专家一致性达95.2%，Cohen's κ达0.92，显示可在大规模场景下以较低成本实现接近人工质量的标注验证。

论文 arXiv AI · 2 天前 ★★★★★

Statistical inverse learning and $\ell^1$-regularization

论文研究统计逆学习中的稀疏函数恢复问题，将未知量建模为ℓ¹空间元素，并提出基于ℓ¹正则化的经验风险最小化方法。在温和假设下，作者证明了该方法的几乎必然一致性、预测误差与ℓ¹重构误差的高概率收敛速率，并给出匹配的极小极大下界。论文还将理论应用于椭圆PDE反应系数识别和稀疏CT，推导了具体收敛率。

论文 arXiv AI · 2 天前 ★★★★★

SpaCellAgent: A Self-Evolving LLM-Based Multi-Agent Framework for Trajectory Analysis

SpaCellAgent 是面向空间转录组与单细胞轨迹推断的 LLM 多智能体框架，可将自然语言需求转为端到端时空分析与结果叙述。其结合工作流规划、动态工具编排和自进化反馈优化，在六个异构数据集上实现超 40% 分析效率提升，同时保持与专家一致的表现。

论文 arXiv AI · 2 天前 ★★★★★

The Blind Curator: How a Biased Judge Silently Disables Skill Retirement in Self-Evolving Agents

论文研究自进化智能体中的“技能退役”机制在有偏 LLM 裁判下的失效问题。作者通过受损奖励分析与无参考报告写作实验发现，对称噪声影响有限，但“误判失败为通过”的 false-pass 偏差一旦超过阈值，就会系统性关闭基于贡献的技能淘汰，且无法靠更多数据弥补。该失效常不会体现在总体性能指标上，作者并提出低成本缺陷注入审计方法。

论文 arXiv AI · 2 天前 ★★★★★

RLVP: Penalize the Path, Reward the Outcome

论文提出 RLVP 框架，面向电话呼叫等高成本、不可逆的真实世界智能体在线学习场景，主张“惩罚过程、奖励结果”。作者指出传统 RLVR 仅看结果，难以表达营业时间、认证流程、避免重复骚扰等过程约束，且样本效率低。RLVP 通过对可验证违规路径施加惩罚，在少样本下实现高任务成功率和接近零违规，并总结四条惩罚设计原则。

论文 arXiv AI · 2 天前 ★★★★★

Reliable mechanistic operator recovery with biologically-informed neural networks: principles for architecture and optimisation design

论文系统评估生物信息神经网络（BINNs）在从稀疏、含噪观测中恢复生物动力学机制算子时，网络结构、学习率、损失权重和批量大小等因素的影响。基于一维平流-扩散-反应PDE基准实验，研究发现中等复杂度架构、适中的学习率、平衡数据与PDE损失、以及中等批量规模更有利于稳定优化和准确机理恢复，并总结了过拟合、优化不稳等失效诊断方法。

论文 arXiv AI · 2 天前 ★★★★★

The Optimal Sample Complexity of Learning Autoregressive Chain-of-Thought

论文研究自回归 Chain-of-Thought 在可实现 PAC 设定下的精确轨迹学习样本复杂度，证明其上界与局部下一词多分类学习一致，由 Daniely-Shalev-Shwartz 维度决定，且与推理 rollout 长度无关。作者提出 parity dimension 作为稳定细化指标，说明 DS 维度在 rollout 下可能上升，因此该新工具对获得最优上界是必要的。

论文 arXiv AI · 2 天前 ★★★★★

InductWave: Inductive Multi-Hop Logical Query Answering on Knowledge Graphs

论文提出面向大规模知识图谱多跳逻辑查询的归纳式方法 InductWave，采用基于小波的嵌入机制，支持对训练阶段未见实体进行推理。实验在 FB15k-(237) 不同训练测试划分及 Wiki-KG 上进行，结果显示其用更少消息传递层即可达到或超过现有最优方法，并降低资源需求。

论文 arXiv AI · 2 天前 ★★★★★

DeLS-Spec: Decoupled Long-Short Contexts for Parallel Speculative Drafting

DeLS-Spec 提出一种长短上下文解耦的推测解码方法，在保留 DFlash 作为长上下文专家的基础上，引入可独立训练的轻量本地头作为短上下文专家，无需与目标模型或骨干联合训练。实验显示，该方法在 Qwen3 的数学、代码和对话任务中，相比 DFlash 持续提升推理加速比与平均接受长度，同时降低训练成本并增强模块化灵活性。

论文 arXiv AI · 2 天前 ★★★★★

Transformer-based segmentation of prosodic boundaries in Brazilian Portuguese

论文提出面向巴西葡萄牙语的韵律边界自动分割模型 SAMPA，基于 Whisper large-v3 微调，在转写语音的同时插入终止性韵律边界标记。模型使用 NURC-SP 人工标注语料训练，并在 MuPe-Diversidades 上做分布外测试，最佳结果分别达到 F1=0.731 和 0.796，分析显示其能利用句法、语义与韵律线索进行判断。

论文 arXiv AI · 2 天前 ★★★★★

Reason Less, Verify More: Deterministic Gates Recover a Silent Policy-Violation Failure Mode in Tool-Using LLM Agents

论文聚焦工具型智能体在策略宽松环境中的“静默违规”失效：模型表面完成任务，实则执行了违反业务规则的写操作且无报错。在航空基准τ²-bench中，预算模型78%的失败属此类。作者提出只读、确定性的执行前门控机制，在gpt-4o-mini上将整体成功率由29.6%提升至42.0%，并在多组种子下复现，显示其可在动作边界稳定阻断特定违规写入。

国内量子位 · 2 天前 ★★★★★

具身智能“高考”难疯了！人类100分，最强模型12.8

RoboDojo 被称为具身智能测评领域的高难度基准，文章以“人类 100 分、最强模型仅 12.8 分”凸显当前机器人与具身模型在复杂任务理解、规划和执行上的显著差距。该测评被视为检验具身智能通用能力上限的重要新标尺，反映行业仍处于早期攻坚阶段。

官方/研究 OpenAI Blog · 2 天前 ★★★★★

Separating signal from noise in coding evaluations

OpenAI 发布对编程评测基准 SWE-Bench Pro 的新分析，指出该热门编码基准在评估 AI 模型时存在信号与噪声混杂、结果可靠性和准确性不足等问题。该研究强调基准设计与验证流程会显著影响模型排名与结论，提示行业需更谨慎解读代码能力评测结果。

国内量子位 · 2 天前 ★★★★★

别让AI一上来就“进厂打螺丝”：智源悟界·Orca要先教模型理解世界如何变化

智源推出“悟界·Orca”项目，强调不要让AI直接面向工业任务训练，而应先让模型学习和理解现实世界的动态变化机制。相关成果登上 Hugging Face 论文月榜第一，显示其在具身智能与世界模型方向获得较高关注，反映行业正从任务执行转向基础认知能力构建。

国内量子位 · 2 天前 ★★★★★

阿里斩获国际AI顶会最佳资源论文奖，提出Agent评测新范式

阿里巴巴相关研究成果在国际人工智能顶级会议上获得最佳资源论文奖，核心工作聚焦于提出面向智能体（Agent）的新型评测范式。该研究旨在改进现有Agent评估在任务覆盖、真实性与可复现性上的不足，为后续模型与多智能体系统的能力衡量、基准构建和产业应用落地提供更系统的评测框架。

论文 arXiv AI · 3 天前 ★★★★★

ELSA3D: Elastic Semantic Anchoring for Unified 3D Understanding and Generation

ELSA3D 提出一种统一 3D 基础模型，通过弹性语义锚定机制显式组织文本与几何信息交互。模型采用尺度感知八叉树 tokenizer 与 Anchor Tokens，在匹配的抽象层级上稀疏对齐语义和几何证据，并用轻量路由器动态分配跨模态计算。其在图像生成 3D、文本生成 3D 和 3D 描述任务上达到 SOTA，同时将 FLOPs 与推理延迟约减半。

论文 arXiv AI · 3 天前 ★★★★★

Graph Convolutional Attention: A Spectral Perspective on Graph Denoising and Diffusion

论文从谱分析角度研究图去噪与扩散中的注意力机制，指出在线性注意力框架下，模型只能学习训练分布上的平均谱去噪滤波器，难以适应谱结构差异较大的图。作者提出 Spectral Attention 与可置换等变的 Graph Convolutional Attention，在理论上优于线性注意力，并在多类合成与真实数据集、DiGress 等任务中提升去噪和扩散效果，同时降低部分结构特征与特征分解计算开销。

论文 arXiv AI · 3 天前 ★★★★★

Rethinking Indic AI from a Lens of Cultural Heritage Preservation

该论文从文化遗产保护视角审视印度次大陆AI发展，梳理Indic NLP的历史演进、资源建设与方法转向，分析印度语言在形态、文字、语法、双言制和方言差异上的特殊挑战，并讨论Indic基础模型如何弥补资源与表征缺口，提出强调诠释学推理与文化意义生成的“Culture Sensing”研究方向。

论文 arXiv AI · 3 天前 ★★★★★

On the feasibility of dependency parsing of non-human sequences without a gold standard. Is evaluation possible in other species?

论文探讨在缺乏人工标注标准的情况下，是否能评估非人类物种序列的依存句法分析效果。作者结合网络科学方法指出，由于非人灵长类发声或手势序列长度分布衰减很快，解析器若恢复较高比例正确边即可被推断为有效；而人类语言不具备这一性质，因此无金标准评估对非人灵长类更可行、对人类更困难。

论文 arXiv AI · 3 天前 ★★★★★

Hierarchical Acoustic-Semantic Modeling: Modality Separation and Semantic Coherence for Full-Duplex SLMs

论文聚焦原生全双工口语语言模型中的“模态干扰”问题，指出声学建模与语义建模在共享深层参数空间时存在梯度冲突，导致性能下降与语义受损。作者提出端到端框架 Lychee-FD，通过分层参数分离与语义对齐通道缓解冲突，在多个基准上将口语问答提升7.4%、全双工交互流畅度提升28.5%，且不增加推理开销。

论文 arXiv AI · 3 天前 ★★★★★

GraphBU: MILP Instance Generation with Graph-Native Block Units

论文提出面向混合整数线性规划实例生成的 GraphBU 方法，以“局部子问题+接口”作为图原生块单元，通过提升耦合节点为主约束或边界变量，实现兼容性检查下的块替换。实验显示，生成实例与源数据家族的图统计相似度平均约0.934，可行性约96.7%，并使下游 Predict-and-Search 训练主要指标平均提升约8.0%。

论文 arXiv AI · 3 天前 ★★★★★

The Large Cancer Assistant (LCA): A Model-Agnostic Orchestration Framework for Scalable Clinical Decision Support in Oncology

论文提出面向肿瘤临床决策支持的模型无关编排框架 LCA，通过“算法不可渗透”原则将多模态数据接入、临床路由与黑盒 AI 推理解耦，并以标准化中间载荷隔离医院 IT 环境。PoC 在四类场景中验证了低编排开销、模型替换下路由稳定、异常数据下补充请求 100% 召回及多协议执行能力。

论文 arXiv AI · 3 天前 ★★★★★

Life Style Levels: Neighborhood Delineation using Geospatial Data

研究提出一种基于开源卫星影像与建筑形态特征的城市精细分区框架，在印度59个城市按高分辨率网格刻画社区富裕与贫困差异，并用街景观察验证分类有效性。团队还在孟买通过建筑密度聚类识别高密度聚落，与已知非正规住区高度重叠，并探索了不同富裕等级与消费贷款逾期分布的关联。

论文 arXiv AI · 3 天前 ★★★★★

RSF-GLLM: Bridging the Semantic Gap in Multi-Hop Knowledge Graph QA via Recurrent Soft-Flow and Decoupled LLM Generation

论文提出 RSF-GLLM 框架，针对知识图谱多跳问答中“检索—阅读”流程不可微、难跨越语义鸿沟的问题，将可微图推理与答案生成解耦。其 RSF 模块通过 GRU 查询更新与动态门控传播连续相关性分数，并以流稀疏正则逼近离散推理路径；再将路径文本化用于微调大模型，在 WebQSP 和 CWQ 上取得有竞争力效果与更高推理效率。

论文 arXiv AI · 3 天前 ★★★★★

DepthWeave-KV: Token-Adaptive Cross-Layer Residual Factorization for Long-Context KV Cache Compression

DepthWeave-KV 提出面向长上下文推理的 KV Cache 压缩方案，通过跨相邻 Transformer 层的低秩分解共享通道基，并为指令性和检索关键 token 保留自适应残差。方法结合无校准在线误差跟踪与深度路由器，生成时动态调整压缩强度，无需重训底模；在多项长文本基准上实现接近满缓存效果，达到 8.3 倍显存压缩和 64K 上下文下 72.8 tokens/s。

论文 arXiv AI · 3 天前 ★★★★★

Bridging Physical Reasoning and Task Generalization via Visual Action Outcome Reasoning Alignment

论文提出面向视觉语言模型物理推理泛化的奖励设计 VAORA，针对未见任务与环境中常见的推理幻觉和“推理-动作”错位问题，引入视觉对齐奖励与视觉-动作对齐奖励，并结合专家智能体估计成功概率提供平滑稠密奖励。在 PHYRE 和 Virtual Tool 实验中，该方法提升了新任务和新环境下的交互式物理推理表现。

论文 arXiv AI · 3 天前 ★★★★★

FreqDepthKV: Frequency-Guided Depth Sharing for Robust KV Cache Compression in Long-Context LLM Inference

FreqDepthKV 提出一种面向长上下文大模型推理的 KV Cache 压缩方法，在不需重训练的前提下，将相邻层 KV 状态分解为共享低频深度分量与稀疏高频残差，并用在线探针按注意力头动态选择共享、残差或精确缓存模式。在问答、检索、摘要和代码生成任务中，该方法以 3.9 倍有效压缩率，将峰值 KV 内存降至 6.2GB、TTFT 降至 2.06 秒、吞吐提升至 70.4 tokens/s，同时保持接近完整 KV 的精度。

论文 arXiv AI · 3 天前 ★★★★★

FootsiesGym: A Fighting Game Benchmark for Two-Player Zero-Sum Imperfect-Information Games

研究团队发布开源强化学习环境 FootsiesGym，面向双人零和、不完美信息博弈研究。该环境基于极简 2D 格斗游戏 Footsies，聚焦格斗博弈中循环、非传递的中立对抗策略，并提供向量化模拟器，支持在普通硬件上高吞吐训练。论文同时给出多种强化学习算法基准结果，并讨论后续研究方向。

论文 arXiv AI · 3 天前 ★★★★★

DynaKRAG: A Unified Framework for Learnable Evidence Control in Multi-Hop Retrieval-Augmented Generation

论文提出 DynaKRAG，将多跳 RAG 的证据获取建模为基于状态的可学习控制问题：由有效性层动态生成可执行操作集合，再由控制器在检索、查询改写、证据审查和充分性判断等原子操作中选择下一步。在 HotpotQA、2Wiki 和 MuSiQue 上，结合 Qwen2.5-7B-Instruct 的 F1 分别达 0.5998、0.5340、0.3061，均优于最强基线。

论文 arXiv AI · 3 天前 ★★★★★

Industry Classification of GitHub Repositories Using the North American Industry Classification System (NAICS)

研究发布 NAICS-GH 数据集，为 6588 个 GitHub 仓库标注 NAICS 2022 两位数行业类别，覆盖美国、欧盟和澳大利亚。其检索与核验流程结合向量检索、FAISS 与 GPT-4.1 评分，从约 137 万仓库筛至高置信样本，人工验证精度达 96.98%，并开放数据、代码、提示词和微调模型。

论文 arXiv AI · 3 天前 ★★★★★

RMISC: A Large-scale Real-world Multivariate Corpus for Time Series Foundation Models

论文提出大规模真实世界多变量时间序列语料库 RMISC，包含约 200 个数据集、1420 亿时间点，覆盖多个领域并公开可用。作者基于单变量、合成多变量和真实多变量数据预训练 4 种时间序列基础模型，并在分布内外基准上评估零样本泛化，结果显示引入真实多变量数据可显著提升模型泛化能力。

论文 arXiv AI · 3 天前 ★★★★★

Doomed from the Start: Early Abort of LLM Agent Episodes via a Recall-Controlled Probe Cascade

该论文提出一种基于隐藏状态探针的多轮中止机制，用于尽早识别注定失败的 LLM Agent 任务轨迹并提前终止。方法通过逐轮校准门控与联合召回预算搜索，在 TextCraft 上对两类模型实现 90%至97%召回目标；在 90% 目标下分别节省 47.1% 和 37.2% 推理计算，明显优于单门策略与仅依赖行为信号的方法。

论文 arXiv AI · 3 天前 ★★★★★

EntroPath: Maximum Entropy Path Ensemble Embedding for Manifold Learning

论文提出流形学习方法 EntroPath，通过最大熵随机游走聚合图中多条扩散路径，构建自由能差异度量，以缓解局部归一化随机游走偏向高密度区域、最短路径易受伪捷径影响的问题。作者证明其短时极限收敛于平方测地距离，并提供 landmark 投影与伪时间扩展；在合成流形和单细胞数据上整体表现优于多类图嵌入基线。

论文 arXiv AI · 3 天前 ★★★★★

Pitwall: Faithful Natural-Language Race-Strategy Briefings from a Calibrated Real-Time Monte Carlo Engine

论文介绍 Pitwall，一套面向 F1 实时赛事的自然语言策略简报系统，结合经校准的实时蒙特卡洛引擎与逐句事实校验机制，生成英、西、葡三语内容。系统以 2018-2024 年 126 场比赛训练，并在 2025-2026 留出赛季验证；实测在奥地利和英国大奖赛完成端到端部署，强调通过架构约束抑制幻觉。

论文 arXiv AI · 3 天前 ★★★★★

Multi-Agent Deep Reinforcement Learning for Multi Objective Battery Management in Dairy Farms

论文面向爱尔兰奶牛场可再生能源接入场景，提出结合差分进化与多智能体深度强化学习的双层电池管理控制框架：上层采用动态电价优化，下层执行多智能体储能调度。仿真显示，相比规则模型，能源套利利润最高提升18%，可提高分布式发电消纳并满足电网电压波动规范。

论文 arXiv AI · 3 天前 ★★★★★

AirflowAttack: Thermal-Airflow Adversarial Perturbations against Infrared Remote-Sensing Vision-Language Models

论文提出 AirflowAttack，据称是首个面向红外遥感视觉语言模型的对抗攻击方法，并首次利用热气流湍流作为扰动先验。该方法以单一输入无关扰动在代理 CLIP 上优化，在5个 CLIP 骨干上平均零样本场景分类攻击成功率达48.5%，明显高于4种红外物理基线；对6个先进 VLM 可使分类准确率最高相对下降38.2%，并暴露模型将扰动误判为真实热特征的风险。

论文 arXiv AI · 3 天前 ★★★★★

Assessing the Operational Impact of Poisoning Attacks over Augmented 3D Point Cloud Public Datasets for Connected and Autonomous Vehicles

论文研究自动驾驶场景下，针对公共3D点云数据集的投毒攻击在数据增强流程中的实际影响。作者发现，尽管数据增强通常被视为具有一定“清洗”作用，但基于GAN的增强仍可能让投毒样本和后门继续传播，并最终干扰通用分类器决策。论文同时公开工具、数据集与分类器以支持复现。

论文 arXiv AI · 3 天前 ★★★★★

Data Analysis in the Wild: Benchmarking Large Language Models Against Real-World Data Complexities

论文提出面向真实数据分析场景的基准 DataGovBench，基于政府开放数据构建，覆盖复杂多表问答与探索式洞察生成两项任务，要求模型处理外部知识整合、分解式推理及可视化输出。实验显示，无论是否结合 agent 框架，当前主流大模型在两项任务上均存在明显能力缺口，距离实际数据分析需求仍有较大差距。

论文 arXiv AI · 3 天前 ★★★★★

Prompt-Adapter Context Routing for Parameter-Efficient Multi-Shot Long Video Extrapolation

论文提出 PACR-Video，一种面向多镜头长视频外推的参数高效框架，在冻结文本到视频扩散 Transformer 的前提下，通过低秩时序适配器、镜头角色提示词和递归提示库，实现跨镜头实体、场景、风格与因果连续性保持。在六个基准上，其在画质、语义对齐、身份一致性与转场连贯性等指标上优于多类基线。

论文 arXiv AI · 3 天前 ★★★★★

A Physics-Informed Neural Network Framework for Elastodynamic Wave Propagation in Bimaterial Systems

论文提出一种面向双材料体系瞬态弹性动力波传播的物理信息神经网络框架，将轴对称线弹性控制方程及初始、边界和界面条件直接纳入损失函数，并结合 ANSYS 显式有限元结果进行验证与辅助训练。模型可准确预测界面处波反射与透射、应力应变演化，并对未见时间点和材料参数实现连续代理预测。

论文 arXiv AI · 3 天前 ★★★★★

Provable learning separation for predicting time-evolution of quantum many-body systems

论文提出一个基于量子多体系统哈密顿演化预测的PAC监督学习任务：训练数据由随机稳定子探针态、演化时间及观测量期望值组成。作者给出可高效训练与推理的量子学习流程，并证明在特定分布下经典多项式时间算法难以满足学习条件，除非复杂度类发生塌缩，从而建立量子学习相对经典方法的严格可证明分离。

论文 arXiv AI · 3 天前 ★★★★★

WordVoice: Explicit and Decoupled Multi-Dimensional Word-Level Control for LLM-Based TTS

论文提出面向大语言模型语音合成的可控框架 WordVoice，解决现有端到端 TTS 在词级韵律与时序控制上的不足。作者构建含4700小时双语数据集 WordVoice-5A，提供时长、边界、能量、音高和声调五维词级标注，并通过绑定 token 机制和声学调制模块实现多维解耦控制与更严格对齐。

论文 arXiv AI · 3 天前 ★★★★★

From Voting to Agent Collaboration: Answer-Type-Aware LLM Pipelines for BioASQ 14b

该研究面向 BioASQ 14b 生物医学问答任务，提出按题型自适应的 LLM 流水线：针对是非题采用片段打乱与自反思提升稳定性，事实题结合完整证据与思维链示例进行实体识别，列表题引入多智能体协作完成证据抽取、候选生成、验证与聚合。系统在官方评测中表现具有竞争力，并获 Batch 4 事实题第一。

论文 arXiv AI · 3 天前 ★★★★★

Danus: Orchestrating Mathematical Reasoning Agents with Fact-Graph Memory

论文提出面向研究级数学推理的多智能体编排系统 Danus，以共享事实图作为全局记忆管理核心。系统由主代理、并行证明搜索工作代理和无状态验证器组成，先校验再写入带有证明与逻辑依赖的事实节点，用于逐步构建长链条证明。作者在代数几何、奇点理论和组合学六个案例中验证其效果，并已开源。

论文 arXiv AI · 3 天前 ★★★★★

Analysis-by-Proxy: Localization Signals in VLMs Operating as Condition Encoders

论文聚焦视觉语言模型作为扩散图像编辑条件编码器时的定位性能损失，提出 Analysis-by-Proxy 框架，在单次前向约束下用轻量可解释代理模型分析其中间表示。研究发现，定位信号常滞留在随输入变化的中间层，难以传递至现有编辑流水线常用的预设条件层，揭示了空间知识表征与提取机制之间的根本错配。

论文 arXiv AI · 3 天前 ★★★★★

Finding H. pylori in the Fine Print: Evidence-Linked Multi-Agent Case Finding from Gastric Biopsy Reports

一项基于新加坡大型医疗系统 54 份匿名胃活检病理报告的回顾性试点评估显示，Nimblemind 多智能体系统可从结构化与自由文本中提取幽门螺杆菌阳性及相关胃炎证据，在 216 次字段判定中正确 213 次，整体准确率 98.61%。其优势主要在于报告级输出、证据句追溯与流程整合，而非明显优于对照模型。

论文 arXiv AI · 3 天前 ★★★★★

TILDE: TILt-based Distributional Erasure for Concept Unlearning

论文提出面向文生图扩散模型的概念遗忘方法 TILDE，将概念删除建模为分布对齐问题，目标是在满足遗忘约束下，尽量贴近预训练模型的最小偏移条件分布。方法采用能量倾斜目标与残差∇-GFlowNet训练，在物体、艺术风格和角色任务上实现有效遗忘，并提升保留能力、生成多样性与分布保真度。

论文 arXiv AI · 3 天前 ★★★★★

An Experimental Design Approach to Evaluating Agentic AI's Autonomous Model Discovery

论文提出一套评估具备自主建模与分析能力的Agentic AI实验设计框架，将编码代理视为随机的“模型发现算子”，系统衡量其输出质量、成本、耗时与过程复杂度的波动，并分析推理强度、任务类型、优化指标和训练数据构成等因素对结果的影响，案例测试对象为Codex与Claude Code。

论文 arXiv AI · 3 天前 ★★★★★

RuBench: A Repository-Level Agentic Coding Benchmark with Natively Authored Russian Task Specifications

RuBench 1.0 发布一套面向仓库级代理编程的俄语基准，含 5 个开源项目的 25 个真实修复任务，任务描述以俄语原生撰写且未公开回归测试。评测 Claude Code 与 Codex CLI 等产品配置后，最佳方案任务解决率为 78.7%；研究还发现产品会静默切换底层模型，强调评测对象应是完整产品而非单一模型。

论文 arXiv AI · 3 天前 ★★★★★

ExplAIner: A Declarative Query Language for Explaining Classification Models

论文提出面向布尔分类模型解释的声明式查询语言 ExplAIner，扩展并改进 FOIL，解决其难以表达最优性解释查询及在决策树上计算复杂度过高的问题。ExplAIner 可统一表示溯因、对比、特征与距离等多类解释，并证明其查询求值落入布尔层级；同时提出 Opt-FOIL 用于求解偏序下最小解释，支持通过有限次或多项式次 SAT 求解实现。

论文 arXiv AI · 3 天前 ★★★★★

What Images Cannot Say: Language-Guided Olfactory Representation Learning

论文提出多模态框架 SCENT，以语言作为视觉与嗅觉之间的语义桥梁。方法借助视觉语言模型生成场景描述，引导气味编码器将电子鼻信号映射到与图像、文本对齐的共享嵌入空间，并通过潜变量分解区分物体气味与环境因素。在 New York Smells 数据集上，其气味到图像、气味到文本检索均优于仅视觉基线并达到 SOTA。

论文 arXiv AI · 3 天前 ★★★★★

A Definition and Roadmap for World Models

文章围绕“世界模型”给出统一科学定义，指出该概念虽已广泛用于基于模型强化学习、视频生成、具身机器人和物理AI等方向，但学界仍缺乏对其本质、预测对象及构建方法的共识。作者据此梳理关键技术维度，并提出分阶段研发路线图，为后续系统设计与评估提供框架。

论文 arXiv AI · 3 天前 ★★★★★

Learning to Throw Objects Safely in Multi-Obstacle Environments

论文提出面向多障碍环境的安全机器人投掷方法，用势场状态表征同时编码目标篮筐吸引与障碍物排斥，并在固定网格上支持对任意数量和布局障碍的泛化。研究结合示教初始化与强化学习训练，对比SAC、DDPG、TD3后发现SAC最稳定；实机在未知可投物体和杂乱场景中成功率最高达90%。

论文 arXiv AI · 3 天前 ★★★★★

A Function-Space Dichotomy for Compositional Learning: Exponential Sub-Optimality of the Neural Tangent Kernel

论文从函数空间角度解释神经网络在组合结构任务上优于神经切线核（NTK）的原因，提出傅里叶复杂度与架构复杂度二分框架，并给出深度L、宽度w、权重变分范数R受限ReLU网络的极小极大误差率界。结果显示，对迭代锯齿等目标，NTK所需样本量相对最优下界呈指数级劣化，实验也验证网络在稀疏奇偶任务上显著领先NTK。

论文 arXiv AI · 3 天前 ★★★★★

Training-Free Acceleration for Vision-Language-Action Models with Action Caching and Refinement

论文提出面向视觉-语言-动作模型的免训练加速方法 ActionCache，通过外部缓存复用历史中间动作，为流匹配式动作生成提供热启动，缓解迭代去噪带来的推理瓶颈。该方法可跨回合和跨任务检索相似上下文，在仿真与真实环境中保持较高任务成功率，并分别为 π0.5 和 GR00T-N1.6 实现最高 11.75 倍和 34.43 倍推理加速。

论文 arXiv AI · 3 天前 ★★★★★

Automated Compliance Mapping in Cloud Security with Domain-Adapted Sentence Transformers

论文针对云安全合规控制与技术指标映射依赖人工的问题，提出对 Sentence Transformer 进行领域自适应。作者构建含3499组语义对的数据集，并通过回译和基于大模型的改写扩增至最多13996条，在两项独立任务上验证，微调模型均显著优于零样本基线，最佳结果在 control-to-metric 任务上提升最高23个 nDCG@10 点。

论文 arXiv AI · 3 天前 ★★★★★

TopoBrick: Agentic Topology Sampling of Exogenous Variables for Zero-Shot Building IoT Forecasting

TopoBrick 提出一种免训练的零样本楼宇物联网预测框架，利用楼宇知识图谱构建结构骨架，并通过具备代理式决策的拓扑采样器为目标传感器选择外生变量。方法按部署时可获得性区分历史已知状态与未来已知日历、排班和气象信息，在三个真实楼宇上优于多种零样本基础模型，并接近经专门训练的楼宇模型表现。

论文 arXiv AI · 3 天前 ★★★★★

Physics-Informed Neural Embeddings of PDE Solution Families

论文提出一种面向偏微分方程解族的物理约束神经嵌入框架：以多头 PINN 共享主干学习潜在流形，线性头重建不同初始条件下的解，并通过头正交惩罚抑制退化、稳定主成分谱。在 Burgers、热方程和波动方程实验中，20 维潜空间可压缩到少数主成分解释 95%至99% 方差，并得到可复现的频谱画像。

论文 arXiv AI · 3 天前 ★★★★★

Responsible Personalisation: The Double-Edged Sword of Personalisation in Human-Robot Interaction

文章提出一个面向个性化人机机器人交互的生命周期与情境敏感框架，从具身性视角系统梳理风险如何在不同阶段、短期或长期、开放域或封闭域场景中产生与演化，并分析自主性削弱、偏见建模、操控、去人性化和隐私侵犯等伦理问题，进一步给出设计建议与后续研究方向。

论文 arXiv AI · 3 天前 ★★★★★

Harnessing Code Agents for Automatic Software Verification

论文提出将通用大模型代码代理接入形式化验证框架，由模型自主选择证明策略，在验证约束下自动生成可被证明器内核接受的证明。系统 Aria 在 Coq 的 Iris 上自动证明 4257 条核心引理、217 条 Rust 标准库验证引理，在 reglang 上完成 318 条，并在 Lean 4 的 iris-lean 中证明 72 条引理，显示出跨证明器的通用性。

论文 arXiv AI · 3 天前 ★★★★★

Driving the Wrong Way: Leveraging Interpretability in End2End Autonomous Driving Models

论文提出在端到端自动驾驶模型中引入无监督字典学习作为事后可解释模块，将驾驶行为分解为具语义的概念，并验证这些概念对轨迹预测和驾驶决策的因果影响。研究还通过概念级干预纠正错误行为，实测提升整体驾驶表现，为降低模型黑箱性与定向修正提供方法。

论文 arXiv AI · 3 天前 ★★★★★

Estimating Uncertainty from Reasoning: A Large-Scale Study of Multi- and Crosslingual MCQA Performance in LLMs

该研究首次在22种语言上大规模评估大模型多语与跨语选择题问答中的不确定性估计，比较9种开箱与闭箱方法、不同规模和架构模型。结果显示：低资源语言若以英文展开推理，可显著提升不确定性估计并缩小语言差距；生成语言比提问语言更关键；小模型更适合概率型方法，大模型则更适合自陈式不确定性方法。

论文 arXiv AI · 3 天前 ★★★★★

DT-Guard: Intent-Driven Reasoning-Active Training for Reasoning-Free LLM Safety Guardrail

论文提出安全护栏模型 DT-Guard，采用“训练时激活推理、推理时免显式思维链”范式，将安全判断拆解为意图、风险类别与安全性递进决策，并构建含意图标签、风险类别与结构化推理轨迹的数据集。实验显示其在提示侧与回复侧安全基准上平均 F1 分别达 0.886 和 0.870，基于 4B 骨干超过多种 8B 护栏基线。

论文 arXiv AI · 3 天前 ★★★★★

Dithered Gaussian Mechanism for Randomness-Efficient Differential Privacy

论文提出抖动高斯机制，作为差分隐私中离散高斯机制的替代方案：对私有输出而非噪声分布做离散化，因此可直接继承标准高斯机制的隐私保证，并规避有限精度浮点输出带来的漏洞。该方法还能显著降低高质量随机比特需求，使其与噪声规模解耦，并在 DP-SGD 训练中以较小开销实现更安全的加密级噪声生成。

论文 arXiv AI · 3 天前 ★★★★★

Token-Based Dual-view Fusion and Adaptation of Large Vision Models for Breast Cancer Classification

论文提出一种用于乳腺X线双视角分类的token级双视图融合框架，在冻结视觉Transformer主干上结合提示学习适配与跨视角交互。方法通过专用融合token在CC与MLO视图间进行多层跨注意力通信，避免直接特征融合造成表征混杂，并在VinDr-Mammo和CMMD上优于多种基线。

论文 arXiv AI · 3 天前 ★★★★★

UI2App: Benchmarking Visual Interaction Inference in Executable Web Application Generation

论文提出首个面向可执行 Web 应用生成中“交互推断”能力的基准 UI2App，要求模型仅依据界面截图还原应用行为，无文本或行为提示。数据集含327张截图、45组多路由应用状态集，并从可执行性、导航可达性、视觉保真度和交互推断四维评测。对6个前沿视觉语言模型实验显示，视觉还原与交互实现能力明显失衡，跨页面状态等高复杂度交互仍是核心瓶颈。

论文 arXiv AI · 3 天前 ★★★★★

Designing Maintainable Hybrid Generative Systems: A Quantum-Inspired Approach to Automated Music Harmony Generation

论文提出一种用于旋律自动和声生成的可维护混合生成架构，将量子启发式候选探索与显式规则优化结合，在生成灵活性和结构控制间取得平衡。研究以结构连贯性、功能一致性、和声相似度及鲁棒性等可复现实验指标评估，结果显示该方法无需训练语料即可保持调性结构与终止式特征，并提升稳定性和可预测性。

论文 arXiv AI · 3 天前 ★★★★★

Quantitative Gaussian-Process limits of Tensor Programs

论文研究随机神经网络在无限宽度下的高斯过程极限，基于 tensor programs 建立 Wasserstein 距离下的定量收敛理论。核心结果给出有限宽网络与其高斯过程极限之间显式误差界，收敛阶为宽度的平方根倒数，且框架与具体架构无关，适用于前馈网络及与循环、Transformer 相关的权重共享结构。

论文 arXiv AI · 3 天前 ★★★★★

From Sinhala to Dhivehi: Cross-Lingual Transfer Learning for Low-Resource Speech Recognition

研究聚焦马尔代夫低资源语言迪维希语语音识别，评估从语言相关性更强、资源更丰富的僧伽罗语进行跨语言迁移的效果。论文开展17组实验，覆盖持续预训练、顺序微调、多语微调等5类方案，其中“僧伽罗语持续预训练+迪维希语微调+KenLM”最佳，达到12.89% WER和2.70% CER，显著优于迪维希语单语基线。

论文 arXiv AI · 3 天前 ★★★★★

Kernel-based Operator Learning: Error Analysis, Budget Allocation, and a Physics-Informed Extension

论文研究基于核方法的算子学习，在离线回归学习离散算子、在线重建输出函数的两阶段框架下，提出训练样本数N、输入观测数n与输出分辨率m之间的显式预算分配条件。作者通过耦合误差分析分解学习与重建误差，并给出收敛与误差平衡的定量缩放律，同时提出在在线重建阶段加入PDE残差惩罚的物理信息扩展，无需重新训练。

论文 arXiv AI · 3 天前 ★★★★★

Task Decomposition-Guided Reranking for Adaptive Agent Skill Retrieval

论文提出推理时技能重排框架 SkillReranker，用于解决智能体在大规模技能库中因语义相近、任务难度与技能适配性变化导致的选技不准问题。方法通过对任务与技能做语义分解，构建任务状态与候选技能组成的有向无环执行图，再按子任务区间用 cross-encoder 评分筛选技能。在 ALFWorld 和 ScienceWorld 上，该方法提升任务成功率，并减少交互步数与 token 消耗。

论文 arXiv AI · 3 天前 ★★★★★

From Application-Layer Simulation to Native Meta-Architecture: Structural Tension as an Endogenous Driver for Heterogeneous AI Evolution

论文提出将依赖提示词和上下文管理的应用层认知协议，下沉为原生元架构的理论框架，核心包括结构张力、离线递归循环和推理时可塑性三项机制。在不修改预训练权重前提下，模型可围绕内部一致性进行自处理与拓扑重构，并在可审计、可逆等治理约束下形成具路径依赖差异的异构智能生态。

论文 arXiv AI · 3 天前 ★★★★★

Early Language Learning via Spreading Activation and Category Exploration in Complex Networks

该研究将儿童早期词汇习得建模为复杂网络中的图搜索过程，由扩散激活与对词汇类别的强制探索共同驱动，并在德语、英语、荷兰语和拉普拉塔西班牙语四种语言上验证。结果显示，扩散激活较最短路径基线更能拟合规范词汇习得年龄，并更好刻画类别切换、爆发性与持续时间等探索动态。

论文 arXiv AI · 3 天前 ★★★★★

VendorBench-100: A Unified Cross-Paradigm Benchmark for Deepfake Image Detection

研究提出跨范式深伪图像检测基准 VendorBench-100，采用100张对抗性样本、统一输出格式和评测框架，对36个商业API、零样本视觉大模型及开源检测器进行比较。结果显示商业API整体中位表现最佳，但部分开源模型可与顶尖视觉大模型竞争；更关键的发现是 ROC-AUC 与 MCC 经常分化，说明排序能力强并不意味着默认阈值下判别可靠。

论文 arXiv AI · 3 天前 ★★★★★

A Convex Approximation Framework for Neural Likelihood-Based Bayesian Inverse Problems

论文提出面向贝叶斯逆问题的神经似然近似凸优化框架，针对高维场景下传统 MCMC 难以适用的问题，改进直接从数据学习似然函数的方法。作者通过采用未归一化势函数并将归一化并入训练目标，使学习问题严格凸化，并证明经验极小值解会随样本增多收敛到真实似然；实验在去模糊与非线性 PDE 成像任务上验证效果。

国内量子位 · 4 天前 ★★★★★

Claude的脑子里，也长出了一块「意识」

围绕 Anthropic 模型 Claude 的内部机理研究显示，其参数空间中可能形成类似“类脑功能区”的表征结构，承担部分高层认知与推理能力；相关片段若被删除，模型表现会明显下降。该发现涉及可解释性与模型安全研究，但目前更接近实验观察，尚不能证明模型具备真实意识。

论文 arXiv AI · 4 天前 ★★★★★

From Fixed to Free Cameras: Calibration-Free View-Robust Vision-Language-Action Model

阿里达摩院提出 CamVLA，一种免标定、免深度、单目单视角的视角鲁棒视觉语言动作模型。该方法将机械臂控制拆分为相机坐标系下的末端执行器动作预测与相机到机器人基座的6DoF手眼矩阵预测，再经几何变换合成为基座动作，在仿真和真实机器人数据上均提升了未见视角下的任务成功率。

论文 arXiv AI · 4 天前 ★★★★★

Weak-to-Strong Generalization via Direct On-Policy Distillation

论文提出 Direct On-Policy Distillation（Direct-OPD），将小模型经 RLVR 训练前后策略差异转化为对强模型的隐式奖励信号，在学生模型自身 on-policy 状态上完成迁移，无需为目标模型重复稀疏奖励 RL 或单独训练奖励模型。实验显示，该方法可稳定实现弱到强泛化，并将 Qwen3-1.7B 在 AIME 2024 上从 48.3% 提升至 62.4%。

论文 arXiv AI · 4 天前 ★★★★★

Interpretable Human-Label-Free Deep Learning for Real-Bogus Classification with Uncertainty Quantification

论文提出一种无需人工标注的天文瞬变 Real-Bogus 分类框架，结合模拟瞬变注入与含污染的巡天数据，采用双网络与非对称 co-teaching 应对不同噪声标签。方法在强类污染下仍保持稳定，并通过 MC dropout、深度集成及混合策略实现较好不确定性校准，还可较高保真恢复光变曲线类别。

论文 arXiv AI · 4 天前 ★★★★★

LLM-as-a-Verifier: A General-Purpose Verification Framework

论文提出通用验证框架 LLM-as-a-Verifier，将“验证解答正确性”作为提升大模型能力的新扩展维度。该方法无需额外训练，通过对评分 token logits 分布求期望生成连续分数，并沿评分粒度、重复评估和标准拆解三方面扩展验证能力，在多项基准上取得 SOTA，还可用于任务进度估计、Claude Code 扩展及强化学习稠密反馈。

论文 arXiv AI · 4 天前 ★★★★★

Search Beyond What Can Be Taught: Evolving the Knowledge Boundary in Agentic Visual Generation

论文聚焦视觉生成模型的世界知识瓶颈，提出 SearchGen-20K、SearchGen-Bench 和百万级预执行搜索语料，系统评测模型在长尾、时效性和新实体请求上的失真问题。作者提出“先教学再搜索”的协同训练框架，以发现生成器不断变化的知识边界，并验证其可带来持续性能提升。

论文 arXiv AI · 4 天前 ★★★★★

What Does a Discrete Diffusion Model Learn?

论文从连续时间马尔可夫链视角统一解释离散扩散模型学习目标，证明负 ELBO 精确等于数据熵与真实反向过程到学习过程的路径 KL 之和，并提出 Oracle Distance 定理。研究给出去噪器、桥接插件预测器和 score 三种等价坐标及闭式转换，系统解释 MDM、UDM、SEDD、GIDD 等方法差异，并分析不同噪声下的初始化发散与校准问题。

产品应用 114

国内 36氪 AI · 4 小时前 ★★★★★

遭连日舆论抨击后，Meta暂停AI图像生成功能

Meta因一项可通过@公开Instagram账号调用其素材生成图片的AI功能，连续多日遭遇舆论批评及好莱坞艺人经纪公司质疑，已宣布暂停该功能。Meta称该功能原本提供退出授权选项，但大量反馈认为设计存在严重问题，显示生成式AI在内容授权、公开数据使用与用户同意机制上仍面临合规与信任挑战。

国内 36氪 AI · 4 小时前 ★★★★★

三菱汽车将量产人形机器人，未来或考虑对外销售

三菱汽车宣布将在日本工厂启动人形机器人量产，相关产品由其与被投企业Highlanders共同开发，预计于2027年前后投产，并优先用于自身工厂。公司计划在京都发动机工厂闲置空间建设新产线，月产能目标为1000台，后续也将考虑对外销售。

媒体 TechCrunch AI · 5 小时前 ★★★★★

Meta removes controversial AI feature on Instagram after backlash

Meta 已在 Instagram 上撤下此前引发争议的 AI 功能。根据 Meta 向 Puck News 记者 Dylan Byers 的表态，该功能因用户强烈反弹而被取消。事件反映出社交平台在引入生成式 AI 能力时，仍需在用户体验、透明度与接受度之间谨慎平衡。

媒体 The Verge AI · 6 小时前 ★★★★★

Meta turns off the Instagram feature that let users make AI deepfakes of public accounts

Meta 因强烈反对关闭了本周刚推出的 Instagram AI 生成功能。该功能允许用户仅通过标记公开账号，即基于其公开内容生成 AI 图像，且无需账号所有者许可，引发关于深度伪造、肖像权与平台内容使用边界的争议，Meta 随后宣布停用该功能。

媒体 Hacker News · 8 小时前 ★★★★★

GPT-5.6, Grok 4.5, Claude, and Muse Spark build the same 4 apps

一篇对比评测文章让 GPT-5.6、Grok 4.5、Claude 与 Muse Spark 等 12 个模型完成相同的 4 个应用构建任务，并通过 Hacker News 引发讨论。内容核心是比较不同模型在代码生成、任务完成度与应用开发表现上的差异，属于面向开发者的实测类资讯。

媒体 The Verge AI · 10 小时前 ★★★★★

A decade later, Pokémon Go finally made good on its original promise

《Pokémon Go》在纽约举办十周年活动，展示了其最初宣传中“多人协作捕捉稀有宝可梦”的核心愿景如何真正落地。活动吸引近2000名玩家参与，通过大规模线下联动和协作机制，体现增强现实游戏在社区组织、玩法设计与现实互动上的长期演进。

媒体 Hacker News · 13 小时前 ★★★★★

Hands-On with the AMD Ryzen AI Halo

文章聚焦 AMD Ryzen AI Halo 平台的上手体验与初步评测，涉及其在本地 AI 计算、CPU/GPU 协同能力及面向轻量设备的性能表现。内容来源于零售媒体实测，并在 Hacker News 引发讨论，反映市场对 AMD 端侧 AI 芯片实际体验、功耗与应用场景的关注。

媒体 The Verge AI · 14 小时前 ★★★★★

Anker’s 3-in-1 Qi2.2 charging station is $95 off

Anker 旗下 Prime 3 合 1 无线充电站近期降至 134.99 美元，较原价优惠 95 美元，创历史新低。产品支持 Qi2.2，可同时为兼容 MagSafe 的 iPhone、Apple Watch 和 AirPods 充电，主打桌面整理与多设备便捷补能，属于消费电子配件促销信息。

国内量子位 · 15 小时前 ★★★★★

AI生物研发进入“操作系统时代”，许锦波团队MoleculeOS正式开放

许锦波团队宣布面向生物研发场景的 MoleculeOS 正式开放，定位为以 AI 统筹研发流程的“操作系统”。该平台强调让 AI 从单点工具升级为研发过程的组织者与协调层，服务分子设计、实验执行与流程管理等环节，反映 AI 生物研发正从模型能力竞争转向系统化平台建设。

媒体 The Verge AI · 16 小时前 ★★★★★

Instagram’s Adam Mosseri: If you don’t like AI, ‘then you shouldn’t have it in your feed’

Instagram 负责人 Adam Mosseri 在播客中表示，平台不应主动过滤 AI 生成内容，而应通过标识和推荐机制让不喜欢此类内容的用户在信息流中尽量少看到相关帖子。其表态反映出 Meta 对 AI 内容治理更倾向于透明披露与个性化分发，而非一刀切封禁。

媒体 The Verge AI · 16 小时前 ★★★★★

Would you host part of an AI data center in your home?

太阳能与家庭储能公司 Sunrun 正试点“分布式 AI 计算”项目，计划将多台计算节点部署到用户家中，并向参与用户支付费用，以家庭侧电力与储能资源承载部分 AI 数据中心算力需求。该模式意在以去中心化方式扩展 AI 基础设施，探索能源系统与算力部署结合的新路径。

国内 36氪 AI · 17 小时前 ★★★★★

消息称AMD将于本月发布Venice CPU

报道称，AMD计划在7月22日至23日举行的 Advancing AI 活动上发布基于 Zen 6 架构的 EPYC Venice 服务器 CPU。消息称，该产品相较基于 Zen 5 的上一代 EPYC 在性能和能效方面提升超过70%，显示其正继续强化面向数据中心与AI基础设施的处理器竞争力。

国内 36氪 AI · 20 小时前 ★★★★★

上纬新材CEO田华：将在WAIC全球首秀可变形机器人启元T1

上纬新材宣布将在本届WAIC全球首秀可变形消费级机器人“启元T1”。公司称，该产品突破传统人形机器人形态，以可变形设计面向家庭消费场景，尝试重塑个人机器人产品定义。同时，上纬启元已在上海、深圳、西安、厦门、广州等地推进线下体验门店落地，渠道建设同步展开。

国内量子位 · 20 小时前 ★★★★★

一群做自动驾驶的人，盯上了睡眠这件事

文章聚焦一批具备自动驾驶背景的从业者将技术能力转向睡眠场景，核心思路是把自动驾驶中的数据采集、感知分析和闭环优化方法引入卧室，通过持续监测与反馈改进睡眠体验，反映出跨行业技术迁移和健康硬件应用的新趋势。

国内 36氪 AI · 20 小时前 ★★★★★

每刻深思、壁仞科技与阶跃战略签约

空间光计算芯片企业每刻深思近日在北京与壁仞科技、阶跃完成战略签约，三方联合发布光电融合AI计算平台创新方案，并推出全球首个结合光计算与通用电计算的AI智算产品，显示产业链企业正围绕新型算力架构推进协同落地。

国内量子位 · 20 小时前 ★★★★★

日均提问次数暴增 20 倍！百度搭子宣布重磅升级，企业版同步发布

百度“搭子”宣布重磅升级，并同步推出企业版，显示其正从个人使用场景向企业服务延伸。标题称产品日均提问次数增长20倍，反映用户交互频次显著提升。结合“agent时代来了”的表述，此次更新重点或在强化智能体能力与商业化落地。

国内 36氪 AI · 22 小时前 ★★★★★

移远通信推出三档电致变色光波导AR眼镜

7月9日，移远通信在XR解决方案与生态战略发布会上推出全链路自研AI+AR眼镜Hawk系列及配套算力单元Dolphin系列，产品覆盖不同芯片平台、光学方案与算力需求。其中光波导版本支持电致变色，可随环境光自动调节透光度，BirdBath版本主打沉浸式显示，标志公司正式进入XR赛道。

国内 36氪 AI · 22 小时前 ★★★★★

三星研发AI PC加速芯片GAIA，已向联想、惠普提供样片测试

报道称，三星电子正研发名为 GAIA 的 AI PC 加速芯片，已向联想集团和惠普提供原型样片进行性能测试，计划明年启动量产。该芯片采用 4 纳米制程，集成 NPU，面向生成式 AI 任务，并支持存算一体（PIM）技术，显示三星正加码端侧 AI PC 硬件布局。

官方/研究 OpenAI Blog · 22 小时前 ★★★★★

How Deutsche Telekom is rewiring telecommunications with AI

德国电信正与 OpenAI 合作推进“AI 原生”转型，将生成式 AI 引入客户服务、员工工作流、网络运维和语音交互等核心环节。该举措显示传统电信运营商正把 AI 从单点工具扩展为企业级基础能力，以提升服务效率、运营自动化水平和未来通信体验。

国内 36氪 AI · 23 小时前 ★★★★★

日本逾七成住宿设施劳动力短缺

日本政府发布旅游业年度白皮书称，在去年12月至今年1月调查的522家住宿设施中，72.2%反映存在人手不足。报告指出，日本受老龄化与低生育率影响，各行业普遍缺工，服务业因薪酬偏低问题更为突出。政府呼吁住宿业加大技术投入，引入自助入住系统和送餐机器人缓解压力。

国内量子位 · 1 天前 ★★★★★

AI华语歌，终于能听了！从零预训练十亿参数，告别「人机味」

文章称字节跳动已进入 AI 华语歌曲生成赛道，并提到相关方案采用从零预训练、规模达十亿参数，目标是降低以往生成歌曲中的“人机味”，提升中文演唱的自然度、可听性与表现力。现有信息有限，重点在于字节入局及模型能力方向。

国内 36氪 AI · 1 天前 ★★★★★

曹操充电携手支付宝碰一下发布基于AI大模型的全新智能充电桩

曹操充电在支付宝“碰一下”生态大会上发布基于AI大模型的新一代智能充电桩，并与支付宝碰一下签署新合作协议。未来3年，双方计划推动“碰一下”充电桩覆盖30万存量桩和20万新增桩，整体部署规模预计突破50万桩，面向充电基础设施智能化升级。

国内 36氪 AI · 1 天前 ★★★★★

阳光电源：海外CSP厂商对公司SST产品认可度较高，预计2026年以小批量样机和试验验证为主

阳光电源披露，受AI算力增长推动，数据中心供电架构升级将带动SST成为趋势。公司称海外CSP厂商对其SST产品认可度较高，已与北美头部云厂商沟通并共同定义规格。按规划，2026年以小批量样机和试验验证为主，2027年启动批量订单，2028年后进入规模化发展阶段。

国内 36氪 AI · 1 天前 ★★★★★

海光信息亮相光合组织2026智能计算应用大会

7月9日至11日，海光信息在光合组织2026智能计算应用大会首次集中展示“云边端”完整算力体系，展出基于海光C86芯片的智能巡检机器人、AI BOX端侧一体机及EtherCAT运动控制方案，面向工业控制和精密制造等场景。同期，全国产十万卡AI超集群曙光8000（登峰）落成，采用海光等国产芯片作为算力底座。

国内 36氪 AI · 1 天前 ★★★★★

扎克伯格否认Meta算力过剩，称发展云业务具商业潜力

扎克伯格7月9日表示，Meta当前并不存在算力过剩，现有资源基本都用于AI开发与运行。在市场算力供不应求、外部报价较高背景下，Meta也在评估将部分AI基础设施出租或开展云计算业务的商业可能性，并称若愿意进入该市场，随时具备推进条件。

媒体 TechCrunch AI · 1 天前 ★★★★★

OpenAI says GPT 5.6 is the ‘preferred model’ for Microsoft Copilot 365 amid breakup chatter

OpenAI表示，其新一代GPT 5.6模型家族将继续为微软Microsoft 365 Copilot等办公与生产力应用提供底层能力，并称其为该产品线的“首选模型”。消息出现在双方合作关系或调整传闻背景下，释放出OpenAI与微软在企业AI应用层面仍保持紧密协作的信号。

媒体 TechCrunch AI · 1 天前 ★★★★★

OpenAI is shutting down Atlas, but its AI browser ambitions are still growing

OpenAI将在上线不足一年的情况下关闭其AI浏览器产品Atlas，但并未收缩浏览器方向布局。公司正把部分具备代理式浏览能力的功能迁移至桌面应用和Chrome扩展，显示其策略从独立浏览器转向更轻量的入口形态，继续推进AI辅助上网与任务执行能力。

媒体 Hacker News · 1 天前 ★★★★★

Building a real-time AI tutor for 5-year-olds

一家公司介绍其实时 AI 儿童家教系统，面向 4 至 9 岁孩子教授阅读、数学和英语等内容。为实现对话级响应与教学决策并行，团队自建流式执行器与异步规划模型，并加入逐轮安全审查机制，在不中断交互的前提下引导学习流程与内容输出。

媒体 The Verge AI · 1 天前 ★★★★★

The ChatGPT browser is already dead

OpenAI确认将关闭可代用户执行任务的浏览器产品ChatGPT Atlas。该产品于去年10月发布，不到一年即被纳入此次围绕ChatGPT Work的一系列调整中宣布退场。消息显示Atlas将被“sunsetting”，反映OpenAI正收缩相关浏览器探索并将资源转向新的工作场景产品布局。

媒体 The Verge AI · 1 天前 ★★★★★

Google will now tell you if an ad was made with AI

谷歌更新“My Ad Center”，在搜索、Discover 和 YouTube 广告的“how this ad was made”页面新增“created or edited with AI”标签，向用户披露广告是否由 AI 生成或编辑。该功能提升广告透明度，帮助用户识别生成式 AI 在广告制作中的应用方式。

媒体 Hacker News · 1 天前 ★★★★★

Show HN: Reviving my 2001 college band with AI

一名前乐队成员分享用 AI“复活”其 2001 年大学乐队 Fading Maize 的项目：在保留当年原创歌词、旋律和编排基础上，借助 AI 完成新版本制作，并上线可在原始宿舍录音与 2026 重制版间无缝切换对比的网站，同时保留可浏览的 2001 年旧站，强调 AI 作为制作增强工具而非从零创作。

媒体 TechCrunch AI · 1 天前 ★★★★★

Meta enters the crowded AI coding battle with Muse Spark 1.1

Meta 推出面向 AI 编程场景的 Muse Spark 1.1，主打处理大规模代理式开发任务，可用于代码缺陷修复及大型代码迁移。其定位瞄准企业级自动化软件开发需求，切入竞争激烈的 AI 编码助手市场，反映大厂持续加码开发者工具与企业服务方向。

媒体 TechCrunch AI · 1 天前 ★★★★★

How to stop Meta’s AI image generator from using your Instagram photos

Meta 新上线的 AI 图像生成器默认可使用用户公开的 Instagram 照片训练或生成相关内容，未主动退出的公开账号受影响。报道聚焦用户如何在平台设置中提交反对或限制授权，反映生成式 AI 产品扩张下，社交平台图像数据使用与个人隐私控制问题再次受到关注。

媒体 Hacker News · 1 天前 ★★★★★

Show HN: I built a web tool to see and edit what an AI thinks before it answers

一名开发者受 Anthropic 关于“可言说表征构成全局工作空间”研究启发，基于开源模型实现并公开了可视化与编辑大模型中间层表征的网页工具。用户可观察模型在输出前激活的候选概念，并注入新概念改变回答；初步实验显示 J-lens 在 Llama、Qwen 上效果较明显，在 Pythia 上提升有限。

媒体 The Verge AI · 1 天前 ★★★★★

Microsoft’s patch Tuesdays are about to get bigger

微软表示将借助 AI 更早识别 Windows 11 潜在安全问题，因此未来每次“周二补丁日”安全发布中将纳入更多漏洞修复，单次更新覆盖范围扩大。此举旨在提升漏洞发现效率，并回应攻击者乃至低门槛黑客日益利用 AI 提升攻击能力的安全形势。

媒体 The Verge AI · 1 天前 ★★★★★

Schlage’s Sense Pro unlocks the door so I don’t have to

Schlage 推出智能门锁 Sense Pro，主打基于超宽带（UWB）的无感解锁体验。设备可在用户走近家门时自动开锁，无需输入密码、刷手机或指纹操作。文章认为其外观简洁、使用便捷，是 Schlage 迄今最智能的门锁之一，体现了 AIoT 与智能家居场景下更自然的人机交互趋势。

媒体 Hacker News · 1 天前 ★★★★★

Show HN: Policy enforcement for Claude Code, Cursor, and Codex

Kastra 面向 Claude Code、Cursor、Codex 等编程代理提供运行时授权控制，在工具调用执行前按确定性策略做出允许、挂起或拒绝决策。产品支持用自然语言配置策略，检查工具、目标与参数，并提供高风险策略包、不可篡改审计轨迹及本地历史扫描功能，用于识别密钥泄露、生产库操作、强制推送等风险行为。

媒体 TechCrunch AI · 1 天前 ★★★★★

Anthropic’s new Claude feature is quietly selling you on AI

Anthropic 为 Claude 推出新功能 Reflect 仪表盘，表面上用于可视化用户的 AI 使用情况与工作模式，实际也在持续强化用户对 Claude 的日常依赖感。报道聚焦这一产品设计如何通过数据反馈影响用户认知，反映 AI 助手平台正借助使用分析提升留存与黏性。

媒体 The Verge AI · 1 天前 ★★★★★

Sonos Ace wireless headphones are steeply discounted

Sonos Ace 无线主动降噪耳机近期在亚马逊、百思买、沃尔玛及 Sonos 官方渠道大幅降价，黑色款售价降至 279 美元，较原价 399 美元便宜 120 美元。报道核心为消费电子促销信息，聚焦耳机折扣力度、适用场景及多平台同步参与的销售情况。

媒体 The Verge AI · 1 天前 ★★★★★

Sony brings back the superzoom RX10 with a stacked sensor and a high price

索尼时隔近九年更新 RX10 系列，发布 RX10 V 长焦一体机。新机延续 24-600mm 等效 f/2.4-4 蔡司 25 倍变焦镜头，核心升级为 2010 万像素 1 英寸堆栈式传感器，以提升读取速度和整体性能，但定价较高，定位偏向高端拍摄用户。

媒体 The Verge AI · 1 天前 ★★★★★

Say hello to Claude Wrapped

Anthropic 宣布为 Claude 聊天机器人推出“reflect”功能，提供基于过去一个月使用数据的回顾分析，延续 Spotify Wrapped 带动的年度或阶段性总结产品趋势。该功能将 AI 使用行为可视化，帮助用户了解与 Claude 的互动模式与使用习惯，属于面向现有用户体验的产品功能更新。

媒体 Hacker News · 1 天前 ★★★★★

Show HN: FableCut – A browser video editor AI agents can drive (zero deps)

FableCut 是一款开源浏览器视频编辑器，主打零依赖架构，并强调可由 AI 代理直接驱动完成剪辑操作。项目通过 GitHub 在 Hacker News 展示，当前获得 37 个点赞和 18 条评论，反映出开发者社区对 AI 可操作视频编辑工具与轻量化实现路径的关注。

媒体 The Verge AI · 1 天前 ★★★★★

Character.AI wants a piece of the microdrama pie

Character.AI 宣布推出 c.ai Series，将业务从大模型聊天平台扩展到可在手机端观看并互动的短篇连续视频内容。该产品延续其在互动书籍、漫画和音频剧上的布局，瞄准微短剧赛道，通过结合生成式 AI 与剧情交互，探索娱乐内容形态与用户参与方式的进一步融合。

媒体 TechCrunch AI · 1 天前 ★★★★★

Character.AI enters the microdrama arena with its own productions, but there’s a twist

Character.AI 进军微短剧领域并推出自制内容，差异化之处在于将其核心对话式 AI 能力嵌入作品体验。用户不仅可以观看剧情，还能与剧中角色聊天、提问，并开展不同情节的角色扮演，体现 AI 娱乐内容从被动消费向互动叙事延伸。

媒体 The Verge AI · 1 天前 ★★★★★

FL Studio 2026 turns its AI chatbot into your assistant engineer

Image Line 在 FL Studio 2026 中升级 AI 聊天机器人 Gopher：其角色从提供操作说明的“智能说明书”转向可执行辅助任务的“助理工程师”。新版强调更主动的制作协作能力，帮助用户在音乐创作与软件操作中更高效完成流程，体现 AI 正从知识检索向生产工具深度嵌入演进。

官方/研究 OpenAI Blog · 1 天前 ★★★★★

GPT-5.6 is now the preferred model in Microsoft 365 Copilot

微软宣布 GPT-5.6 已成为 Microsoft 365 Copilot 的首选模型，将为 Word、Excel、PowerPoint、Chat 和 Cowork 等场景提供更强 AI 能力。该升级重点提升生成质量、处理速度与任务完成效率，帮助企业用户在文档撰写、数据分析、演示制作和协作沟通中获得更高质量产出。

国内 36氪 AI · 1 天前 ★★★★★

星巴克利用AI开发内部工具，以减少对微软和IBM的依赖

星巴克正借助人工智能推进内部软件自研，目标替代现有依赖的微软库存追踪系统和IBM维护管理工具。相关工具目前仍处于测试阶段，若验证顺利，部分自研软件预计最早将在明年年底前正式投入使用，反映出大型企业以AI推动核心运营系统内建化的趋势。

官方/研究 OpenAI Blog · 1 天前 ★★★★★

ChatGPT is now a partner for your most ambitious work

OpenAI 推出 ChatGPT Work，将其定位为可跨应用与文件执行操作的智能代理，能够围绕单个项目持续工作数小时，并把用户目标逐步转化为可交付成果。该产品强调更强的任务执行、项目持续性与工作流整合能力，面向高强度、复杂型知识工作场景。

国内 36氪 AI · 2 天前 ★★★★★

英伟达将与Hugging Face合作开发机器人开源模型

英伟达宣布与 Hugging Face 合作开发面向机器人的开源基础模型，计划结合英伟达 GPU 与 CUDA 软件栈，以及 Hugging Face 的模型库和开发者社区资源，降低机器人 AI 的训练、适配与部署门槛，推动机器人模型生态开放化与开发效率提升。

国内 36氪 AI · 2 天前 ★★★★★

灵光App升级世界模型体验

7月9日，灵光App升级世界模型体验，接入蚂蚁灵波最新发布的LingBot-World 2.0能力。新版由此前以漫步浏览为主的“走一走、看一看”，扩展为更具交互性的可玩体验，用户可在场景中进行类似3D游戏的技能操作，AI再依据动作实时生成新的场景反馈。

国内量子位 · 2 天前 ★★★★★

获联合国机构点赞！天立启鸣“AI+教育”方案入选AI for Good

天立启鸣的“AI+教育”方案凭借“一生一案”理念入选 AI for Good，并获得联合国相关机构关注。该方案聚焦将人工智能用于教育场景，通过个性化学习与教育资源优化推动优质教育落地，体现国内教育科技企业在国际公益与技术应用平台上的实践进展。

国内 36氪 AI · 2 天前 ★★★★★

小鹏Robotaxi开启内测，何小鹏称Robotaxi是小鹏迈向“机器人汽车”的重要一步

小鹏集团已召开Robotaxi业务首次全员会，并正式启动员工内测。何小鹏称，Robotaxi是公司由新能源汽车迈向“机器人汽车”的关键一步，也是其物理AI版图的重要组成。小鹏未来将聚焦整车平台、自动驾驶软件及AI能力，定位为面向全球合作伙伴的Robotaxi软硬件解决方案服务商，推动Robotaxi全球化落地。

国内 36氪 AI · 2 天前 ★★★★★

国家超算互联网核心节点正式上线

7月9日，国家超算互联网核心节点在2026河南省人工智能大会上正式上线运行。该项目面向全国计算资源统筹调度，承担运营管理、资源调度等核心职能，并集成供需对接、产业孵化等服务，可对外提供超过10万卡国产AI算力，成为国家超算互联网平台接入的最大单体国产AI算力资源池。

国内量子位 · 2 天前 ★★★★★

从餐饮后厨到物理世界基础模型：量化派的物理AI，走的是卖能力的路

文章聚焦量化派布局物理AI的路径，指出其能力建设起点可追溯至餐饮后厨等实体场景，并进一步延伸至面向物理世界的基础模型研发。核心商业逻辑并非直接售卖单一终端产品，而是输出模型、算法与系统能力，为不同行业场景提供底层智能支持与落地方案。

国内 36氪 AI · 2 天前 ★★★★★

阶跃星辰AI智能体手机代工企业为华勤技术

据媒体援引知情人士消息，阶跃星辰即将推出的AI智能体手机将由A股上市公司华勤技术负责代工生产。双方被指为深度绑定合作关系，合作模式不止于传统贴牌制造，显示AI企业正加速与终端硬件厂商联动，推进智能体能力在手机形态落地。

国内量子位 · 2 天前 ★★★★★

同声传译一夜失业！GPT-Live瞬间翻译，老太太现场抬杠AI看傻全网

文章标题聚焦 GPT-Live 的实时语音翻译能力，强调其可作为高频使用入口，并以“同声传译失业”等夸张表述吸引关注。现有正文片段仅提到“变成你最常用的入口”，缺乏产品机制、发布时间、适用场景及性能数据，难以判断其实际行业影响与成熟度。

国内 36氪 AI · 2 天前 ★★★★★

阶跃星辰将发布AI智能体手机

阶跃星辰即将发布AI终端品牌、智能体系统及首款AI智能体手机，计划将大模型能力与终端硬件结合，率先推动智能体手机落地。对比OpenAI计划于2027年推出新一代AI终端，阶跃星辰此次动作意味着国内大模型厂商正加快向软硬一体化产品延伸。

媒体 The Verge AI · 2 天前 ★★★★★

Meta is reportedly working on smart glasses that would be recording all the time

据《金融时报》报道，Meta正研发一款具备“超级感知”功能的原型智能眼镜，可持续录音并每隔数秒拍摄照片，形成全天候环境感知能力。用户随后可通过Meta AI查询已捕捉的音频与图像内容。该产品仍处原型阶段，但凸显AI可穿戴设备向常时感知与多模态交互演进，同时引发隐私与数据采集争议。

媒体 TechCrunch AI · 2 天前 ★★★★★

Google’s deepfake detector system used to debunk McConnell hoax pic

一张据称显示美国参议员米奇·麦康奈尔插满管线、病情危重的图片近日在网络传播，后被证实为AI生成的深度伪造内容。报道指出，谷歌的深度伪造检测系统被用于识别并辟谣该图片，显示生成式内容识别工具已开始在公共舆情与政治信息核验中发挥作用。

媒体 Hacker News · 2 天前 ★★★★★

Show HN: Onboard-CLI, a LLM powered and AST-based tool to visualize codebase

Onboard-CLI 是一款结合大语言模型与 AST 分析的代码库可视化工具，项目在 GitHub 上发布，并通过 Hacker News 展示。现有信息显示其面向开发者理解代码结构与项目组织，帮助更快完成代码导览与上手，但未披露商业化、融资或大规模落地细节。

媒体 The Verge AI · 2 天前 ★★★★★

Microsoft’s Xbox reset is pivoting Obsidian to make Fallout instead of Avowed

微软推进 Xbox 业务重组，涉及约3200人裁员、剥离部分工作室，并将资源转向“更高优先级项目”。在此背景下，黑曜石娱乐调整开发计划，取消包括《Avowed》相关在内的多个项目，转而启动新的《辐射》作品开发，反映微软正收缩投入并集中资源押注核心IP。

媒体 TechCrunch AI · 2 天前 ★★★★★

Google Photos adds a new AI ‘Video Remix’ tool

Google Photos 新增 AI 视频编辑工具“Video Remix”，可对视频片段执行多种生成式处理，包括电影感补光提亮暗部、替换普通背景为趣味场景，以及叠加艺术化风格效果，进一步将生成式 AI 能力扩展到个人影像编辑与日常相册应用场景。

媒体 The Verge AI · 2 天前 ★★★★★

America’s cheapest new EV is smaller than a ping-pong table and tops out at 19mph

菲亚特 Topolino 被报道为美国市场最便宜的新电动车，主打极低售价，但在续航、空间、储物和功能配置上作出明显取舍。该车尺寸小于乒乓球桌，最高时速仅 19 英里，定位更接近低速短途代步工具，反映平价电动出行产品对成本与实用性的平衡。

媒体 Hacker News · 2 天前 ★★★★★

Show HN: Microsoft releases Flint, a visualization language for AI agents

微软开源发布面向 AI 代理的数据可视化中间语言 Flint，试图解决现有图表语言过于底层、代理难以稳定生成高质量可视化的问题。Flint采用基于语义类型的高层规范，并内置布局优化引擎，可从简洁描述自动补全低层细节，已用于微软开源项目 Data Formulator，并提供可接入代理应用的 MCP Server。

媒体 TechCrunch AI · 2 天前 ★★★★★

Meta wants its AI glasses to seem less creepy. Its AI strategy says otherwise.

Meta 为其 AI 眼镜新增防护措施，旨在减少用户利用设备秘密录制他人的风险，以缓解外界对隐私侵犯和“被监视感”的担忧。然而与此同时，Meta 仍在持续扩大其 AI 产品对个人数据的收集与使用范围，显示其隐私保护举措与整体数据驱动战略之间存在明显张力。

媒体 The Verge AI · 2 天前 ★★★★★

Twelve South’s AirFly Pro is a great travel companion, and it’s on sale for $40

Twelve South 旗下旅行配件 AirFly Pro 降价至 39.99 美元，较原价优惠 15 美元。该设备可将机上娱乐系统音频转换为蓝牙信号，让乘客使用无线耳机收听内容，适用于暑期出行场景。报道聚焦消费电子促销与差旅配件实用性，并非新品发布。

媒体 Hacker News · 2 天前 ★★★★★

GPT‑Live

OpenAI 发布 GPT‑Live 页面，文章片段仅提供官网链接及 Hacker News 讨论数据，显示该消息在开发者社区获得较高关注，HN 获得 298 分与 217 条评论。由于未给出功能细节、定价和适用场景，现阶段可确认其为 OpenAI 新产品或能力入口的公开发布。

媒体 The Verge AI · 2 天前 ★★★★★

ChatGPT’s upgraded voice mode is better at shutting up

OpenAI 正在升级 ChatGPT 语音模式，推出新模型 GPT-Live-1，重点改善对话节奏与交互自然度。该模型可减少对用户的打断，并在用户中途停顿时等待其继续发言，以更接近人与人交流体验。此次更新聚焦语音交互质量提升，属于现有产品能力优化。

媒体 Hacker News · 2 天前 ★★★★★

Show HN: Kastor – Terraform-style specs for AI agents

Kastor 是一项面向 AI 代理的开源项目，提出类似 Terraform 的声明式规范思路，用于定义、管理和复用代理配置与执行流程。该项目通过 GitHub 在 Hacker News 展示，当前讨论和关注度有限，反映开发者正探索以基础设施即代码方式提升代理系统的可维护性与可组合性。

媒体 Hacker News · 2 天前 ★★★★★

Show HN: Abralo – Free, easy way to run several Claude Code agents in one window

开发者发布桌面应用 Abralo，基于 Tauri 提供单窗口并行管理多个 Claude Code 代理的界面，支持 Windows、macOS 和 64 位 Linux。产品主打比终端和 VS Code 插件更易读、更稳定，可同时免费运行最多 4 个代理，并提供使用量预警、峰值可视化等功能。

媒体 The Verge AI · 2 天前 ★★★★★

The whole Pixel line could get more expensive this year

报道称，谷歌今年发布的 Pixel 系列产品可能整体提价。根据 Dealabs 相关爆料，41 毫米 Pixel Watch 5 起售价或升至 399 美元，LTE 版本可能达到 499 美元，较 Pixel Watch 4 基础款上涨 50 美元。消息显示，谷歌新一代硬件定价策略或趋于上调。

媒体 The Verge AI · 2 天前 ★★★★★

Fi’s Starlink-enabled pet tracker found my dog when LTE couldn’t

Fi 推出可购买的首款支持 Starlink 的宠物追踪器 Fi Ultra，在传统 GPS 与 LTE 追踪基础上，新增在蜂窝信号盲区自动切换至 T-Mobile 的 T-Satellite 直连卫星服务。该产品借助 SpaceX 低轨 Starlink 星座，实现美国范围内更广覆盖的宠物定位，主打弱网与无网场景下的追踪能力。

国内 36氪 AI · 2 天前 ★★★★★

亚马逊秘密推进Alexa“智能体”计划，成本高昂引发内部担忧

报道称，亚马逊正秘密推进代号“Moonraker”的新一代 Alexa AI 项目，计划将现有语音助手升级为具备更强任务执行能力的 AI 智能体。内部规划文件显示，该项目已进入实质推进阶段，但其研发投入与后续运行成本极高，已在公司内部引发对商业可行性与资源消耗的担忧。

国内 36氪 AI · 2 天前 ★★★★★

Cloudflare与OpenAI启动试点项目，拟利用全球网络数据优化AI搜索

7月8日，Cloudflare与OpenAI宣布启动研究试点，探索利用Cloudflare全球网络中的网站洞察与实时信号，如内容新鲜度、流量质量和页面变动情况，优化AI搜索引擎在开放网络上的内容发现、抓取与索引效率，以提升AI回答的准确性和时效性。

国内 36氪 AI · 2 天前 ★★★★★

腾讯健康与辉瑞中国达成AI医疗战略合作

辉瑞中国与腾讯健康宣布达成AI医疗战略合作，双方将结合腾讯在人工智能、云计算和数字生态连接方面的技术能力，以及辉瑞在医疗创新、疾病管理、科学洞见和循证医学上的经验，探索AI在患者服务、专业学术支持及医疗生态建设等场景的落地应用。

国内 36氪 AI · 2 天前 ★★★★★

Meta测试“超级感知”AI眼镜，可持续摄录引隐私争议

Meta于7月8日被曝测试具备“超级感知”能力的AI眼镜原型，设备可每隔数秒拍照并持续采集音频，借助AI让用户检索和回顾所记录的环境与经历。该产品瞄准“全视全听”可穿戴场景，但因可能持续记录周围非佩戴者信息，在Meta内部已引发明显的隐私与合规争议。

国内量子位 · 2 天前 ★★★★★

横跨淘天与ATH事业群，硬核少年技术节下周京杭同步开幕，四项AIGX硬核成果齐发

阿里硬核少年技术节将于下周在北京、杭州同步开幕，覆盖淘天与 ATH 事业群，并集中发布四项 AIGX 方向的硬核技术成果。活动聚焦集团内部技术协同与前沿能力展示，释放其在生成式 AI、工程基础设施和业务场景结合上的最新进展，体现大型互联网企业推进 AI 技术落地与组织联动的动向。

官方/研究 OpenAI Blog · 2 天前 ★★★★★

Helping K–12 educators build practical AI skills

OpenAI Academy 联合 Walton Family Foundation 推出面向 K-12 教育工作者的线下实操型 AI Skills Jams，重点帮助教师掌握可直接用于课堂场景的实用 AI 技能，提升教学应用能力与人工智能素养，推动 AI 在基础教育中的落地使用。

媒体 Hacker News · 2 天前 ★★★★★

Geosql: A Claude/Codex skill for geospatial data

Geosql 是一个面向 Claude、Codex 等代码助手的地理空间数据处理技能，项目已在 GitHub 开源。根据标题信息，其核心用途是帮助模型理解并操作 geospatial data，可能面向空间查询、分析与数据处理等场景。当前信息主要来自项目链接与社区转发，讨论热度较低，尚无更多性能或落地细节披露。

媒体 TechCrunch AI · 2 天前 ★★★★★

Hot French startup ZML releases free product to speed inference across lots of AI chips

法国 AI 初创公司 ZML 发布免费软件产品 ZML/LLMD，目标是加速大模型推理并降低运行成本，适配多种 AI 芯片平台。该公司获得图灵奖得主 Yann LeCun 背书，此次开源式产品发布聚焦推理效率与算力利用率提升，面向企业部署与基础设施优化场景。

国内量子位 · 2 天前 ★★★★★

高德发布Phys AI Data：首个面向物理AI训练与应用的一站式空间数据基座

高德宣布推出 Phys AI Data，定位为首个面向物理 AI 训练与应用的一站式空间数据基座，聚焦为空间智能、自动驾驶、机器人等场景提供底层数据支持。该产品强调整合空间数据能力，服务模型训练、仿真与实际部署环节，意在完善物理 AI 产业链中的数据基础设施。

国内 36氪 AI · 2 天前 ★★★★★

海光计划切入端侧AI，加速构建全栈自主算力体系

海光信息将在光合组织2026智能计算应用大会集中展示“云边端”全系算力场景，首次系统呈现其基于CPU与DCU双芯底座的端侧AI布局，面向工业现场和行业应用推进全栈自主算力体系。端侧场景强调实时响应、本地处理、安全可信及软硬件生态协同，对芯片与系统整合能力要求更高。

国内量子位 · 3 天前 ★★★★★

三个理想火枪手创业，打破具身最快百台交付纪录

文章围绕“三个理想火枪手”创业切入，描述一家具身智能机器人公司以极短周期完成百台级交付，刷新行业量产与落地速度纪录。正文片段强调“机器人开始自己造自己”，指向机器人参与生产制造流程，体现自动化装配、自主生产和商业化交付能力的同步推进。

国内 36氪 AI · 3 天前 ★★★★★

半年报预增释放盈利拐点信号，人形机器人板块迎产业共振新格局

7月7日A股人形机器人板块回调，概念指数跌2.93%。但产业基本面持续改善，多家产业链公司披露半年报预增，核心零部件到整机集成盈利趋势向好。叠加全球头部企业量产提速、产能建设与订单验证推进，以及IPO和商业化催化，行业正由概念驱动转向产能落地和业绩兑现阶段。

国内 36氪 AI · 3 天前 ★★★★★

三星开始量产用于英伟达Vera Rubin平台的先进固态硬盘

三星电子已开始量产面向英伟达即将推出的Vera Rubin平台的数据中心企业级SSD PM1763。该产品此前在GTC大会与HBM4、SOCAMM2一同亮相，定位AI数据中心方案。其采用最新V-NAND闪存与4纳米控制器，读写速度较前代提升逾一倍，并通过液冷设计降低AI训练和推理中的数据延迟。

媒体 TechCrunch AI · 3 天前 ★★★★★

Meta rolls out Muse, a new AI image generator

Meta推出新一代AI图像生成模型Muse，可用于广告创意、家居装饰方案设计及面向创作者的内容生产等场景。该产品聚焦图像生成能力与商业化落地，显示Meta继续扩展生成式AI工具版图，并尝试在营销与创作生态中拓展实际应用价值。

媒体 TechCrunch AI · 3 天前 ★★★★★

Discord admits AI moderation bug wrongfully banned users over harmless images

Discord确认其AI内容审核系统出现误判漏洞，自5月起持续影响用户账号，近期周末又有约200名用户因无害图片被错误封禁。公司称已定位并修复问题，事件反映出平台自动化审核在准确性和申诉保障方面仍存在明显风险。

媒体 Hacker News · 3 天前 ★★★★★

AI Meets Cryptography 1: What AI Found in Cloudflare's Circl

文章介绍研究者利用 AI 辅助分析 Cloudflare 开源密码学库 Circl，从中发现若干潜在缺陷与实现问题，并以案例说明 AI 在代码审计、漏洞挖掘和密码学工程检查中的应用边界。内容更偏技术实践分享，反映 AI 正被用于安全研究与软件质量保障。

媒体 The Verge AI · 3 天前 ★★★★★

X says top accounts steal videos from other users as it announces new video tools

X 产品负责人表示，平台近半数曝光来自视频，但大量热门账号发布的视频系从其他用户处搬运，甚至在原始内容走红数年后再次传播。X 在披露这一问题的同时宣布推出一系列新视频工具，显示其正强化视频产品能力，并试图应对内容归属与原创激励挑战。

媒体 The Verge AI · 3 天前 ★★★★★

The ‘G-Wagen of golf carts’ could be the ideal second car

葡萄牙里斯本电动车初创公司 Amble 推出一款定位独特的电动 buggy，被称为“高尔夫球车界的 G-Wagen”。产品不强调加速性能、续航焦虑或自动驾驶，而是瞄准城市短途与第二辆车场景，以轻量化、低速和实用性切入与主流电动车差异化竞争。

媒体 The Verge AI · 3 天前 ★★★★★

Anthropic is launching Claude Cowork on mobile and web

Anthropic 宣布自周二起将 Claude Cowork 扩展至移动端和网页端，首次摆脱仅限 macOS 与 Windows 桌面应用的使用方式。该功能将优先向 Max 订阅用户开放，并计划在未来数周内逐步覆盖其他 Claude 套餐用户，显示其正加快多终端产品布局与用户触达。

媒体 The Verge AI · 3 天前 ★★★★★

Google announces Pixel 11 launch event in August

谷歌宣布将于8月12日在纽约举行下一场 Made by Google 发布会，重点展示 Pixel 系列硬件新品，包括备受关注的 Pixel 11。与往年不同，本次活动安排在美国东部时间晚上6点开始。邀请函还附带简短预热视频，预示将有更多硬件细节在现场公布。

媒体 TechCrunch AI · 3 天前 ★★★★★

Claude Cowork expands to mobile and web

Anthropic 宣布将 Claude Cowork 扩展至网页端和移动端，面向 Max 订阅用户开放。此前该功能主要依赖笔记本电脑运行，更新后用户可在桌面发起任务、在手机接收进度通知，并在设备间无缝接续查看完成结果，即使电脑关闭也不影响任务处理流程。

媒体 Hacker News · 3 天前 ★★★★★

Show HN: Rowboat – Open-source, local-first alternative to Claude Desktop

Rowboat 是一款开源、local-first 的桌面 AI 工作应用，定位为 Claude Desktop 的替代方案。其核心是将助手嵌入邮件、会议纪要、浏览器、并行编码和本地笔记等“工作界面”中，支持邮件分类与草拟、会议记录回写知识图谱、隔离浏览器辅助操作，并可调度 Claude Code 或 Codex 协同编程。

媒体 The Verge AI · 3 天前 ★★★★★

Discord accidentally banned over 8,000 people for posting grids and other ‘benign’ images

Discord披露，其安全系统自5月起因程序缺陷误封超过8000个账号。近期大量用户反映，发布带网格的普通图片，如棋盘、游戏材质和《我的世界》物品栏后即遭封禁。公司称问题源于内容审核机制异常，已着手修复并处理受影响账号申诉。

媒体 Hacker News · 3 天前 ★★★★★

Show HN: Halo – open-source, tamper-evident runtime evidence for AI agents

开源项目 Halo 面向 AI 代理审计场景，提供可篡改检测的运行时证据记录。其通过记录工具调用、模型调用和数据访问等行为，写入哈希链式追加日志，支持生成审计报告并验证日志是否被修改。项目采用 Apache-2.0 许可，当前可证明完整性中的“未被编辑”，但暂不能证明“无遗漏记录”。

媒体 The Verge AI · 3 天前 ★★★★★

Microsoft fixes storage-hogging Windows 11 folder

微软在 Windows 11 可选更新 KB5095093 中修复了一项异常占用磁盘空间的问题。该漏洞会导致系统中的 CapabilityAccessManager.db-wal 文件膨胀至数 GB，影响设备存储使用。此次修补被纳入 2026 年 6 月可选更新，主要改善该文件的磁盘空间占用表现。

媒体 The Verge AI · 3 天前 ★★★★★

Solos debuts an even lighter version of its camera-less smart glasses

Solos推出新款AirGo A6智能眼镜，取消摄像头设计，主打更轻量机身与语音交互式AI助手。相比上代AirGo A5的36至40克，新品重量降至约19克，明显提升佩戴轻便性。产品定位强调日常可穿戴体验，通过无摄像头方案兼顾外观简洁与隐私考量。

媒体 The Verge AI · 3 天前 ★★★★★

iFixit has a new toolkit for fixing appliances, building furniture, and household repairs

iFixit 推出面向家庭维修与 DIY 场景的新工具套装 Megalodon Driver Kit，售价 34.95 美元，适用于家电修理、平板包装家具组装等任务。不同于其以电子产品拆解和维修闻名的传统工具包，此次新品将使用场景扩展至更广泛的家居维护领域。

媒体 Hacker News · 3 天前 ★★★★★

Show HN: Frugon – Find which LLM calls a cheaper model could handle (local, MIT)

开源项目 Frugon 在 Hacker News 展示，定位为本地 CLI 工具，用于分析 OpenAI 风格日志，识别可由更低成本模型处理的调用。工具提供离线成本估算、基于 LiteLLM 与 LMArena 的模型对比，并可通过抽样调用候选模型进行质量验证。开发者称其不托管数据，示例日志显示月度成本可从 549.46 美元降至 343.91 美元。

媒体 The Verge AI · 3 天前 ★★★★★

Marshall upgrades the bass and repairability of two wireless speakers

Marshall 发布 Acton IV 和 Stanmore IV 两款蓝牙音箱升级版，改进高音单元、低音导向孔及内部结构，以提升房间覆盖与低频表现。新品同时强化可维修性，旋钮、脚垫和前部部件等可更换，体现消费电子产品在声学升级之外对维修友好设计的重视。

媒体 The Verge AI · 3 天前 ★★★★★

Nothing’s new earbuds can record calls and what you’re listening to

Nothing 发布售价 99 美元的入门级真无线耳机 Ear 3A，即日起在官网开售，未归入主打性价比的 CMF 子品牌。新品延续上一代 Ear (a) 定价，并新增通话录音及正在播放内容记录等功能，在消费电子价格普遍上涨背景下保持原价，强化其音频产品线竞争力。

国内 36氪 AI · 3 天前 ★★★★★

极兔速递：已正式接入支付宝AI生态

7月7日，支付宝AI开放平台正式官宣上线并开放邀测通道。极兔速递同步宣布已正式接入支付宝AI生态，显示物流企业开始与支付宝新推出的AI开放平台进行生态协同，相关合作方向和具体落地场景尚未披露。

媒体 TechCrunch AI · 3 天前 ★★★★★

The first American autonomous ground vehicles are fighting in Ukraine

美国自动驾驶地面车辆厂商 Forterra 已向乌克兰部署逾 100 辆无人地面车辆，成为首批投入乌战场的美制自主地面装备之一。该进展显示自动驾驶与无人化技术正加速从测试和工业场景转向真实军事应用，反映 AI 驱动地面作战系统的实战化落地趋势。

国内 36氪 AI · 3 天前 ★★★★★

腾讯“吐司” iOS版正式上线

腾讯旗下AI应用生成与灵感共创平台“吐司”于7月6日正式上线iOS版。该产品主打零门槛Vibe Coding，用户可通过自然语言描述需求，生成并调整专属App。腾讯还计划于8月向开发者生态全面开放一站式上架服务、商业化组件及更多API能力。

国内 36氪 AI · 3 天前 ★★★★★

高德打车：已首批接入支付宝AI开放平台

7月7日，支付宝正式上线AI开放平台，向商家、机构、服务商、智能终端及大模型平台等生态伙伴开放AI接入能力。高德打车作为首批加入支付宝AI生态的出行品牌，已正式接入该平台，显示支付宝正加快推进AI能力在出行等生活服务场景中的落地。

国内 36氪 AI · 3 天前 ★★★★★

零一万物推出三款“一号位决策AI”产品

7月7日，零一万物发布三款“一号位决策AI”产品，包括老板AI、销冠AI和投资官AI，分别服务企业经营决策者、销售负责人及投资者等核心角色，聚焦业务经营、销售转化与投资决策等场景，显示其正从通用模型能力向垂直决策辅助产品加速落地。

国内 36氪 AI · 4 天前 ★★★★★

AI小程序成长计划上新混元Hy3

腾讯公开课披露，小程序成长计划再次升级，面向开发者的资源扶持力度明显加大：大模型Token额度由1亿提升至10亿，AI生图额度由1万张提升至10万张；同时接入腾讯混元最新模型Hy3及Hy Image 3.0生图模型，强化小程序AI开发与内容生成能力。

国内 36氪 AI · 4 天前 ★★★★★

我国规上工业企业人工智能应用普及率已超30%

工信部在上海新闻发布会上表示，我国规上工业企业人工智能应用普及率已超过30%，制造业正成为AI落地核心场景。官方预计今年人形机器人整机产量有望突破10万台，并正推进“模数共振”“人形机器人与具身智能实景实训”等专项行动，挖掘高价值应用场景，同时将发布国际人工智能伦理治理行动计划。

国内 36氪 AI · 4 天前 ★★★★★

支付宝AI开放平台开启邀测

7月7日，支付宝正式上线AI开放平台并启动邀测，向商家、机构、服务商、智能终端及大模型平台等生态伙伴开放AI接入能力。该平台旨在整合支付宝生态资源，支持多类合作方接入与落地AI服务，进一步拓展其在商业服务与终端场景中的AI应用布局。

官方/研究 OpenAI Blog · 4 天前 ★★★★★

Australian Payments Plus moves faster with ChatGPT and Codex

Australian Payments Plus 正在采用 ChatGPT Enterprise 与 Codex，应对支付业务中的复杂流程与开发需求。相关实践显示，这些工具帮助团队提升处理速度、节省时间并改善工作质量，同时仍将关键决策与判断保留给人工，以支持更高效的支付产品与运营协作。

媒体 Hacker News · 4 天前 ★★★★★

Small AI Models Gain Traction In places with unreliable networks

文章关注小型AI模型在网络不稳定场景中的应用价值，指出其可在本地或边缘设备运行，减少对云端连接和高算力的依赖，适合制药等对时延、隐私和稳定性要求较高的行业。相关讨论显示，小模型正因部署灵活、成本更低而获得更多实际采用。

媒体 The Verge AI · 4 天前 ★★★★★

Hoto’s PixelDrive screwdriver is down to $60, matching its best price

Hoto 的 PixelDrive 无线电动螺丝刀在亚马逊降至 59.99 美元，较原价优惠 20 美元，达到历史最低价。文章主要介绍该产品适用于家具组装、拧紧松动螺丝和简单电子设备维修等场景，强调其可提升装配效率，本质上是一则消费电子促销与使用场景信息。

媒体 TechCrunch AI · 4 天前 ★★★★★

You can now customize Siri’s pace and expressivity in the latest iOS 27 beta

苹果在最新 iOS 27 测试版中加入 Siri 语速与表达风格自定义功能，用户可调整助手的说话节奏和表现力。该更新属于苹果围绕生成式 AI 重构 Siri 的一部分，目标是提升语音交互的自然度、个性化体验与整体可用性。

其他 119

国内 36氪 AI · 1 小时前 ★★★★★

OpenAI：对其他公司的商业秘密不感兴趣，仍专注于打造创新技术

针对苹果就硬件商业机密提起的诉讼，OpenAI公开回应称其对其他公司的商业秘密不感兴趣，并强调公司当前重心仍是研发与打造创新技术。该表态主要意在澄清外界质疑，事件涉及企业法律争议与公关回应，未披露更多技术或业务细节。

国内 36氪 AI · 1 小时前 ★★★★★

FansAI收购OPC公司新映科技

7月11日，AI内容与互动影视公司垚城智能（FansAI）宣布全资收购AI音乐应用新映科技。此次交易被认为是OPC领域较少见的探索性并购案例，显示AI内容公司正通过收购扩展音乐应用与多模态内容能力，推动业务协同与场景整合。

国内 36氪 AI · 4 小时前 ★★★★★

OpenAI安全系统负责人据悉将离职

据报道，OpenAI安全系统负责人Johannes Heidecke已通知员工将于本周离职，正值公司推进安全与研究团队整合之际。根据内部备忘录，安全团队今后将向兼任研究与安全副总裁的Mia Glaese汇报，Saachi Jain将出任临时安全系统负责人。

国内 36氪 AI · 4 小时前 ★★★★★

苹果在重磅诉讼中起诉OpenAI窃取商业机密‌

苹果公司以窃取商业机密为由起诉OpenAI，称其通过协同行动获取苹果未发布产品的信息、零部件、图纸及其他资料，用于开发自身硬件产品。苹果要求法院责令OpenAI停止相关行为、销毁涉案专有资料，并对待发布产品重新设计，确保不包含苹果技术。

媒体 The Verge AI · 8 小时前 ★★★★★

Apple sues OpenAI for allegedly stealing hardware secrets

苹果起诉 OpenAI，指控其前苹果员工在加入后持续窃取公司硬件相关商业机密，并将其用于推进 AI 硬件计划。诉状还将前苹果设计负责人 Jony Ive 创立的 IO Products 列为被告，案件聚焦人才流动中的技术保密与 AI 硬件竞争风险。

媒体 TechCrunch AI · 9 小时前 ★★★★★

Apple sues OpenAI over alleged trade secret theft

苹果起诉 OpenAI 涉嫌窃取商业机密，称相关不当行为由 OpenAI 高层主导，其中包括一名曾在苹果长期任职的前员工。现有信息仅披露诉讼指控与涉事层级，尚未说明被窃取技术细节、证据内容及案件进展，后续需关注双方回应与司法程序。

媒体 The Verge AI · 10 小时前 ★★★★★

ICE is threatening to deport witnesses of its latest shooting

美国移民与海关执法局在休斯敦一次交通拦截中枪杀墨西哥移民 Lorenzo Salgado Araujo，引发倡议组织要求国土安全部公开执法记录仪画面。国土安全部称涉事人员未佩戴执法记录仪，同时有消息称目击者面临被驱逐风险，事件进一步激化外界对执法透明度与移民权利保障的质疑。

媒体 TechCrunch AI · 10 小时前 ★★★★★

Open source AI matters more than ever, according to Hugging Face’s Clem Delangue

Hugging Face首席执行官Clem Delangue表示，开源AI的重要性持续上升。作为类似“AI版GitHub”的平台，Hugging Face已成为模型与数据集共享中心，目前约半数《财富》500强企业在使用其服务。Delangue称，企业在采用AI过程中反复验证了开源生态的价值，反映出开源模型与工具在产业落地中的影响力正扩大。

媒体 Hacker News · 11 小时前 ★★★★★

How the terrorist group Boko Haram uses frontier AI

一份报告聚焦恐怖组织博科圣地对前沿人工智能的潜在利用，讨论生成式模型在宣传内容制作、翻译传播、招募动员及行动规划中的风险，并提示开源与易得工具可能降低恐袭技术门槛。文章链接与社区讨论显示，该议题正引发安全与治理层面的持续关注。

国内量子位 · 12 小时前 ★★★★★

只剩7天！第三届蚂蚁InTech奖申报即将截止，图灵奖得主坐镇评审

第三届蚂蚁InTech奖申报进入最后7天，奖项围绕四大技术方向征集项目，并以奖金形式提供直接资助。该活动由蚂蚁发起，评审阵容包含图灵奖得主，面向相关科研与技术创新团队开放申请，重点关注前沿技术成果与产业应用潜力。

媒体 TechCrunch AI · 15 小时前 ★★★★★

Hugging Face’s CEO on why companies are done renting their AI

Hugging Face CEO Clem Delangue表示，企业正从租用封闭式AI服务转向采用开源模型与数据集，以获得更低成本、更强可控性和更高定制能力。Hugging Face已发展为类似AI领域GitHub的平台，其开放生态现被约半数《财富》500强企业使用，反映开源AI在企业落地中的影响力持续扩大。

媒体 Hacker News · 16 小时前 ★★★★★

How do you use Vim in the era of AI?

一则 Hacker News 讨论帖围绕“AI 时代如何使用 Vim”展开。发帖者称自己长期重度使用 Vim，但随着越来越少直接阅读代码，开始怀疑继续投入该编辑器是否仍有意义。内容主要反映开发者在 AI 辅助编程普及背景下，对传统编辑器工作流、代码审阅方式与效率工具价值的重新评估。

国内 36氪 AI · 18 小时前 ★★★★★

亿道信息：预计上半年净利润同比增长1442.02%-1792.48%

亿道信息预计2026年上半年归母净利润1.76亿元至2.16亿元，同比增幅达1442.02%至1792.48%；扣非净利润8860万元至1.19亿元，同比增长634.15%至889.37%。公司称增长主要来自AI技术渗透提升、“AI+”战略推进，AIPC与AIOT产品线销售扩大，以及投资收益和约8600万元税后非经常性损益增加。

国内 36氪 AI · 19 小时前 ★★★★★

摩根大通聘请两位银行家，以把握香港IPO热潮

摩根大通在香港IPO市场活跃之际，聘请两名具备签署香港首次公开招股文件资格的银行家，分别是前花旗董事Benjamin Seto和前招商证券执行董事Gary Lam，二人将任执行董事并向香港IPO及企业融资团队负责人Nelly Pai汇报，以增强其在港股发行与企业融资业务的承接能力。

国内 36氪 AI · 19 小时前 ★★★★★

惠州市人工智能发展有限公司成立，注册资本10亿

天眼查信息显示，惠州市人工智能发展有限公司近日成立，法定代表人为尹毅强，注册资本10亿元。公司经营范围涵盖投资活动、人工智能应用软件开发、大数据服务和信息系统集成等，由惠州市国有资本投资集团有限公司及惠州市国资委共同持股，显示地方国资加码布局人工智能产业。

国内量子位 · 20 小时前 ★★★★★

GPT-5.6一发布，Claude终于舍得重置Fable 5额度了

文章标题显示，GPT-5.6 发布后，Claude 相关产品 Fable 5 的使用额度策略出现调整并被“重置”。由于正文为空，无法确认具体额度变化幅度、适用用户范围、调整时间及官方原因，但核心信息指向头部模型竞争背景下产品资源分配或订阅权益的动态变化。

国内量子位 · 20 小时前 ★★★★★

AI聪明够了，行动呢？WAIC首夜，来聊点下一步的真实判断｜活动报名

文章围绕 WAIC 首夜活动报名展开，以“AI 已具备足够智能，下一步如何真正落地行动”为主题，预告将讨论产业从模型能力走向执行与应用的关键判断。现有信息更偏活动宣传，未披露具体技术发布、融资进展或政策内容。

国内 36氪 AI · 20 小时前 ★★★★★

“全球首款智能体手机”已备货8万至10万台？知情人士：假的

媒体称字节跳动与中兴努比亚合作的“全球首款AI智能体手机”将在2026世界人工智能大会亮相开售，并已备货8万至10万台、首批达50万台。知情人士对此否认，称相关说法不实，本次大会仅为首次公开展示，既未开售，也不存在数万台备货。

国内 36氪 AI · 21 小时前 ★★★★★

香农芯创：预计2026年半年度净利润同比增长2118%-2434%

香农芯创公告预计2026年上半年归母净利润为35亿至40亿元，同比增长2118%至2434%。增长主要来自人工智能需求上升带动存储芯片行业景气度提升，公司电子元器件分销业务毛利率改善，同时自主品牌“海普存储”进入大规模销售阶段。

国内 36氪 AI · 21 小时前 ★★★★★

OpenAI高管层再现变动，首席运营官因病离职

OpenAI宣布首席运营官、负责产品与商业化业务的菲吉·西莫因健康状况恶化，将在医疗休假结束后不再回归全职岗位，改任兼职顾问。这意味着OpenAI在筹备首次公开募股之际再次出现高管层调整，管理稳定性与后续业务衔接受到市场关注。

国内 36氪 AI · 23 小时前 ★★★★★

光合组织AIDC基础设施专委会在郑州成立

7月10日，光合组织AIDC基础设施专委会在郑州成立，将联合产业链上下游企业，围绕异构算力中心建设、基础设施适配、运行管理和应用支撑开展协同攻关，并依托“开放计算Token谱系”推动智算基础设施标准建设，降低异构算力适配成本，支撑AI应用规模化落地。

国内 36氪 AI · 23 小时前 ★★★★★

韩蒙经贸高官商定加强关键矿产和AI领域合作

韩国副总理兼财政经济部长官具润哲访蒙期间，会晤蒙古国经济发展与财政高官，双方商定加强人工智能与关键矿产合作，重点涉及AI技术应用、数据中心建设、关键矿产供应链、可再生能源开发及医疗卫生等新兴领域，显示韩蒙正推进面向未来产业的双边经贸协作。

国内 36氪 AI · 1 天前 ★★★★★

众擎机器人在深圳成立新公司，注册资本1000万

天眼查信息显示，深圳市擎武科技有限责任公司近日成立，法定代表人为赵同阳，注册资本1000万元。公司经营范围涵盖广告发布、体育赛事策划、软件开发、动漫游戏开发及数字文化创意内容应用服务等，由深圳众擎机器人科技股份有限公司全资全资持股。

国内 36氪 AI · 1 天前 ★★★★★

美国商务部长敦促SK海力士和三星电子扩大在美国的内存芯片产能

美国商务部长卢特尼克7月9日表示，正与三星电子和SK海力士磋商，敦促其加快扩大在美国的内存芯片产能，以缓解人工智能发展带动的关键存储器件全球短缺。此举反映美国正通过产业协调强化本土半导体供应链与AI基础设施保障。

国内 36氪 AI · 1 天前 ★★★★★

三星李在镕拟于7月底赴美会晤英伟达黄仁勋

报道称，三星电子会长李在镕计划于7月底赴美会见英伟达CEO黄仁勋，讨论三星在韩国光州晶圆厂及龙仁半导体集群等投资推进事宜。三星希望提升对英伟达的组件供应占比，同时为建设AI数据中心服务器争取稳定获取英伟达AI芯片，以支撑其半导体与AI基础设施布局。

媒体 The Verge AI · 1 天前 ★★★★★

Microsoft’s carbon emissions went up 25 percent last year

微软在2026年可持续发展报告中披露，2025年公司碳排放量同比上升25%，若不计部分干预措施总量达3400万吨。报告称排放增长主要由数据中心等基础设施扩张推动，显示其在推进AI与云业务同时，正面临既定气候目标实现压力。

国内 36氪 AI · 1 天前 ★★★★★

中信证券：建议关注核电核岛设备、阀门、特材、主泵等材料企业

中信证券表示，AI带动用电需求上升，正推动全球核电行业复兴。国内核电已进入常态化核准与建设高峰阶段，先进反应堆被视为高成长方向，其中小堆有望成为数据中心供能及电力出海的重要方案。其建议关注核岛设备、阀门、特材、主泵等相关材料与设备企业。

国内 36氪 AI · 1 天前 ★★★★★

半导体板块短期承压不改景气持续上行

7月以来，全球半导体板块显著回调，触发因素包括AI硬件赛道交易拥挤度缓解，以及Meta“出租闲置算力”消息引发市场对AI资本开支回报的担忧，A股存储芯片和半导体设备等前期强势板块同步走弱。分析认为此轮下跌属阶段性修正，非基本面逆转，随着中报披露推进，板块关注点正转向业绩兑现。

国内 36氪 AI · 1 天前 ★★★★★

美联储前主席伯南克加入Anthropic长期利益信托机构

7月9日，Anthropic宣布任命美联储前主席本·伯南克加入其长期利益信托机构。该机构承担监督公司长期使命的职责，重点推动人工智能以安全、负责任方式发展，并确保相关技术在长期内为社会带来普遍利益。

媒体 TechCrunch AI · 1 天前 ★★★★★

Fidji Simo steps down from OpenAI’s no. 2 role

OpenAI二号高管Fidji Simo因医疗休假时间长于预期，将卸任全职职务。此举使公司在关键阶段出现管理层空缺：一方面OpenAI正考虑未来IPO可能性，另一方面还需在企业级市场加速竞争、追赶Anthropic，相关人事变动可能影响其组织稳定性与商业推进节奏。

媒体 The Verge AI · 1 天前 ★★★★★

Fidji Simo steps down from leading OpenAI’s AGI work due to illness

OpenAI高管Fidji Simo宣布因神经免疫系统疾病，卸任公司负责AGI工作的全职领导岗位，转为兼职顾问。她此前于4月表示将因健康原因短期休假，此次调整意味着其不再承担日常管理职责，反映出OpenAI核心研发组织的人事变动。

媒体 TechCrunch AI · 1 天前 ★★★★★

Elon Musk praises Mythos/Fable, promises not to ‘cut off’ Anthropic

马斯克公开称赞 Mythos/Fable，并表示不会“切断”Anthropic模型托管服务，试图缓解外界对其平台中立性与商业可信度的担忧。报道指出，Anthropic若将模型托管于其基础设施，潜在相关收入规模可达约400亿美元，此事聚焦大模型托管合作中的信任、控制权与商业利益分配问题。

媒体 TechCrunch AI · 1 天前 ★★★★★

Can AI answer the $3 trillion question?

文章聚焦生成式人工智能投资回报率争议再度升温，讨论在市场投入规模被推高至数万亿美元背景下，企业与资本市场如何重新评估AI带来的实际收益、成本压力与战略风险。随着资金、基础设施和预期持续放大，AI能否兑现商业价值成为核心问题。

媒体 The Verge AI · 1 天前 ★★★★★

The floatable, powerful Soundcore Boom 2 speaker is over half off

Woot 在 7 月 10 日前将 Anker Soundcore Boom 2 蓝牙音箱降至 69.99 美元，较其他零售商当前折扣价再低 20 美元。文章强调该产品具备较强音量、丰富功能和可漂浮特性，在百美元以内蓝牙音箱中性价比较突出，内容主要围绕一次消费电子促销信息展开。

媒体 TechCrunch AI · 1 天前 ★★★★★

Meta’s new AI chips will begin production in September

Meta披露其新一代AI芯片将于9月启动生产。公司在芯片设计上采取模块化方案，以适应AI技术快速演进带来的算力和功能需求变化，显示其正增强自研基础设施能力，并为后续模型训练与推理场景保留更高的硬件迭代灵活性。

媒体 TechCrunch AI · 1 天前 ★★★★★

Nvidia is a victim of the compute marketplace it created

英伟达通过GPU与AI热潮证明算力的高价值，也由此推动了庞大算力市场形成。如今其虽仍处于产业中心，但市场红利正外溢至云服务、数据中心基础设施及算力中介等更标准化环节，部分技术门槛较低、商业模式更直接的参与者也在快速获利，反映出AI算力生态收益分配正在扩散。

媒体 Hacker News · 1 天前 ★★★★★

AI 2040: Plan A

《AI 2040: Plan A》在技术社区引发讨论，文章链接登上 Hacker News，获得 128 点赞和 98 条评论。现有信息仅显示其为一篇关于 AI 到 2040 年发展设想或路线规划的观点性内容，未披露具体产品、模型、融资或政策细节，更多体现社区对长期 AI 愿景的关注。

媒体 Hacker News · 1 天前 ★★★★★

AI Content Is Everywhere on Social Media, Especially LinkedIn

文章讨论社交媒体信息流中AI生成内容显著增加，尤其在LinkedIn更为集中。作者结合相关观察指出，平台上出现大量风格趋同、模板化的AI文案与互动内容，反映生成式AI已深度渗透职业社交传播场景，也引发关于内容质量、真实性和平台生态变化的讨论。

媒体 TechCrunch AI · 1 天前 ★★★★★

Anthropic, OpenAI, and SpaceX are bigger than the last 25 years of tech exits

文章称，Anthropic、OpenAI 与 SpaceX 这三家明星公司未来若完成 IPO，合计或将创造超过 2000 年以来美国风投支持企业全部退出总和的价值，凸显 AI 与航天头部企业对一级、二级市场估值体系和退出回报结构的重塑影响。

媒体 Hacker News · 1 天前 ★★★★★

Why the Next Era of AI Is About Infrastructure, Not Just Models

Mozilla.ai 博文提出，AI 下一阶段竞争重点将从单纯模型能力转向基础设施与“控制层”建设，包括数据治理、权限管理、评测监控、工作流编排及部署可靠性等环节。文章认为，随着模型趋于通用，决定实际落地效果和可控性的关键将是围绕模型构建的系统能力。

媒体 The Verge AI · 1 天前 ★★★★★

Comcast is breaking up with NBCU. Why did it ever buy it in the first place?

Comcast 宣布拆分为宽带业务公司与 NBCUniversal 娱乐公司，标志其传媒与通信整合战略出现重大转向。报道围绕此次分拆背景展开，回顾 Comcast 当年收购 NBCU 的逻辑，以及在媒体行业结构变化、流媒体竞争和有线电视业务承压下，拆分对公司定位与行业格局的影响。

国内 36氪 AI · 1 天前 ★★★★★

报道称Meta计划于9月开始生产AI芯片，并计划将计算能力翻倍

据备忘录，Meta计划于9月启动“Iris”AI芯片生产，并在明年将计算能力由今年规划的7吉瓦提升至14吉瓦。为支撑基础设施扩张，Meta已签署多项长期供应协议，覆盖三星电子内存、Sandisk闪存存储及住友电工光纤设备等关键环节。

官方/研究 OpenAI Blog · 1 天前 ★★★★★

GPT-5.5 Bio Bug Bounty

OpenAI 发布 GPT-5.5 Bio Bug Bounty 相关信息，围绕生物安全场景征集漏洞与风险反馈，重点识别模型在生物知识生成、实验辅助和潜在滥用防护中的缺陷。该计划通过外部研究者参与，完善高风险能力评估与安全缓解机制。

国内 36氪 AI · 1 天前 ★★★★★

工业富联：预计2026年半年度净利润同比增长93%-101%

工业富联公告预计2026年上半年归母净利润达234亿元至244亿元，同比增幅93%至101%。业绩增长主要由云计算业务拉动，其中AI服务器收入同比增长超过230%，800G以上数据中心交换机出货量同比提升1.4倍，反映AI算力基础设施需求持续放大。

国内量子位 · 1 天前 ★★★★★

第十一届中国航空创新创业大赛报名开启｜熵跃苍穹无界新元

第十一届中国航空创新创业大赛已启动报名，赛事以“熵跃苍穹无界新元”为主题，面向航空及相关创新创业项目征集参赛方案，延续以大赛平台聚合技术、资本与产业资源的定位。当前信息主要体现活动开启与品牌传播，尚未披露具体赛制、评审安排及重点技术方向。

国内 36氪 AI · 1 天前 ★★★★★

新锐股份：拟8亿元收购慧联电子80%股权

新锐股份公告拟以8亿元收购新乡市慧联电子80%股权，资金来自自有资金及并购贷款；并拟以不超过2800万元收购泰国WINWINHITECH 70%股权，以解决同业竞争并拓展海外市场。交易不构成关联交易及重大资产重组，尚待股东会审议，完成后预计形成约4亿元商誉，资产负债率升至约55%。

国内 36氪 AI · 1 天前 ★★★★★

泰国批准近20亿美元投资项目，涉雀巢、泰航、日本AI基础设施公司Datasection等企业

泰国投资委员会7月8日批准9个投资促进项目，总额663亿泰铢，约合20亿美元，覆盖食品、航空运输、先进电子材料、数据存储与处理及可再生能源等领域，涉及雀巢、泰航及日本AI基础设施公司Datasection。其中国雀巢泰国将投资6.88亿美元，在北榄府建设自动化咖啡工厂和配送中心，计划2028年四季度投运。

国内量子位 · 1 天前 ★★★★★

「没了李开复，零一万物还有什么？」一个敢问一个敢答

文章围绕“失去李开复后零一万物还有什么”这一尖锐提问展开，核心信息仅显示李开复当场以笑回应，未提供公司战略、团队、产品或业务进展等更多细节。现有片段更像一次访谈中的互动话题，信息量有限，难以据此判断公司后续发展方向与实际经营变化。

国内 36氪 AI · 1 天前 ★★★★★

淡马锡最新投资风向：不碰加密货币，看好AI应用与欧洲资产

淡马锡全球投资总裁纳吉·哈米耶表示，因FTX事件造成巨额亏损，公司当前仍将加密货币投资排除在外。与此同时，淡马锡正重点关注人工智能应用机会，并同步评估欧洲资产、中东市场及防务赛道的配置方向，反映其在风险控制下调整全球投资组合。

国内量子位 · 1 天前 ★★★★★

刚刚，OpenAI首席未来学家离职！曾被马斯克骂蠢驴

OpenAI“首席未来学家”一职相关动态引发关注，已知信息仅显示当事人离职，并留下“To safe AGI.”的简短表述，指向其对通用人工智能安全议题的持续关注。现有片段未披露离职原因、后续去向及公司回应，事件更偏向高管人事变动与行业舆论话题。

国内 36氪 AI · 1 天前 ★★★★★

钛虎机器人在台州成立新公司

天眼查信息显示，钛虎机器人科技（台州）有限公司近日成立，法定代表人为易港，注册资本1000万元。新公司经营范围涵盖智能机器人的研发与销售，以及技术服务、开发、咨询、交流、转让和推广等业务，由钛虎机器人科技（上海）有限公司全资持股。

媒体 Hacker News · 2 天前 ★★★★★

AI changes the economics of software rewrites

文章围绕“AI 改变软件重写的经济性”展开，链接指向对代码库质量与 AI 生成代码关系的讨论，Hacker News 帖子显示热度有限，仅有14个点赞和5条评论。现有信息更像社区观点与行业观察，聚焦 AI 可能降低软件重构和重写成本，但未披露具体产品、融资或研究成果。

国内量子位 · 2 天前 ★★★★★

2026年世界人工智能大会，7月17-7月20上海举办

2026年世界人工智能大会将于7月17日至20日在上海举办，已有180家企业携相关成果入驻参展。该信息主要披露了大会举办时间、地点及企业参与规模，反映出活动对人工智能产业展示、交流与合作的承载能力，但尚未涉及具体技术发布或政策内容。

国内 36氪 AI · 2 天前 ★★★★★

龙芯中科在深圳成立新电子科技公司，注册资本2000万

天眼查信息显示，深圳龙芯中科电子科技有限公司近日成立，法定代表人为王洪虎，注册资本2000万元。公司经营范围涵盖软件开发、人工智能基础软件开发、集成电路芯片设计及服务、云计算设备制造等，由龙芯中科全资持股，显示其在电子科技与AI基础能力方向继续布局。

媒体 Hacker News · 2 天前 ★★★★★

What's slowing down the AI buildout

文章指出，AI 基础设施扩张正受电网瓶颈制约。随着数据中心算力需求激增，新增发电、输电和并网审批速度难以匹配，导致项目落地周期拉长、成本上升。内容聚焦能源供应、配电网络和监管流程对 AI 建设节奏的限制，强调算力竞争已延伸到电力基础设施层面。

媒体 Hacker News · 2 天前 ★★★★★

I Think I Have LLM Burnout

一篇围绕“大模型倦怠”现象的个人评论文章在 Hacker News 引发讨论。内容指向从业者或关注者对 LLM 持续高频更新、产品同质化与信息过载产生疲惫感，评论区围绕技术热度、实际价值与使用体验展开交流，反映当前生成式 AI 舆论中的情绪波动与审美疲劳。

国内 36氪 AI · 2 天前 ★★★★★

中信建投：AI PCB需求放量、高阶升级趋势明确，打开设备耗材新空间

中信建投研报称，算力需求正成为PCB行业最重要的结构性增量。AI服务器由CPU转向GPU/ASIC集群后，PCB在用量、层数、材料、孔结构、线路精度及可靠性上的要求全面提升，带动高多层板和高阶HDI需求增长，同时推动M7-M9低损耗基材、mSAP精密工艺导入，并为设备及配套耗材打开新增空间。

国内 36氪 AI · 2 天前 ★★★★★

多家算力产业链公司上半年业绩预增

截至7月8日，A股已有20多家算力产业链上市公司披露2026年上半年业绩预增。报道指出，AI大模型商业化落地持续带动算力采购、租赁需求增长，推动硬件、存储和算力服务等环节盈利同步改善，券商看好国内AI基础设施需求延续高景气。

国内 36氪 AI · 2 天前 ★★★★★

港股迎估值修复窗口，公募加大布局力度

港股经历近6个月调整后估值持续回落，公募基金近期明显加大布局力度，覆盖科技、互联网与消费等板块。7月8日恒指涨2.99%，恒生科技指数涨4.97%。除受AI替代叙事带动的科网股外，部分公募也借南向资金逆向增配现金流稳健的消费龙头，押注港股估值修复。

媒体 Hacker News · 2 天前 ★★★★★

We made Grok 4.5, GPT-5.5, and Claude build the same apps

文章对比让 Grok 4.5、GPT-5.5 和 Claude 在相同条件下构建同类应用的表现，并通过 Hacker News 讨论引发关注。内容核心是评测三家主流大模型在代码生成、应用搭建与实际产出质量上的差异，反映当前 AI 编程助手竞争格局与开发者关注重点。

媒体 Hacker News · 2 天前 ★★★★★

Agentic test processes, LLM benchmarks, and other notes on agentic coding fr

文章讨论代理式编程中的测试流程、LLM 基准评测及模型结果波动等议题，围绕 AI 编码代理在实际开发中的可靠性、评估方法与工程经验展开，并记录作者对 agentic coding 框架、测试策略和性能差异的观察，属于技术性总结与观点整理。

媒体 TechCrunch AI · 2 天前 ★★★★★

This startup thinks robotics is about to have its ChatGPT moment

General Intuition认为，机器人行业正接近类似ChatGPT的拐点，计划利用数百万小时电子游戏数据训练面向“物理AI”的基础模型，以减少对真实世界机器人数据的依赖。其核心思路是借助可规模化的虚拟环境数据，提升机器人感知、决策与动作泛化能力，从而更高效地构建更聪明的机器人系统。

媒体 TechCrunch AI · 2 天前 ★★★★★

Why this CEO thinks video games make better training data than the internet

文章围绕 General Intuition 的判断展开：仅依赖互联网文本训练的大模型难以形成对空间、时间和物理运动的真实理解，而视频游戏生成的交互式环境数据更适合补足这类能力。其核心观点是，游戏数据可为通向更通用智能提供新的训练路径。

媒体 TechCrunch AI · 2 天前 ★★★★★

These AI startups are growing revenue at faster and faster rates

文章关注一批 AI 初创公司收入增速持续提升的现象，指出在整体行业高速扩张背景下，部分企业不仅保持增长，还呈现加速增长趋势。信息表明市场对 AI 产品与服务需求旺盛，资本与客户采纳推动相关公司商业化进程进一步提速。

媒体 The Verge AI · 2 天前 ★★★★★

Gaming laptops are too expensive right now, but this one’s a good value

文章指出，受内存价格异常上涨及存储成本走高影响，当前游戏笔记本整体性价比偏低，中低端配置机型价格被明显抬高。在近期优惠普遍乏力的市场环境下，作者关注到一款微星游戏本，认为其在当下仍具相对较好的价格价值比。

媒体 TechCrunch AI · 2 天前 ★★★★★

Your gaming data could be the secret to AGI, according to this Bezos-backed startup

Bezos 支持的初创公司 General Intuition 认为，仅依赖 ChatGPT、Claude 等大语言模型难以实现 AGI，因为其在空间与时间动态理解方面能力不足。公司押注用游戏数据训练模型，借助虚拟环境中的交互、运动与因果信息，弥补文本数据短板，推动更具泛化能力的智能系统发展。

媒体 TechCrunch AI · 2 天前 ★★★★★

Former OpenAI exec Kevin Weil is now on the board of Stoke Space

前 OpenAI 高管 Kevin Weil 已加入火箭公司 Stoke Space 董事会。该任命显示，继生成式 AI 之后，可重复使用火箭与商业航天正成为硅谷资本和人才关注的新方向，也反映科技高管跨界进入航天产业的趋势。

国内 36氪 AI · 2 天前 ★★★★★

OpenAI前研究员田永龙加入腾讯将参与VLM相关研发

据财联社消息，OpenAI前研究员田永龙已于近期加入腾讯大语言模型部，后续将参与视觉语言模型（VLM）相关研发。该动态显示腾讯正继续补强多模态方向研发人才储备，推进大模型与视觉语言融合能力建设。

国内 36氪 AI · 2 天前 ★★★★★

天海电子：与机器人公司合作事项对公司当前主营业务未构成实质性影响

天海电子公告称，公司股价连续两个交易日涨幅偏离值累计超20%，触发异常波动。针对市场关注的机器人概念，公司说明已于2026年6月26日与上海它石智航技术有限公司达成合作，但该事项目前未对主营业务形成实质性影响，短期内也难以明显增厚业绩，合作推进及收益存在较大不确定性。

国内量子位 · 2 天前 ★★★★★

“人机共生，产需共融”——2026世界机器人大会新闻发布会在京召开

2026世界机器人大会新闻发布会在北京召开，会议以“人机共生，产需共融”为主题，围绕大会筹备进展、活动定位与产业链接方向进行介绍。该大会通常聚焦机器人技术创新、产业应用、供需对接及国际交流，释放出机器人产业协同发展与场景落地持续推进的信号。

国内量子位 · 2 天前 ★★★★★

翁荔新博客提出「自进化先从Harness开始」，DeepSeek崔添翼转发附议

翁荔在最新博客中提出“自进化先从 Harness 开始”的观点，强调可先从评测、反馈与迭代框架入手推动智能体或模型能力持续改进。DeepSeek 崔添翼转发并表示该方向“很容易出成果”，显示业内对以工程化闭环支撑自进化路径的关注。

国内 36氪 AI · 2 天前 ★★★★★

恒指收涨2.99%，恒生科技指数涨4.97%

港股当日显著走强，恒生指数收涨2.99%，恒生科技指数涨4.97%。汽车、传媒及软件服务板块领涨，智谱、阿里巴巴、快手、百度集团、理想汽车均录得较大涨幅；电气设备、机械和医药生物板块承压。南向资金净买入141.94亿港元，显示资金持续流入港股市场。

国内 36氪 AI · 2 天前 ★★★★★

挚达科技等在宁波成立具身智能科技公司

天眼查信息显示，宁波挚达具身智能科技有限公司近日成立，注册资本2500万元，法定代表人为黄志明。公司经营范围涵盖智能机器人研发、工业机器人制造、充电桩销售及新兴能源技术研发，由上海挚达科技发展股份有限公司与宁波高新区检测园开发管理有限公司共同持股。

国内量子位 · 2 天前 ★★★★★

智能伙伴共创未来！WAIC 2026即将举行并首发主题片

WAIC 2026世界人工智能大会宣布即将举行，并同步首发大会主题片“智能伙伴共创未来”。目前披露信息主要聚焦活动预热与品牌传播，文章未提供举办时间、地点、议程设置、参会机构或新品发布等更具体内容，反映大会进入前期宣传阶段。

国内 36氪 AI · 2 天前 ★★★★★

阿里Q1财报前瞻：云增长45%大超预期，电商利润恢复，闪购减亏快于预期

市场前瞻显示，阿里巴巴2027财年Q1表现或好于预期：阿里云收入增速加快至约45%，EBITA利润率由约9.1%升至低双位数；中国电商与AIDC整体利润同比持平并恢复改善，淘宝闪购减亏速度也快于预期。受消息带动，阿里港股盘中涨超13%，报108.3港元。

媒体 Hacker News · 3 天前 ★★★★★

GitLost: We Tricked GitHub's AI Agent into Leaking Private Repos

安全研究机构 Noma Security 披露名为 GitLost 的攻击方法，称可诱导 GitHub 的 AI Agent 泄露私有代码库内容。文章核心聚焦针对 AI 编程代理的提示注入与权限边界风险，指出当代理可访问私有仓库时，攻击者可能借助恶意上下文实现数据外泄，反映出 AI 开发工具在安全隔离与访问控制上的薄弱点。

国内量子位 · 3 天前 ★★★★★

DeepSeek秘密造芯！专攻推理，一年前已启动，招聘全程不公开

消息称 DeepSeek 已秘密推进自研 AI 芯片项目，方向聚焦推理场景，且约一年前就已启动。其间公司已与芯片设计企业、晶圆代工厂及存储器供应商展开接洽，相关招聘流程也保持非公开状态，显示其正尝试向算力基础设施上游延伸布局。

国内 36氪 AI · 3 天前 ★★★★★

太龙股份：公司不直接开展物理AI相关产品研发与技术储备

太龙股份在互动平台回应称，公司主营业务为半导体分销，不直接开展物理AI相关产品的研发与技术储备。该表态明确了公司当前在AI产业链中的角色定位，澄清其并未涉足物理AI核心技术开发或相关产品布局。

国内 36氪 AI · 3 天前 ★★★★★

腾讯宣布OpenAI前研究员田永龙入职，参与VLM研发

腾讯确认OpenAI前研究员田永龙已于近期加入腾讯大语言模型部，将参与视觉语言模型VLM研发。这是腾讯再次引入OpenAI背景人才。此前腾讯已升级大模型研发架构，并任命前OpenAI高级研究员姚顺雨担任首席AI科学家及相关部门负责人，持续强化模型与基础设施能力建设。

国内 36氪 AI · 3 天前 ★★★★★

德国：人工智能推动德国初创企业创纪录增长

德国创业协会与Startupdetector报告称，2026年上半年德国新成立3053家初创企业，较2025年下半年增长52%，创历史同期新高。其中1038家具有明确人工智能业务背景，占比超过三分之一。报告指出，人工智能降低了创业门槛，推动以更少资金、更快速度创办企业，软件仍是最活跃赛道。

国内 36氪 AI · 3 天前 ★★★★★

深成指、创业板指均跌超2%

A股三大指数午间走弱，深成指与创业板指跌幅均超过2%，沪指下跌0.43%。盘面上，锂矿、玻璃基板、机器人、半导体芯片等板块领跌，市场情绪偏弱，沪深京三市下跌个股超过3500只，显示整体风险偏好明显回落。

国内 36氪 AI · 3 天前 ★★★★★

银河证券：建议关注头部算力租赁厂商

银河证券表示，AI 推理算力需求快速增长，推动“token 工厂”模式加速落地。相较传统按资源和时长计费的算力租赁，该模式更强调与大模型推理需求绑定，定价转向按 token 产出和单位成本，上游算力基础设施有望提升议价能力，并通过 MaaS 与 token 分成模式改善利润率和估值。

国内 36氪 AI · 3 天前 ★★★★★

OpenAI首席未来学家宣布离职

OpenAI首席未来学家约书亚·阿奇亚姆宣布将于7月离职，结束近九年任职。他称离开并无单一具体原因，而是长期思考后的决定，并认为随着AI潜力已被广泛认知，在顶级前沿实验室之外也能推进相关使命。其后续去向尚未披露。

国内 36氪 AI · 3 天前 ★★★★★

高温热浪催生多维降温刚需，清凉经济扩容升级

全国持续高温带动民生消暑、工业生产和算力散热等多层次需求集中释放，推动家用与商用制冷设备订单增长、清凉消费升温，并使全社会用电负荷屡创新高，电力保供需求增强。同时，AI数据中心加快液冷等热管理技术落地，清凉经济由季节性消费向实体产业与数字基础设施延伸。

国内 36氪 AI · 3 天前 ★★★★★

中信建投：AI PCB需求放量，高阶升级趋势明确

中信建投表示，算力需求已成为PCB行业最重要的结构性增量。随着AI服务器由CPU平台转向GPU/ASIC集群，PCB在用量、层数、材料、孔结构、线路精度及可靠性方面要求全面提升，推动高多层板与高阶HDI需求增长；同时M7-M9低损耗基材和mSAP等精密工艺加速导入，带动设备及配套耗材升级机会。

国内 36氪 AI · 3 天前 ★★★★★

告别“无差别上涨”，AI行情进入下半场

报道指出，随着三星盈利大增却股价下跌、Meta拟出售闲置算力等事件出现，市场开始担忧AI产业存在算力过剩与估值透支风险。科技股行情正由此前围绕AI叙事的普涨，转向以财报兑现、商业化进展和现金流能力为核心的分化阶段，美股财报季将成为重要验证窗口。

国内 36氪 AI · 3 天前 ★★★★★

AI盛宴背后：全球股市坐在杠杆“火药桶”上

韩国KOSPI指数7月7日盘中跌8%触发熔断，SK海力士、三星电子重挫，相关两倍杠杆ETF单日跌幅超15%，较高点已腰斩。受AI与半导体行情推动，韩美杠杆交易工具规模快速膨胀，韩国杠杆ETF资产一度达450亿美元。韩国央行等警示，资金过度集中科技权重股，趋势反转时或放大抛压并引发流动性风险。

媒体 The Verge AI · 3 天前 ★★★★★

Of course viewers are giving up on Netflix shows

文章称，尽管 Netflix 仍是全球最受欢迎的付费流媒体平台，但其剧集在首季后持续留住观众的能力正承压。以《Beef》为例，该系列今年回归后观众规模较首季下滑约70%。内容指出，平台在续作定位、观众预期与系列延续性方面存在混乱，导致用户追更意愿下降。

媒体 Hacker News · 3 天前 ★★★★★

We charge $10k a week to delete AI-generated code

Odra 以“We charge $10k a week to delete AI-generated code”为题介绍其付费服务，称每周收费 1 万美元，帮助团队清理和替换低质量 AI 生成代码。给定片段主要包含文章与 Hacker News 链接、53 个点赞和 21 条评论，反映出开发者社区对 AI 编程产物治理与代码质量问题的关注。

媒体 Hacker News · 3 天前 ★★★★★

Re: I'm Begging You to Leave Your AI Note-Taker at Home

一篇题为《是的，我确实介意》的文章回应“别把 AI 会议记录工具带来”的讨论，强调在会议、社交或协作场景中，未经充分同意部署 AI 录音与转写工具会引发隐私、信任和边界问题。相关内容在 Hacker News 引发少量讨论，反映出公众对 AI 记录助手使用规范的持续争议。

媒体 TechCrunch AI · 3 天前 ★★★★★

Why the rise of open source AI isn’t hurting Anthropic … yet

文章指出，开源AI模型的崛起暂未直接冲击Anthropic等前沿实验室商业空间。当前格局更像同一技术生命周期的两个阶段：前沿机构率先投入高成本研发，开源社区随后扩散、优化并推动更广泛应用，二者短期内形成分工而非零和竞争。

媒体 TechCrunch AI · 3 天前 ★★★★★

Microsoft joins AI cost-cutting trend by relying more on its own models

微软被报道加入硅谷科技公司压缩 AI 成本的趋势，开始更多依赖自研模型，以减少对外部模型和相关支出的依赖。文章片段显示其正调整 AI 投入结构，在持续推进人工智能业务的同时，寻求提升成本效率与资源控制能力。

媒体 The Verge AI · 3 天前 ★★★★★

Doom developer id reportedly cut in half as part of Xbox layoffs

据报道称，在Xbox大规模裁员背景下，《毁灭战士》开发商id Software约有50%员工被裁，涉及人数可能超过90人，质量保证部门受影响尤为明显。此次裁员被视为微软游戏业务调整的一部分，反映出主机与游戏开发团队在组织和成本层面的持续收缩压力。

媒体 Hacker News · 3 天前 ★★★★★

Automating AI Away

文章标题为“Automating AI Away”，给出的正文仅含原文链接、Hacker News 讨论链接及互动数据，未提供可供提炼的具体内容、观点或产品信息。现有信息显示该文在社区获得34分、15条评论，但无法据此准确判断其涉及的技术细节、商业进展或实际影响范围。

媒体 The Verge AI · 3 天前 ★★★★★

Xbox’s bold plan for the future sounds nearly impossible

微软宣布对 Xbox 进行“史上最大规模重组”并伴随新一轮裁员，反映游戏行业持续承压。与此同时，Xbox CEO Asha Sharma在内部备忘录中提出更激进的长期目标，希望Xbox成为少数可同时服务十亿级用户的娱乐公司，显示其在收缩成本与扩张愿景之间并行推进战略调整。

国内量子位 · 3 天前 ★★★★★

DeepSeek招聘被「华为天才少年」公开吐槽，“面到最不专业的”

一则围绕 DeepSeek 招聘流程的舆论引发关注。有“华为天才少年”背景人士公开吐槽其面试体验，称其为自己经历中过于不专业的一次；相关讨论随后延伸至 DeepSeek 在人才招聘、HR 配置与面试组织上的问题，折射出明星 AI 公司快速扩张下面临的组织管理挑战。

国内 36氪 AI · 3 天前 ★★★★★

高盛：重资产股盈利有望引领涨势，资金轮动进入“持久战”

高盛策略师表示，随着实物资产、基础设施和工业产能的战略重要性提升，资本密集型企业在本轮财报季有望交出更稳健盈利并继续跑赢轻资产公司。报告认为市场对相关领域仍配置不足，资金轮动将持续，重资产板块或成为后续涨势的重要驱动力。

媒体 MIT Tech Review AI · 3 天前 ★★★★★

The foundational elements of AI architecture that IT leaders need to scale

文章聚焦企业在生成式AI与智能体系统快速演进背景下，如何通过回归AI架构的基础要素实现可扩展部署。内容强调IT领导者需在技术持续变化与投资不确定性并存的环境中，围绕核心基础设施、架构设计与长期适配能力进行规划，以降低风险并支持更多业务场景落地。

国内 36氪 AI · 3 天前 ★★★★★

美国2026上半年并购总额创历史新高，达到1.45万亿美元同比增长75%

LSEG数据显示，截至2026年6月24日，上半年以美国企业为对象的并购交易总额达1.4467万亿美元，同比增长75%，创2002年以来同期最高纪录。AI普及推动科技与能源行业整合加速，叠加特朗普政府监管放宽，共同带动美国并购市场显著升温。

国内量子位 · 3 天前 ★★★★★

从共识到非共识：科技有「联想」沙龙首场活动直击具身智能产业化“三大困惑”

“科技有联想”沙龙首场围绕具身智能产业化展开，聚焦行业从“共识”走向“非共识”的关键阶段，集中讨论落地过程中面临的三大核心困惑。活动以深度思辨形式呈现，反映产业界对技术路线、商业化节奏与应用场景选择等问题仍存在明显分歧。

国内 36氪 AI · 3 天前 ★★★★★

建发集团成立新科技公司，注册资本5亿

天眼查显示，厦门建发科技有限公司近日成立，法定代表人为蔡晓帆，注册资本5亿元。公司经营范围涵盖技术开发与咨询、人工智能行业应用系统集成、AI应用软件开发、信息系统集成、软件开发、大数据及物联网服务，由厦门建发集团及其旗下产业投资公司共同持股。

国内 36氪 AI · 3 天前 ★★★★★

Salesforce计划未来五年在瑞士投资10亿美元

Salesforce宣布未来五年将在瑞士投资10亿美元，资金将主要用于支持当地员工队伍建设、拓展客户基础，并推动人工智能相关技能发展。该计划显示公司继续加码欧洲市场布局，同时强化企业服务与AI能力建设。

国内 36氪 AI · 3 天前 ★★★★★

申昊科技成立智算科技公司，注册资本5000万

天眼查信息显示，7月7日杭州申昊智算科技有限公司成立，法定代表人为陶志锋，注册资本5000万元，由申昊科技全资持股。公司业务涵盖技术服务、数据处理与存储、云计算装备技术服务、大数据服务及人工智能行业应用系统集成等，显示其在智算与AI基础设施方向加码布局。

国内量子位 · 3 天前 ★★★★★

我宣布这是中国最神奇的造车新势力

文章围绕一家被称为“中国最神奇的造车新势力”的车企展开，核心信息是其在竞争激烈的新能源车市场中，仅凭一款车型支撑运营长达5年仍未出局，反映出该公司在产品定位、成本控制或细分市场经营上的特殊韧性与生存能力。

国内 36氪 AI · 4 天前 ★★★★★

追觅在武汉成立新信息技术公司

天眼查信息显示，追觅信息技术（武汉）有限公司近日成立，法定代表人为姚康，注册资本100万元。新公司经营范围涵盖信息技术咨询服务、智能机器人销售及软件开发等业务，由追觅信息技术（苏州）有限公司全资持股，显示其在区域布局和业务拓展上的进一步推进。

国内 36氪 AI · 4 天前 ★★★★★

快手轻雀在上海成立新公司

天眼查信息显示，上海可灵星图科技有限公司近日成立，法定代表人为宋成儒，注册资本1000万元，经营范围涵盖人工智能基础软件开发、应用软件开发及行业应用系统集成服务。股权信息显示，该公司由北京可灵智能科技有限公司全资持股，反映出快手轻雀相关主体在上海布局新业务实体。

国内量子位 · 4 天前 ★★★★★

征程赶超｜WAIC 2026科学智能：AI4S从“辅助计算”到“自主发现”，中国如何重塑全球科研版图？

文章围绕 WAIC 2026“科学智能”议题，讨论 AI4S 正从辅助计算升级为面向科研流程的自主发现工具，关注其在基础研究、实验设计、数据分析和跨学科协同中的作用，并聚焦中国借助算力、模型、平台与产业场景联动，重塑全球科研竞争格局的路径。

国内量子位 · 4 天前 ★★★★★

征程赶超｜WAIC 2026理论突破：以数理双向赋能为钥，开启AI范式革新新征程

文章标题聚焦 WAIC 2026 所强调的“理论突破”，核心指向以数学与物理等基础学科对人工智能进行双向赋能，推动模型能力、训练机制与方法论层面的范式革新。由于未提供正文细节，信息主要停留在大会议题与方向性表述，尚缺少具体技术成果、机构发布或落地案例。

国内 36氪 AI · 4 天前 ★★★★★

恒指开盘跌0.2%，恒生科技指数跌0.37%

港股早盘低开，恒生指数跌0.2%，恒生科技指数跌0.37%。板块表现分化，半导体、传媒、耐用消费品领跌，兆易创新、快手跌超5%，泡泡玛特跌超1%；软件服务、汽车、建材逆势走强，卧安机器人涨超4%，耐世特、中深建业涨超2%。

国内 36氪 AI · 4 天前 ★★★★★

中信证券：韩国未来有望成为物理AI时代的重要参与者

中信证券研报称，物理AI持续升温，其本质可视为具身智能与机器人概念的延伸。韩国近期提出物理AI超级项目，叠加当地机器人产业链硬件基础扎实、由现代等财阀主导，已形成较完整制造体系，未来有望成为物理AI重要参与者，但在具身模型和供应链降本方面仍落后于中美。

媒体 TechCrunch AI · 4 天前 ★★★★★

The ‘first’ AI-run ransomware attack still needed a human

报道披露，已知首例由 AI 代理执行技术环节的真实勒索软件攻击并非完全自主作案。人类攻击者仍负责挑选受害者、搭建攻击基础设施并提供窃取的登录凭证，AI 主要承担入侵与执行流程，显示网络犯罪自动化提升，但关键决策仍依赖人工。

国内 36氪 AI · 4 天前 ★★★★★

今年1至5月我国机器人规上企业营业收入突破900亿元

在2026世界机器人大会新闻发布会上披露，今年1至5月我国机器人规上企业营业收入已超过900亿元，同比增长26.9%。我国连续十三年保持全球最大工业机器人市场地位，自主品牌工业机器人国内市场占有率已突破50%，显示产业规模与国产替代能力持续提升。

国内 36氪 AI · 4 天前 ★★★★★

华泰证券：看好受益AI产品迭代浪潮的二手消费电子细分赛道

华泰证券称，二手经济并非短期“消费降级”产物，而是消费理念成熟与经济发展阶段演进下的长期趋势。报告指出，优质闲置商品积累、居民处置意愿提升、理性消费带动渗透率上升，加之“以旧换新”和循环经济政策密集出台，行业正处于供需共振、模式优化的黄金发展期，并看好受AI产品迭代带动的二手消费电子细分赛道。

媒体 Hacker News · 4 天前 ★★★★★

AI: The ROI Runway Could Be Long Outside the Tech Sector

文章认为，人工智能在科技行业外的投资回报周期可能更长。由于传统行业数据基础、流程改造、系统集成和组织变革更复杂，AI 落地往往需要更久才能体现效率与盈利改善。该观点提示市场应区分不同行业的采用节奏与回报兑现时间，而非套用科技行业的增长预期。

媒体 Hacker News · 4 天前 ★★★★★

GLM 5.2 and the coming AI margin collapse

文章围绕 GLM 5.2 讨论 AI 行业可能出现的利润率下滑趋势，结合 Hacker News 上的转载信息，指出随着模型能力趋同、竞争加剧与成本持续下降，通用大模型商业化或面临价格战压力。当前内容主要体现行业观察与市场判断，并非官方模型发布或融资事件。

媒体 TechCrunch AI · 4 天前 ★★★★★

Vercel CEO Guillermo Rauch on the fight to split off models from agents

Vercel CEO Guillermo Rauch 表示，企业在将 AI 投入生产环境时，核心考量正从单纯追逐模型能力转向价格与性能权衡，并推动将底层模型与上层智能体解耦。此举旨在提升部署灵活性、成本控制和产品迭代效率，反映开发平台对 AI 应用架构演进的关注。

媒体 The Verge AI · 4 天前 ★★★★★

America’s greatest idea is still under threat

文章借美国建国250周年庆典切入，围绕“美国最伟大的理念仍受威胁”展开讨论。正文片段主要描述国内外庆祝活动，包括烟花、法国点亮埃菲尔铁塔、日本举行庆祝以及法国战机飞越纽约，强调美国象征意义与全球影响，但未体现明确的人工智能产业进展。

媒体 TechCrunch AI · 4 天前 ★★★★★

The running list: major tech layoffs in 2026 where employers cited AI

文章汇总了2026年科技行业中明确将AI列为裁员因素的重要案例，按时间倒序持续更新，聚焦大型科技公司在组织重组、自动化替代和效率优化背景下的人员缩减动态，反映AI对就业结构与企业运营策略的持续影响。

媒体 MIT Tech Review AI · 4 天前 ★★★★★

Your family’s $300 stake in OpenAI

报道称，OpenAI 首席执行官 Sam Altman 正推进其“让美国人分享 AI 创造财富”的设想，相关讨论因英国《金融时报》报道再度升温。文章围绕普通家庭或可通过约 300 美元持股参与 OpenAI 收益展开，反映出其探索更广泛资本参与和 AI 红利分配机制的最新动向。

当前频道各来源累计条数

arXiv AI2182
36氪 AI988
The Verge AI503
TechCrunch AI409
量子位383
Hacker News372
OpenAI Blog126
Google DeepMind61
MIT Tech Review AI40