2025年3月6日 · AI 与科技圈新闻日报

基于年月日整理的今日 AI / 科技热点，含摘要与简评。

一、AI 与开发工具

1. ChatGPT 在 macOS 上可直接编辑代码

摘要：
OpenAI 为 macOS 版 ChatGPT 应用增加了直接编辑代码能力。用户可在 Xcode、VS Code、JetBrains 等主流 IDE 中，让 ChatGPT 直接修改代码；并可开启「自动应用」模式，无需逐条点击确认。该功能已向 ChatGPT Plus、Pro、Team 用户开放，Enterprise、Edu 及免费用户将于下周陆续获得。Windows 版「很快」也会支持直接编辑代码。该能力建立在 2024 年 11 月推出的「Work with apps」能力之上，使 ChatGPT 与 Cursor、GitHub Copilot 等 AI 编程工具形成更直接的竞争。

简评：
从「只能看代码」到「能改代码」，是产品形态上的重要一步，也意味着 AI 编程助手从「建议型」走向「执行型」。对 Cursor、Copilot 来说压力会加大；对开发者而言，需要更谨慎地对待自动应用，关注安全、版权和代码质量。结合 YC 调查（约 1/4 的 W25 项目代码库几乎全由 AI 生成），行业正在快速接受「AI 写代码」，但调试与可维护性仍是长期课题。

2. DuckDuckGo 的 AI 聊天 Duck.ai 正式结束 Beta

摘要：
DuckDuckGo 的生成式 AI 聊天产品 Duck.ai 于 3 月 6 日正式结束 Beta。用户可选用 Anthropic、OpenAI、Meta 等多家模型，包括新加入的 OpenAI o3-mini、Meta Llama 3.3。同时，DuckDuckGo 主搜索中的 AI 辅助回答已覆盖数百万日活，在开启该功能的用户中，出现频率超过 20%。公司正在考虑推出付费档位，提供更高查询限额和更高级模型。

简评：
隐私向搜索引擎把 GenAI 做成正式产品，是在「隐私」与「AI 体验」之间找平衡的典型尝试。多模型可选能降低对单一供应商的依赖，也有利于用户按场景切换。若付费 tier 设计合理，有机会成为小而美的「隐私友好型 AI 入口」，但需面对与 ChatGPT、Perplexity 等产品的差异化竞争。

3. Mistral 推出 OCR API：PDF 转 AI 可用 Markdown

摘要：
Mistral 发布 Mistral OCR API，可将任意 PDF 转为适合大模型使用的 Markdown，并具备多模态能力，能识别插图、照片等元素。服务通过 Mistral 自有平台及 AWS、Azure 等云合作伙伴提供。

简评：
把非结构化文档（尤其是 PDF）变成「可被 LLM 高效消化」的格式，是 RAG 和知识库场景的刚需。Mistral 从模型层延伸到文档预处理，有助于形成「模型 + 工具链」的一体化方案，对企业和开发者都有吸引力。PDF 处理赛道会继续升温。

4. 腾讯混元发布并开源图生视频模型

摘要：
腾讯混元发布并开源图生视频模型，并上线对口型、动作驱动等能力。用户上传一张图片并描述运动方式，即可生成约 5 秒短视频并自动配音效。模型参数量约 130 亿，支持 2K 高质量视频生成，开源内容已在 GitHub、HuggingFace 等平台开放。

简评：
国内大厂在「图生视频」上选择开源，有利于生态和开发者采用，也便于与 Sora、Runway 等国际产品做差异化（如中文场景、合规与部署可控）。130B 参数 + 2K 输出是实用向的配置，对口型与动作驱动对营销、教育、短视频等场景很有价值。

5. 中国团队 Manus：全球首款通用型 AI 智能体产品

摘要：
中国团队 Monica 发布通用型 AI 智能体产品 Manus，主打「真正自主」：在云端独立执行任务，而非仅提供建议。在 GAIA 基准测试中，Manus 表现优于 OpenAI 同层次大模型。支持简历筛选、房产研究、股票分析等 51 个用例，覆盖研究、教育、数据分析、生活规划等六大场景；采用多模型协作、持续学习与记忆，支持云端异步执行与断点续跑。因邀请码内测机制，被部分声音质疑「饥饿营销」；Manus 合伙人张涛两度澄清：未做市场推广投放，邀请码源于「服务器容量有限」。

简评：
若 GAIA 成绩经得起复现，Manus 在「自主执行复杂任务」上确实有亮点，与当前多数「对话 + 建议」型产品形成区分。争议集中在运营方式：邀请码容易引发炒作联想，团队连续澄清说明对品牌和信任的重视。对行业而言，通用型 Agent 从「演示」走向「可用的产品」，仍需在稳定性、安全与可解释性上持续验证。

6. Luma 发布创意 AI Agent，基于「Unified Intelligence」模型

摘要：
Luma 推出由新 Unified Intelligence 模型驱动的创意 AI Agent，覆盖文本、图像、视频、音频的端到端创作。Agent 基于 Uni-1 模型，具备跨素材的持久上下文，并能与其他 AI 系统协作。已与阳狮集团、Serviceplan、阿迪达斯、马自达等客户合作。

简评：
「多模态 + 持久上下文 + 可协作」是下一代创意工具的重要方向。Luma 从视频生成扩展到全流程创意 Agent，与广告、品牌客户合作，有助于验证商业场景。创意行业对「可控性」和「品牌一致性」要求高，Agent 能否在流程中稳定扮演「创意副驾驶」将是关键。

二、AI 基础设施与融资

7. Shield AI 获 2.4 亿美元融资，估值 53 亿美元

摘要：
美国圣地亚哥国防科技公司 Shield AI 完成 2.4 亿美元融资，估值达 53 亿美元。其 Hivemind 软件已为战斗机和无人机提供自主飞行能力；公司计划将 Hivemind 向更多客户（如机器人公司）推广。投资方包括 L3Harris、韩华航空航天等，Shield AI 现为美国估值第二高的国防科技初创公司，仅次于 Anduril（约 280 亿美元估值）。

简评：
自主与无人系统在国防与民用领域都是长期赛道，资本持续加码。Shield AI 从「军用无人机」扩展到更广泛的自主与机器人客户，有助于摊薄对单一订单的依赖，并提升估值天花板。地缘与监管仍是该领域最大的变量。

8. Turing 完成 1.11 亿美元 E 轮融资，估值 22 亿美元

摘要：
Turing 为 OpenAI 等 LLM 厂商提供编程与标注人才，完成 1.11 亿美元 E 轮融资，估值约 22 亿美元（较上轮约翻倍）。公司年经常性收入约 3 亿美元，与全球约 400 万名程序员合作。

简评：
AI 公司对高质量标注、数据清洗和定制开发的需求持续增长，Turing 这类「人才 + 平台」模式直接受益。估值翻倍反映市场对 AI 基础设施与人力外包的看好，也说明「AI 背后的人力网络」仍是关键一环，尚未被完全自动化替代。

三、航天与太空

9. SpaceX Starship 第八次试飞再次失败

摘要：
3 月 6 日，SpaceX 在得州 Starbase 进行 Starship 第八次试飞。Super Heavy 一级与 33 台 Raptor 发动机工作正常，一级成功被「Mechazilla」塔架接住（第三次成功回收）。约 9 分 30 秒后， Starship 上面级后部发生「剧烈事件」，多台发动机失效，飞行器姿态失控、旋转并失联，残骸在佛罗里达及加勒比地区上空可见。FAA 对迈阿密、劳德代尔堡、棕榈滩、奥兰多等机场实施临时地面管控。马斯克称其为「小挫折」，下一枚火箭预计 4–6 周内可再次试验。

简评：
连续两次在上面级相近阶段失败，说明该阶段（如推进剂管理、发动机或结构）仍有系统性瓶颈，需要迭代设计或工艺。一级回收的稳定化是积极信号。公众与监管对「残骸影响空域」的敏感度在上升，SpaceX 在「快速迭代」与「安全合规」之间的平衡会持续被关注。

10. 欧洲 Ariane 6 首次完整任务成功部署间谍卫星

摘要：
欧洲 Ariane 6 火箭在法属圭亚那完成首次完整商业任务，成功将法国军用侦察卫星 CSO-3 送入轨道。这是欧洲在运载与卫星部署上实现更大自主、减少对美国（如 SpaceX）依赖的重要一步。

简评：
与 Starship 同日形成对比：Ariane 6 的稳定首单任务，强化了「欧洲自有发射能力」的叙事。在商业发射与地缘需求的推动下，多极化的发射与卫星服务格局会继续演进。

四、今日小结

AI 产品：ChatGPT 从「读代码」到「改代码」，DuckDuckGo、Mistral 在搜索与文档处理上深化 GenAI；腾讯混元、Manus、Luma 分别在图生视频、通用 Agent、创意 Agent 上推进，AI 正在更深地嵌入开发、搜索与创意流程。
资本与基础设施：Shield AI、Turing 等大额融资显示，国防自主、AI 人力与数据服务仍是高估值赛道；Mistral 等则通过 API 与工具链扩展边界。
航天：Starship 再次上面级失败，凸显工程难度；Ariane 6 首单成功则体现欧洲发射能力的恢复与战略意义。

整体来看，3 月 6 日既是 AI 应用与工具链 的「落地日」（编辑代码、多模态文档、Agent 产品化），也是航天的「对比日」（迭代中的 Starship 与稳健的 Ariane 6），技术和商业的推进与风险并存。

本日报由自动化整理与评述生成，仅供参考；具体事实以各信源为准。
日期：2025年3月6日（周五）