2025年3月6日 · AI 与科技圈新闻日报
基于年月日整理的今日 AI / 科技热点,含摘要与简评。
一、AI 与开发工具
1. ChatGPT 在 macOS 上可直接编辑代码
摘要:
OpenAI 为 macOS 版 ChatGPT 应用增加了直接编辑代码能力。用户可在 Xcode、VS Code、JetBrains 等主流 IDE 中,让 ChatGPT 直接修改代码;并可开启「自动应用」模式,无需逐条点击确认。该功能已向 ChatGPT Plus、Pro、Team 用户开放,Enterprise、Edu 及免费用户将于下周陆续获得。Windows 版「很快」也会支持直接编辑代码。该能力建立在 2024 年 11 月推出的「Work with apps」能力之上,使 ChatGPT 与 Cursor、GitHub Copilot 等 AI 编程工具形成更直接的竞争。
简评:
从「只能看代码」到「能改代码」,是产品形态上的重要一步,也意味着 AI 编程助手从「建议型」走向「执行型」。对 Cursor、Copilot 来说压力会加大;对开发者而言,需要更谨慎地对待自动应用,关注安全、版权和代码质量。结合 YC 调查(约 1/4 的 W25 项目代码库几乎全由 AI 生成),行业正在快速接受「AI 写代码」,但调试与可维护性仍是长期课题。
2. DuckDuckGo 的 AI 聊天 Duck.ai 正式结束 Beta
摘要:
DuckDuckGo 的生成式 AI 聊天产品 Duck.ai 于 3 月 6 日正式结束 Beta。用户可选用 Anthropic、OpenAI、Meta 等多家模型,包括新加入的 OpenAI o3-mini、Meta Llama 3.3。同时,DuckDuckGo 主搜索中的 AI 辅助回答已覆盖数百万日活,在开启该功能的用户中,出现频率超过 20%。公司正在考虑推出付费档位,提供更高查询限额和更高级模型。
简评:
隐私向搜索引擎把 GenAI 做成正式产品,是在「隐私」与「AI 体验」之间找平衡的典型尝试。多模型可选能降低对单一供应商的依赖,也有利于用户按场景切换。若付费 tier 设计合理,有机会成为小而美的「隐私友好型 AI 入口」,但需面对与 ChatGPT、Perplexity 等产品的差异化竞争。
3. Mistral 推出 OCR API:PDF 转 AI 可用 Markdown
摘要:
Mistral 发布 Mistral OCR API,可将任意 PDF 转为适合大模型使用的 Markdown,并具备多模态能力,能识别插图、照片等元素。服务通过 Mistral 自有平台及 AWS、Azure 等云合作伙伴提供。
简评:
把非结构化文档(尤其是 PDF)变成「可被 LLM 高效消化」的格式,是 RAG 和知识库场景的刚需。Mistral 从模型层延伸到文档预处理,有助于形成「模型 + 工具链」的一体化方案,对企业和开发者都有吸引力。PDF 处理赛道会继续升温。
4. 腾讯混元发布并开源图生视频模型
摘要:
腾讯混元发布并开源图生视频模型,并上线对口型、动作驱动等能力。用户上传一张图片并描述运动方式,即可生成约 5 秒短视频并自动配音效。模型参数量约 130 亿,支持 2K 高质量视频生成,开源内容已在 GitHub、HuggingFace 等平台开放。
简评:
国内大厂在「图生视频」上选择开源,有利于生态和开发者采用,也便于与 Sora、Runway 等国际产品做差异化(如中文场景、合规与部署可控)。130B 参数 + 2K 输出是实用向的配置,对口型与动作驱动对营销、教育、短视频等场景很有价值。
5. 中国团队 Manus:全球首款通用型 AI 智能体产品
摘要:
中国团队 Monica 发布通用型 AI 智能体产品 Manus,主打「真正自主」:在云端独立执行任务,而非仅提供建议。在 GAIA 基准测试中,Manus 表现优于 OpenAI 同层次大模型。支持简历筛选、房产研究、股票分析等 51 个用例,覆盖研究、教育、数据分析、生活规划等六大场景;采用多模型协作、持续学习与记忆,支持云端异步执行与断点续跑。因邀请码内测机制,被部分声音质疑「饥饿营销」;Manus 合伙人张涛两度澄清:未做市场推广投放,邀请码源于「服务器容量有限」。
简评:
若 GAIA 成绩经得起复现,Manus 在「自主执行复杂任务」上确实有亮点,与当前多数「对话 + 建议」型产品形成区分。争议集中在运营方式:邀请码容易引发炒作联想,团队连续澄清说明对品牌和信任的重视。对行业而言,通用型 Agent 从「演示」走向「可用的产品」,仍需在稳定性、安全与可解释性上持续验证。
6. Luma 发布创意 AI Agent,基于「Unified Intelligence」模型
摘要:
Luma 推出由新 Unified Intelligence 模型驱动的创意 AI Agent,覆盖文本、图像、视频、音频的端到端创作。Agent 基于 Uni-1 模型,具备跨素材的持久上下文,并能与其他 AI 系统协作。已与阳狮集团、Serviceplan、阿迪达斯、马自达等客户合作。
简评:
「多模态 + 持久上下文 + 可协作」是下一代创意工具的重要方向。Luma 从视频生成扩展到全流程创意 Agent,与广告、品牌客户合作,有助于验证商业场景。创意行业对「可控性」和「品牌一致性」要求高,Agent 能否在流程中稳定扮演「创意副驾驶」将是关键。
二、AI 基础设施与融资
7. Shield AI 获 2.4 亿美元融资,估值 53 亿美元
摘要:
美国圣地亚哥国防科技公司 Shield AI 完成 2.4 亿美元融资,估值达 53 亿美元。其 Hivemind 软件已为战斗机和无人机提供自主飞行能力;公司计划将 Hivemind 向更多客户(如机器人公司)推广。投资方包括 L3Harris、韩华航空航天等,Shield AI 现为美国估值第二高的国防科技初创公司,仅次于 Anduril(约 280 亿美元估值)。
简评:
自主与无人系统在国防与民用领域都是长期赛道,资本持续加码。Shield AI 从「军用无人机」扩展到更广泛的自主与机器人客户,有助于摊薄对单一订单的依赖,并提升估值天花板。地缘与监管仍是该领域最大的变量。
8. Turing 完成 1.11 亿美元 E 轮融资,估值 22 亿美元
摘要:
Turing 为 OpenAI 等 LLM 厂商提供编程与标注人才,完成 1.11 亿美元 E 轮融资,估值约 22 亿美元(较上轮约翻倍)。公司年经常性收入约 3 亿美元,与全球约 400 万名程序员合作。
简评:
AI 公司对高质量标注、数据清洗和定制开发的需求持续增长,Turing 这类「人才 + 平台」模式直接受益。估值翻倍反映市场对 AI 基础设施与人力外包的看好,也说明「AI 背后的人力网络」仍是关键一环,尚未被完全自动化替代。
三、航天与太空
9. SpaceX Starship 第八次试飞再次失败
摘要:
3 月 6 日,SpaceX 在得州 Starbase 进行 Starship 第八次试飞。Super Heavy 一级与 33 台 Raptor 发动机工作正常,一级成功被「Mechazilla」塔架接住(第三次成功回收)。约 9 分 30 秒后, Starship 上面级后部发生「剧烈事件」,多台发动机失效,飞行器姿态失控、旋转并失联,残骸在佛罗里达及加勒比地区上空可见。FAA 对迈阿密、劳德代尔堡、棕榈滩、奥兰多等机场实施临时地面管控。马斯克称其为「小挫折」,下一枚火箭预计 4–6 周内可再次试验。
简评:
连续两次在上面级相近阶段失败,说明该阶段(如推进剂管理、发动机或结构)仍有系统性瓶颈,需要迭代设计或工艺。一级回收的稳定化是积极信号。公众与监管对「残骸影响空域」的敏感度在上升,SpaceX 在「快速迭代」与「安全合规」之间的平衡会持续被关注。
10. 欧洲 Ariane 6 首次完整任务成功部署间谍卫星
摘要:
欧洲 Ariane 6 火箭在法属圭亚那完成首次完整商业任务,成功将法国军用侦察卫星 CSO-3 送入轨道。这是欧洲在运载与卫星部署上实现更大自主、减少对美国(如 SpaceX)依赖的重要一步。
简评:
与 Starship 同日形成对比:Ariane 6 的稳定首单任务,强化了「欧洲自有发射能力」的叙事。在商业发射与地缘需求的推动下,多极化的发射与卫星服务格局会继续演进。
四、今日小结
- AI 产品:ChatGPT 从「读代码」到「改代码」,DuckDuckGo、Mistral 在搜索与文档处理上深化 GenAI;腾讯混元、Manus、Luma 分别在图生视频、通用 Agent、创意 Agent 上推进,AI 正在更深地嵌入开发、搜索与创意流程。
- 资本与基础设施:Shield AI、Turing 等大额融资显示,国防自主、AI 人力与数据服务仍是高估值赛道;Mistral 等则通过 API 与工具链扩展边界。
- 航天:Starship 再次上面级失败,凸显工程难度;Ariane 6 首单成功则体现欧洲发射能力的恢复与战略意义。
整体来看,3 月 6 日既是 AI 应用与工具链 的「落地日」(编辑代码、多模态文档、Agent 产品化),也是 航天 的「对比日」(迭代中的 Starship 与稳健的 Ariane 6),技术和商业的推进与风险并存。
本日报由自动化整理与评述生成,仅供参考;具体事实以各信源为准。
日期:2025年3月6日(周五)