北京时间周五凌晨,OpenAI迈出构建“超级AI应用”的关键一步:在编程代理Codex的大更新中上线能“自主操作用户Mac电脑应用”的功能。

(来源:X)
作为背景,相较于面向广泛大众的ChatGPT和已经“入土”的视频生成应用Sora,资本市场对面向软件开发者的自然语言编程应用Codex关注度会低一些。但今天的更新显然已经远远超出“写代码”的范畴。
OpenAI在题为《(几乎)万事皆可用的Codex》的公告中如此写道:“Codex现在可以与你并肩操作你的电脑,使用更多你电脑里的工具和应用工作,还能够生成图像、记住你的偏好、从过往操作中学习,并承担持续性和可重复的工作任务。”
公司表示,Codex可以在后台“使用电脑上的所有应用”,并支持多代理同步工作。OpenAI特别强调“后台”属性,意味着智能体不会与用户“抢”电脑。
应用内也新增了内置浏览器,使用者可以直接在页面上输入评论,向智能体提供精确指令。这项功能对前端和游戏开发非常有用。

Codex现在也可以使用gpt-image-1.5模型来生成和迭代图像,开发者无需为了生成AI图像而切换到ChatGPT应用。
除了这三项关键功能外,OpenAI还发布了111个Codex插件,结合了技能、应用集成和MCP服务器,以扩展Codex的功能。这项更新明显是为了对标Anthropic的Claude Code。
自动化功能也在本次更新之列,Codex可以为自己安排未来的工作并自动唤醒执行,还能根据历史记录、邮箱、办公应用等信息源,主动提议可以执行的工作,或提供具有优先级排序的待办事项清单。

OpenAI也毫不掩饰下一步的野心。OpenAI上个月曾确认正在开发一款桌面端“超级应用”,将ChatGPT、Codex,以及Atlas浏览器整合为统一的使用体验。
Codex负责人Thibault Sottiaux在媒体沟通会上直白地表示,公司正在以公开透明的方式打造这款超级应用。最新的发布主要面向开发者,未来会逐步扩展到更广泛的用户群体。