当地时间8月7日,OpenAI揭开了其最新人工智能模型GPT-5的神秘面纱。
这款被首席执行官山姆·奥尔特曼称为“此前所有模型的巨大飞跃”的AI模型,将在未来一周内分批向包括免费用户在内的所有ChatGPT用户开放。
“如果说GPT-4像一名大学生,那么GPT-5则是一位真正的领域专家——它能写诗、编程,甚至帮你分析体检报告。”但OpenAI也强调:“它并不能代替医生。”
“诗人”“博士”“看诊师”
根据OpenAI介绍,作为OpenAI的“最强大模型”,GPT-5在三个关键领域实现了显著提升。
作为OpenAI的“最强大模型”,GPT-5在编程能力、创意写作、健康领域等关键领域实现了显著提升。
首先是编程能力。GPT-5是OpenAI迄今为止最强大的编码模型,在复杂的前端生成和大型代码库调试方面表现突出,能够仅凭一个提示就创建美观响应式的网站、应用程序App和游戏。
OpenAI官网展示了五个案例:一款类似“Flappy Bird”的网页游戏、像素画板、打字测速工具、架子鼓模拟器和音频可视化程序——这些过去需要开发者数小时完成的工作,如今只需几句话就能实现。
在基准测试SWE-bench Verified中,GPT-5思考后首次尝试的准确率达74.9%。外界认为,这代表GPT-5的表现略胜于Anthropic周二推出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro。
在创意写作领域,GPT-5的表现更像一位诗人或文学搭档。无论是严格的抑扬格五音步诗,还是随性的自由诗,它都能驾驭。“它能把粗略的灵感变成富有节奏感和深度的文字。”OpenAI介绍道。奥尔特曼还提到:“与GPT-5对话就像在与某个领域的博士级专家交流。”
在健康领域,据悉GPT-5在HealthBench基准测试中刷新了纪录,能更精准地解析医疗报告、提醒潜在健康风险。
不过OpenAI也强调,ChatGPT不能替代医疗专业人员。
未来一周内,GPT-5会免费分批向所有ChatGPT用户开放。其中,Plus会员可获得更多使用量,Pro会员则可访问GPT-5 Pro版本——该版本具有扩展推理能力,可提供更全面、更准确的答案。
军备竞赛下的隐忧
GPT-5的发布正值全球AI军备竞赛白热化阶段。
微软、谷歌、Meta等科技巨头今年在AI数据中心上的投入预计接近4000亿美元,但商业回报仍存疑问。
经济学作家诺亚·史密斯指出:“人们喜欢和ChatGPT聊天,但企业是否愿意大规模买单仍是未知数。”如何将消费者热度转化为企业级营收,也成为OpenAI盈利的关键命题。
技术上,OpenAI在训练GPT-5的过程中遭遇各种瓶颈,比如高质量数据短缺和算力限制的双重挑战。
一方面,大型语言模型依赖的高质量人类文本数据已接近极限;另一方面,模型规模越大,训练周期越长、硬件故障风险越高,团队可能需数月后才能评估一次训练的最终效果。
前首席科学家伊利亚·苏茨克弗曾提到:“数据供给速度远跟不上算力的增长。”
尽管如此,奥尔特曼依然乐观,“全球对AI基础设施的投资还远远不够,”在奥尔特曼看来,GPT-5并非终点,而是迈向更强大、更通用AI的重要一步。