OpenAI发布GPT-5.5:并非“等闲之辈”,Terminal-Bench 2.0险胜Claude Mythos Preview

经过数月传闻,OpenAI今日正式发布GPT-5.5。这款内部代号为“Spud”的新模型,是用于ChatGPT及API的更强大AI大语言模型。

不出所料,GPT-5.5绝非“等闲之辈”:它让OpenAI在通用大语言模型(LLMs)领域重夺领先,超越Anthropic和Google的最新公开模型,甚至在某个基准测试上以微弱优势险胜Anthropic的Claude Mythos Preview预览版(基本持平)。

“无论是从基准测试还是来自可信合作伙伴的反馈,以及我们自身的经验来看,GPT-5.5无疑是我们迄今为止最强的编程模型,”OpenAI研究副总裁Amelia ‘Mia’ Glaese在今日发布会前的记者会上表示。

OpenAI将GPT-5.5定位为智能与计算机操作系统及专业软件栈交互方式的根本性重新设计。

“这款模型最特别之处在于,它能用更少的指导完成更多任务。使用起来更直观,能分析模糊问题并确定下一步该做什么,”OpenAI联合创始人兼总裁Greg Brockman在同一场会议上说。

Brockman接着强调了用户在使用GPT-5.5相比OpenAI此前最先进的GPT-5.4模型时能看到的提升领域。目前,GPT-5.4仍以新模型一半的API成本提供给用户和企业。

“它的编程能力极强,”Brockman评价GPT-5.5。“在更广泛的计算机工作、计算机操作、科研等领域——这些存在智能瓶颈的应用中,它也表现出色。”

聚焦自主性GPT-5.5的核心在于聚焦…

原文链接:https://venturebeat.com/technology/openais-gpt-5-5-is-here-and-its-no-potato-narrowly-beats-anthropics-claude-mythos-preview-on-terminal-bench-2-0


关注微信号:智享开源 关注微博:IMCN开源资讯网 ,可及时获取信息

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章268篇


[blog_mailer_subscribe]

关注微信

分类