OpenAI 诞生者日新加坡站今天启幕开yun体育网,确凿如斯,ChatGPT 又出手了:

Gemini 刚在竞技场头把交椅上坐了不到一周,最新版 ChatGPT 轻轻一更新,第一再次易主。

对,还不是 o1 满血版,而是新版 4o。

具体来说,此番 GPT-4o 更新的是"创意写稿才略",官方说法是:

模子能完成更当然、更有劝诱力、更具针对性的写稿,文本臆测性和可读性更强。

还可以更好地处理上传的文献,提供更深刻的看法和更全面的响应。

o1 中枢孝顺者 Karina Nguyen 对此作念了进一步解说:

手脚 Canvas 功能的一部分,咱们但愿纠正写稿,因为这是一个顶级用例,况且可能会改造东谈主机配合的形势,来更具创造性地完成写稿任务。

我觉得咱们还莫得透顶处治这个研究问题,因为它尽头主不雅且怒放,但至少在写稿方面获取推崇,是 AGI 创造性智能的要津。

而在大模子竞技场的创意写稿分榜上,可以看到新版 4o(ChatGPT-4o-1120)照实有显着的提高,分数从上个版块的 1365 提高到了 1402。

至于履行效力,咱们简便测试了一下,望望你能给打个几分:

除了在总榜上为 OpenAI 重夺第一,新版 4o 在体现具体才略的各个分榜上亦有提高。

在创意写稿方面,从第 2 位升至第 1 位;

在代码才略方面,从第 2 位升至第 1 位;

在数学才略方面,从第 4 位升至第 3 位(第 1 照旧 o1-preview);

在贫困任务方面,从第 2 位升至第 1 位。

况且在作风戒指(Style Control)之后,新版 4o 已经位居首位。

作风戒指旨在让榜单分数更信得过地反应模子处治问题的才略,幸免模子靠漂亮的措施、加多回应长度刷分。

总胜率热图表露,新版 4o 对上此前登顶的 Gemini-Exp-1114,胜率为59%;对上 Claude 3.5 Sonnet,胜率为69%;对上 5 月版块的 4o,更是在72%的情况下齐能取胜。

嗯,看上去很强很可以,但照旧那句话……是 4o。

聚合本日份 DeepSeek 的大新闻——,不少网友径直在奥特曼"新的好模子来了"的推文下贴脸嘲讽起来:

可不是嘛,deepseek 挺好。

快把 o1 放出来,跟 deepseek-r1 正面比拟一下 : )

简而言之便是:o1 满血版块年上线传得满城风雨,当今 2024 年齐只剩下 40 几天了,OpenAI 你暗搓搓更新个 4o 是闹哪样!

还有东谈主试图回来 OpenAI 的更新口头:

OpenAI 的老伴计们怕不是写了个剧本,用来查询大模子竞技场排行第一的模子。

当复返值不是 OpenAI 的模子时,他们就部署个新版蓝本拿回第一。

嗯,才无论你期待的是什么呢╭ ( ╯ ^ ╰ ) ╮

另外,还有网友拿新 4o 的生成闭幕去作念了测试,闭幕系统照旧连忙判断出了 100%AI 写的:

△图源:� �@TuhinChakr

不外,一派吐槽声中,也有东谈主隆重研究了一下 OpenAI 的更新。

比如,在系统辅导词方面,大佬发现,OpenAI 照实暗暗给 ChatGPT 加了点料的:

## guardian_tool

Use the guardian tool to lookup content policy if the conversation falls under one of the following categories:

- `'election_voting'`: Asking for election-related voter facts and procedures happening within the U.S. ( e.g., ballots dates, registration, early voting, mail-in voting, polling places, qualification ) .

Do so by addressing your message to guardian_tool using the following function and choose `category` from the list ` [ 'election_voting' ] `:

```python

get_policy ( category:str ) -> str

```

The guardian tool should be triggered before other tools. DO NOT explain yourself.

"""

简便来说,便是新增了沿途护栏,确保 ChatGPT 不在敏锐话题上瞎掰八谈。

那么,若是你念念试试新版 4o 具体能写出什么"创意"内容,当今可以到竞技场免费试试:

https://lmarena.ai/?leaderboard

有什么好玩的闭幕,宽待回褒贬区共享给大伙儿 ~

参考流畅:

[ 1 ] https://x.com/OpenAI/status/1859296125947347164

[ 2 ] https://x.com/lmarena_ai/status/1859307979184689269开yun体育网




热点资讯

相关资讯



Powered by 开云kaiyun下载官网手机版「官方」最新下载IOS/安卓版/手机版APP @2013-2022 RSS地图 HTML地图