ChatGPT 5

Aug. 27th, 2025 10:40 pm
leblon: (Default)
[personal profile] leblon
 Купил себе платный сабж. Думал, поиграюсь месяц и ладно. С версией 4 у меня был неудачный опыт. 

И вот теперь я в шоке уже два дня. Машинка работает на уровне умного постдока. Причем с образованием во всех областях математики сразу. И раз в двадцать быстрее человека. Не знаю, радоваться или ужасаться.

(no subject)

Date: 2025-08-28 06:38 am (UTC)
ai_sur: (Default)
From: [personal profile] ai_sur
принимать как должное и готовиться жить в мире где машинка поумнеет еще раз в 100500

(no subject)

Date: 2025-08-28 06:31 pm (UTC)
avva: (Default)
From: [personal profile] avva
И что, нет галлюцинаций, не путается в показаниях? У меня немного другие результаты, есть улучшение в сравнении с 4, но не супер значительные.

(no subject)

Date: 2025-08-29 02:48 am (UTC)
dmm: (Default)
From: [personal profile] dmm
Вопрос в том, что значит "в сравнении с 4". С исходной 4 в марте 2023-го, с первой 4o, с самой новой 4o, с o3?

Вообще говоря, прогресс более-менее описывается кривой на первой картинке здесь:

https://evaluations.metr.org/gpt-5-report/

Так что, разница с исходной 4 в марте 2023-го огромна, а разница с o3 довольно заметна, но не супер значительна. Тем ни менее, похоже, что в сложных проектах на грани возможного сегодня, даже и разница с o3 довольно заметна, вот довольно типичный report, который очень сильно отличается от того, что было возможно с o3 для проектов этой сложности (advanced non-standard virtual machine and compiler), хотя до идеала там ещё очень, очень далеко (a neutral report, "some people on both sides of this debate will be upset"):

https://x.com/VictorTaelin/status/1960345221012619469

(no subject)

Date: 2025-08-29 06:32 am (UTC)
From: [personal profile] k_uao
Ну вот да. При этом вещь все равно полезная, и время экономит .

(no subject)

Date: 2025-08-29 01:14 am (UTC)
From: [personal profile] k_uao
У меня такое ощущение было в марте. Но если начать проверять за ней детали, такое себе. Если давать нерешенные задачи, которые негде подглядеть — вообще толку никакого нет. А так да, впечатляет и очень полезно, но по решению сложных задач не дотягивает даже до мастеранта хорошего.

Profile

leblon: (Default)
leblon

January 2026

S M T W T F S
    123
45678910
11 121314151617
18 192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 3rd, 2026 03:40 am
Powered by Dreamwidth Studios