Купил себе платный сабж. Думал, поиграюсь месяц и ладно. С версией 4 у меня был неудачный опыт.
И вот теперь я в шоке уже два дня. Машинка работает на уровне умного постдока. Причем с образованием во всех областях математики сразу. И раз в двадцать быстрее человека. Не знаю, радоваться или ужасаться.
И вот теперь я в шоке уже два дня. Машинка работает на уровне умного постдока. Причем с образованием во всех областях математики сразу. И раз в двадцать быстрее человека. Не знаю, радоваться или ужасаться.
(no subject)
Date: 2025-08-28 06:38 am (UTC)(no subject)
Date: 2025-08-28 06:31 pm (UTC)(no subject)
Date: 2025-08-29 01:14 am (UTC)(no subject)
Date: 2025-08-29 02:48 am (UTC)Вообще говоря, прогресс более-менее описывается кривой на первой картинке здесь:
https://evaluations.metr.org/gpt-5-report/
Так что, разница с исходной 4 в марте 2023-го огромна, а разница с o3 довольно заметна, но не супер значительна. Тем ни менее, похоже, что в сложных проектах на грани возможного сегодня, даже и разница с o3 довольно заметна, вот довольно типичный report, который очень сильно отличается от того, что было возможно с o3 для проектов этой сложности (advanced non-standard virtual machine and compiler), хотя до идеала там ещё очень, очень далеко (a neutral report, "some people on both sides of this debate will be upset"):
https://x.com/VictorTaelin/status/1960345221012619469
(no subject)
Date: 2025-08-29 05:36 am (UTC)Задачка в которой она прокололась была такая.
Let T(u)=u^2+u+u^{-1}+u^{-2} be a polynomial with coefficients in the field with two elements. Consider the equation x^2+xT+1=0. Does it have a solution in the ring of Laurent series with coefficients in the same field?
(no subject)
Date: 2025-08-29 05:37 am (UTC)(no subject)
Date: 2025-08-29 06:32 am (UTC)