Фактор-2025: Майбутнє війни, дипломатії та технологій: що чекає після дронів, переговорів з Путіним та розвитку штучного інтелекту
Якщо схарактеризувати 2024 рік одним словом у контексті штучного інтелекту, то це слово буде “конкуренція”. Увесь рік ми спостерігали за тим, як різні компанії, зокрема OpenAI, Microsoft, Meta, Google, Anthropic, Amazon та інші, змагались у швидкості виведення на ринок нових технологій та інструментів.
Очевидним наступного року трендом можуть стати моделі з можливістю “міркування”, зокрема нещодавно анонсовані моделі o1-o3 від OpenAI.
Наприклад, у тесті AIME 2024 (American Invitational Mathematics Examination), що використовується для відбору найталановитіших студентів на національну математичну олімпіаду США, модель o3 набрала 96,7%, розв’язавши 14 із 15 задач.
Такий результат зазвичай демонструють лише одиниці студентів, що проходять до елітної групи із 500 найкращих. Для порівняння, модель o1 отримала 83,3%, а її версія o1 preview (випущена у вересні) — лише 56,7%.
У складних міждисциплінарних тестах GPQA Diamond для кандидатів технічних наук модель o3 досягла 87,7%, перевершивши середній показник людей-експертів (69,7 – 81,3%). У тестах із програмування, як-от SWE-bench Verified, o3 показала результат 71,7%, що суттєво перевищує попередніх лідерів: Claude 3 Opus (22,2%) і Claude 3.5 Sonnet (49%). На платформі Codeforces модель o3 отримала рейтинг 2727 балів, суттєво випередивши o1 (1891) та o1-preview (1258).
Такий прогрес став можливим завдяки унікальній кадровій стратегії OpenAI, яка залучає провідних фахівців: середня компенсація програмістів компанії становить $821 000 на рік, що значно перевищує середню винагороду в США, забезпечуючи співпрацю лише з найкращими професіоналами. За словами OpenAI, навіть серед цих програмістів лише декілька осіб досягають результатів, вищих за o3 у тестах Codeforces.
Наступний очікуваний тренд — це автономні агенти, здатні виконувати складні завдання без втручання людини. Такі системи, інтегровані з передовими моделями генеративного штучного інтелекту, можуть самостійно аналізувати дані, ухвалювати рішення та виконувати інші завдання.
Їх потенціал виходить за межі традиційної “контрольованої” автоматизації, оскільки автономні агенти здатні адаптуватися до нових умов, інтегрувати знання з різних сфер і взаємодіяти між собою. Це відкриває нові можливості для бізнесу, зокрема в управлінні ланцюгами постачання, автоматизації клієнтського обслуговування, оптимізації процесів у виробництві та фінансах тощо.
Крім позитивного ефекту не потрібно забувати про негативний вплив, зокрема використання ШІ для генерації фейків, маніпуляцій, а також негативні наслідки через некоректне або некероване використання технологій. Таким чином, суттєві зміни стосуватимуться регулювання ШІ, впровадження принципів відповідального ШІ (Responsible AI), а також вдосконалення технологій задля виявлення та мінімізації ефекту “галюцинування”.
Справжнім геймчейнджером у сфері штучного інтелекту можуть стати спеціалізовані чипи для навчання моделей та квантові технології, які здатні забезпечити значне підвищення швидкості обчислень і зниження енергоспоживання.
Нещодавно анонсований квантовий процесор Google Willow, за словами компанії, демонструє потенціал виконувати завдання за хвилини, на які суперкомп’ютерам знадобляться тисячі років, проте залишається відкритим питання, коли ці технології стануть масово доступними та справді революціонізують наше життя.
Розробки Microsoft у співпраці з Quantinuum, спрямовані на створення високонадійних логічних кубітів, і новий 133-кубітний процесор Heron від IBM, який покращує стабільність і точність кубітів, демонструють значний прогрес у квантових обчисленнях.
Враховуючи прогрес, усе частіше лунають думки про можливість створення загального штучного інтелекту, який вже починає виглядати не такою далекою перспективою. Однак масове впровадження подібних технологій, найімовірніше, буде поступовим та ітераційним через низку причин, включно з бюрократичними, юридичними, соціальними та регуляторними обмеженнями.
Це дозволить не лише уникнути потенційних ризиків і неконтрольованих наслідків, але й мінімізувати руйнівний вплив на окремі галузі економіки та соціально незахищені верстви населення.