Що таке GPT-3 і чому він змінює обличчя штучного інтелекту?

Було багато ентузіазму та галасу у сфері штучний інтелект (AI), що оточує нещодавно створену технологію під назвою GPT-3. Простіше кажучи, це штучний інтелект, який перевершує все, що було раніше, у створенні контенту з мовною структурою – людською або машинною мовою.

GPT-3 розроблено OpenAI, дослідницька компанія, співзасновником якої є Ілон Маск, і була названа найбільш значущим і корисним досягненням у сфері штучного інтелекту за останні роки.

Однак існує деяка плутанина щодо того, що він робить (і, що ще важливіше, чого він не робить), тому тут я спробую спростити його для будь-яких нетехнічних читачів, зацікавлених у розумінні основних принципів, які стоять за ним. Я також обговорю деякі проблеми, які він викликає, а також те, чому деякі вважають, що його важливість була дещо перебільшена галасом.

Автори зображень: https://pixabay.com/photos/robot-mech-machine-technology-2301646

На що здатний GPT-3?

GPT-3 здатний створювати будь-що з мовною структурою — це включає відповіді на запитання, написання есе, узагальнення великих книг, переклади мов, створення нотаток і навіть написання комп’ютерного коду.

Справді, в одна онлайн-презентаціядемонструється, як створити програму, яка виглядає та працює подібно до програми Instagram, використовуючи plugin для широко відомого програмного засобу Figma.

Це, звичайно, досить нове, і якщо воно виявиться корисним і корисним у довгостроковій перспективі, це може мати глибокі наслідки для майбутнього розвитку програмного забезпечення та додатків.

Через те, що код поки не є загальнодоступним (докладніше про це пізніше), доступ обмежено певною групою розробників через API, керований OpenAI. З моменту випуску API у червні цього року з’явилися екземпляри поезії, прози, репортажів у новинах та художньої літератури.

Ця стаття особливо цікава, оскільки в ній показано, що GPT-3 намагається – досить переконливо – переконати нас, людей, що він не шкодить. Хоча його робототехнічна чесність змушує його зізнатися, що «я усвідомлюю, що не зможу уникнути знищення людства», якщо до цього підштовхнуть злі люди!

Як функціонує GPT-3?

GPT-3 — це модель прогнозування мови з точки зору широких категорій додатків AI. Це означає, що це алгоритмічна структура, яка приймає один фрагмент мови (вхід) і перетворює його на те, що алгоритм передбачає, що буде найбільш корисним для користувача.

Це стало можливим завдяки обширному навчальному аналізу, проведеному на величезній кількості матеріалу, необхідного для «попереднього навчання». У порівнянні з іншими алгоритмами, які не були навчені, OpenAI вже витратив величезну кількість обчислювальних ресурсів, необхідних для GPT-3, щоб зрозуміти, як працюють і будуються мови. За даними OpenAI, час обчислень, необхідний для цього, коштував 4.6 мільйона доларів.

Щоб навчитися створювати мовні конструкції, такі як речення, він використовує семантичну аналітику – не лише слова та їх значення, а й те, як використання слів змінюється залежно від інших слів у тексті.

Його також називають навчанням без нагляду, оскільки навчальні дані не містять жодної інформації про те, що є «правильною» чи «неправильною» відповіддю, як це робить навчання під керівництвом. Вся інформація, необхідна для обчислення ймовірності того, що результат задовольнить вимоги користувача, отримується безпосередньо з навчальних текстів.

Це досягається шляхом аналізу використання слів і речень, а потім їх розбирання та спроб відновити.

Наприклад, під час навчання алгоритми можуть зустріти фразу «в будинку червоні двері». Потім знову дається фраза з пропуском слова – наприклад, «у будинку червоний X».

Потім він досліджує текст у своїх навчальних даних – сотні мільярдів слів, організованих змістовною мовою – і вибирає, яке слово слід використати для відтворення оригінальної фрази.

Для початку майже напевно помилитеся — можливо, мільйони разів. Проте в кінцевому підсумку він знайде правильне слово. Порівнюючи результат з вихідними вхідними даними, він визначає, чи правильний результат, і «вага» присуджується кроку алгоритму, який дав правильну відповідь. Це означає, що з часом він «вчиться», які стратегії найімовірніше дадуть належну відповідь у майбутньому.

Масштаб цього динамічного процесу «зважування» – це те, що відрізняє GPT-3 як найбільшу в світі штучну нейронну мережу. Як зазначалося, досягнутого не є чимось новим, оскільки трансформаційні моделі прогнозування мови існують протягом багатьох років. Проте система динамічно зберігає та використовує 175 мільярдів ваг для обробки кожного запиту — в десять разів більше, ніж у найближчого конкурента, створеного Nvidia.

Два ШІ говорять про те, щоб стати людьми. (GPT-3)

Які труднощі пов’язані з GPT-3?

Здатність GPT-3 генерувати мову була оцінена як найкраща з тих, що досі спостерігали у штучному інтелекті; однак є певні критичні моменти, які слід враховувати.

Сем Альтман, генеральний директор OpenAI, заявив: «Хайп GPT-3 надмірний». ШІ кардинально змінить світ, але GPT-3 – це лише проблиск».

По-перше, це надзвичайно дорогий інструмент для використання на даний момент через величезну кількість обчислювальної потужності, необхідної для виконання своєї роботи. Це означає, що витрати на його впровадження були б непомірно дорогими для невеликих підприємств.

Крім того, це закрита система або система чорного ящика. Оскільки OpenAI не розкрив усі факти того, як функціонують його алгоритми, будь-хто, хто залежить від нього, відповідаючи на запити або створюючи цінні продукти, не міг би бути повністю впевненим, як вони були створені.

По-третє, вихід системи ще не ідеальний. Незважаючи на те, що він здатний створювати короткі повідомлення та просте програмне забезпечення, його вихід стає менш корисним (насправді, він описується як «тарабарщина»), коли його просять створити щось довше або більш складне.

Це, безсумнівно, проблеми, які з часом будуть вирішені — оскільки вартість обчислювальної потужності продовжує падати, розбудовується стандартизація навколо відкритих платформ ШІ, а алгоритми точно налаштовуються на більших обсягах даних.

Загалом, розумно зробити висновок, що GPT-3 дає результати, які на світлові роки випереджають все, що спостерігалося раніше. Кожен, хто бачив результати мови AI, розуміє, наскільки вони можуть бути змінними, і результати GPT-3, безсумнівно, виходять на крок попереду.

Коли ми бачимо, що його належним чином передано в руки громадськості та доступне для всіх, його ефективність має покращитися ще більше.

Також читайте: 

Джитендра Васвані
Цей автор підтверджено на BloggersIdeas.com

Jitendra Vaswani – практикуючий спеціаліст із цифрового маркетингу та відомий міжнародний основний доповідач, який прийняв спосіб життя цифрового кочівника, подорожуючи по всьому світу. Він заснував два успішних веб-сайти, BloggersIdeas.com & Агентство цифрового маркетингу DigiExe з яких його історії успіху розширилися до авторства «Inside A Hustler's Brain: In Pursuit of Financial Freedom» (20,000 2 примірників, проданих по всьому світу) і внеску в «Автор міжнародного бестселера Growth Hacking Book 10000». Jitendra розробив семінари для понад XNUMX XNUMX професіоналів із цифрового маркетингу на різних континентах; з намірами, зрештою, спрямованими на створення помітних змін, допомагаючи людям будувати бізнес їхньої мрії в Інтернеті. Джітендра Васвані — потужний інвестор із вражаючим портфелем, який включає Imagestation. Щоб дізнатися більше про його інвестиції, знайдіть його на Linkedin, Twitter, & Facebook.

Розкриття інформації партнера: У повній прозорості - деякі посилання на нашому веб-сайті є афілійованими, якщо ви використовуєте їх для здійснення покупки, ми заробимо комісію без додаткових витрат для вас (жодної!).

Залишити коментар