Какво е GPT-3 и защо променя лицето на изкуствения интелект?

Последна актуализация на: Септември 24, 2023 by Джитендра Васвани

Актуализирано на: 24 септември 2023 г.

Имаше много ентусиазъм и шум в сферата на изкуствен интелект (AI), заобикаляща наскоро създадена технология, наречена GPT-3. Просто казано, това е AI, който превъзхожда всичко, което е било преди него, при създаването на съдържание с езикова структура – човешки или машинен език.

GPT-3 е разработен от OpenAI, изследователска компания, съосновател на Елон Мъск, и е наречена за най-значимия и използваем напредък в изкуствения интелект от години.

Въпреки това, има известно объркване относно това какво прави (и, по-важното, какво не прави), така че тук ще се опитам да го опростя за всички нетехнически читатели, които се интересуват от разбирането на основните принципи зад него. Ще обсъдя също някои от проблемите, които носи, както и защо някои смятат, че значението му е донякъде преувеличено от шума.

Кредити на изображения: https://pixabay.com/photos/robot-mech-machine-technology-2301646

Съдържание

На какво е способен GPT-3?

GPT-3 е в състояние да произведе всичко с езикова структура - това включва отговаряне на въпроси, писане на есета, обобщаване на дълги книги, превод на езици, водене на бележки и дори писане на компютърен код.

Наистина, в една онлайн презентация, се демонстрира как да се създаде приложение, което изглежда и работи подобно на приложението Instagram, като се използва plugin за широко известния софтуерен инструмент Figma.

Това, разбира се, е доста ново и ако се окаже използваемо и полезно в дългосрочен план, може да има дълбоки последици за бъдещото развитие на софтуер и приложения.

Поради факта, че кодът все още не е публично достъпен (повече за това по-късно), достъпът е ограничен до избрана група разработчици чрез API, управляван от OpenAI. След пускането на API през юни тази година се появиха примери на поезия, проза, новинарски репортажи и творческа фантастика.

Тази статия е особено интересна, защото показва, че GPT-3 се опитва – доста убедително – да убеди нас, хората, че не вреди. Въпреки че роботизираната му честност го принуждава да признае, че „аз съм наясно, че няма да съм в състояние да избегна унищожаването на човечеството“, ако нечестивите хора го накарат!

Как функционира GPT-3?

GPT-3 е модел за прогнозиране на езика по отношение на широките категории приложения за изкуствен интелект. Това означава, че това е алгоритмична рамка, която приема единичен език (вход) и го трансформира в това, което алгоритъмът предвижда, че ще бъде най-полезната част от езика за потребителя.

Това е възможно благодарение на обширния анализ на обучението, извършен върху огромното количество материал, необходим за „предварителното му обучение“. В сравнение с други алгоритми, които не са били обучени, OpenAI вече изразходва огромното количество изчислителни ресурси, необходими за GPT-3, за да разбере как работят и се изграждат езиците. Според OpenAI, времето за изчисление, необходимо за постигане на това, струва 4.6 милиона долара.

За да научи как да генерира езикови конструкции като изречения, той използва семантична аналитика – не само думите и техните значения, но и как употребата на думите варира в зависимост от другите думи в текста.

Нарича се още учене без надзор, тъй като данните за обучението не включват никаква информация за това какво представлява „правилен“ или „грешен“ отговор, както прави контролираното обучение. Цялата информация, необходима за изчисляване на вероятността изходът да удовлетвори изискванията на потребителя, се получава директно от учебните текстове.

Това се постига чрез анализиране на употребата на думи и изречения, след което ги демонтира и се опитва да ги реконструира.

Например, алгоритмите могат да се натъкнат на фразата „домът има червена врата“ по време на обучение. След това отново се дава фразата с пропускане на дума – например „домът има червен X“.

След това той разглежда текста в своите обучителни данни – стотици милиарди думи, организирани на смислен език – и избира коя дума трябва да се използва за възпроизвеждане на оригиналната фраза.

Като начало, почти сигурно е да се объркате - може би милиони пъти. В крайна сметка обаче ще излезе с правилната дума. Чрез сравняване на резултата с оригиналните входни данни, той определя дали изходът е правилен и се присъжда „тежест“ на стъпката на алгоритъма, която е произвела правилния отговор. Това означава, че той „научава“ с течение на времето кои стратегии е най-вероятно да произведат правилния отговор в бъдеще.

Големината на този динамичен процес на „претегляне“ е това, което отличава GPT-3 като най-голямата изкуствена невронна мрежа в света. Както беше отбелязано, това, което постига, не е ново в някои отношения, тъй като трансформиращите модели на езиково прогнозиране съществуват от много години. Въпреки това, системата динамично съхранява и използва 175 милиарда тегла за обработка на всяка заявка — десет пъти повече от най-близкия си конкурент, създаден от Nvidia.

Два AI говорят за това да станем хора. (GPT-3)

Какви са някои от трудностите, свързани с GPT-3?

Способността на GPT-3 да генерира език е възхвалявана като най-добрата досега наблюдавана в изкуствения интелект; обаче има някои критични точки, които трябва да се вземат предвид.

Сам Алтман, главен изпълнителен директор на OpenAI, заяви: „Въздушието на GPT-3 е прекомерно“. AI ще промени фундаментално света, но GPT-3 е само един поглед."

Като начало, това е изключително скъп инструмент за използване в момента, поради огромното количество изчислителна мощност, необходима за изпълнение на работата му. Това означава, че разходите за прилагането му биха били непосилно скъпи за по-малките предприятия.

Освен това, това е затворена или черна кутия. Тъй като OpenAI не е разкрил всички факти за това как функционират неговите алгоритми, всеки, който зависи от него, за да отговори на запитвания или да създаде ценни продукти, няма да е напълно сигурен как са създадени.

Трето, изходът на системата все още не е идеален. Въпреки че е в състояние да произвежда кратки съобщения и прост софтуер, изходът му става по-малко полезен (всъщност той се описва като „безумие“), когато бъде поискано да създаде нещо по-дълго или по-сложно.

Това несъмнено са притеснения, които ще бъдат решени с течение на времето - тъй като цената на изчислителната мощност продължава да пада, се изгражда стандартизация около отворените AI платформи и алгоритмите се настройват фино с по-големи обеми данни.

Като цяло е разумно да се заключи, че GPT-3 генерира открития, които са светлинни години пред всичко, наблюдавано по-рано. Всеки, който е видял резултатите от езика на AI, разбира колко променливи могат да бъдат те и резултатите на GPT-3 несъмнено изглеждат крачка напред.

Когато го видим правилно поставен в ръцете на обществеността и достъпен за всички, неговото представяне трябва да се подобри още повече.

Също прочетено:

Джитендра Васвани

Jitendra Vaswani е практикуващ дигитален маркетинг и известен международен основен лектор, който е прегърнал начина на живот на дигиталните номади, докато пътува по света. Той основа два успешни уебсайта, BloggersIdeas.com & Агенция за дигитален маркетинг DigiExe от които неговите истории за успех се разшириха до авторството на „Inside A Hustler's Brain: In Pursuit of Financial Freedom” (20,000 2 копия, продадени по целия свят) и принос към „Международен бестселър автор на Growth Hacking Book 10000”. Jitendra разработи семинари за над XNUMX XNUMX+ професионалисти в дигиталния маркетинг на различни континенти; с намерения, в крайна сметка закотвени към създаване на въздействаща разлика, като помагат на хората да изградят мечтания си бизнес онлайн. Jitendra Vaswani е мощен инвеститор с впечатляващо портфолио, което включва Imagestation. За да научите повече за неговите инвестиции, Намерете го на Linkedin, Twitter, & Facebook.

Разкриване на филиал: При пълна прозрачност – някои от връзките на нашия уебсайт са партньорски връзки, ако ги използвате, за да направите покупка, ние ще спечелим комисионна без допълнителни разходи за вас (никакви!).

Оставете коментар