GPT-3는 무엇이며 왜 인공 지능의 모습을 바꾸고 있습니까?

이 분야에는 많은 열정과 과대광고가 있었습니다. 인공 지능 (AI) 최근 개발된 GPT-3라는 기술을 둘러싸고 있습니다. 간단히 말해서 인간 언어나 기계 언어 등 언어 구조로 콘텐츠를 생성하는 데 있어 이전의 모든 것보다 뛰어난 AI입니다.

GPT-3는 다음에 의해 개발되었습니다. OpenAI는 Elon Musk가 공동 설립한 연구 회사로, 수년 만에 인공 지능 분야에서 가장 중요하고 유용한 발전으로 불려 왔습니다.

그러나 이것이 수행하는 작업(그리고 더 중요한 것은 수행하지 않는 작업)에 대해 약간의 혼란이 있으므로 여기에서는 그 뒤에 있는 핵심 원리를 이해하는 데 관심이 있는 비기술적인 독자를 위해 단순화하려고 시도할 것입니다. 또한 그것이 가져오는 몇 가지 문제와 일부 사람들이 그 중요성이 과대광고로 인해 다소 과장되었다고 믿는 이유에 대해서도 논의할 것입니다.

이미지 출처: https://pixabay.com/photos/robot-mech-machine-technology-2301646

GPT-3는 무엇을 할 수 있나요?

GPT-3는 언어 구조를 갖춘 모든 것을 생성할 수 있습니다. 여기에는 질문에 답하기, 에세이 작성, 긴 책 요약, 언어 번역, 메모 작성, 심지어 컴퓨터 코드 작성도 포함됩니다.

사실, 하나의 온라인 프레젠테이션, 다음을 활용하여 Instagram 애플리케이션과 모양과 성능이 유사한 앱을 만드는 방법을 보여줍니다 plugin 널리 알려진 소프트웨어 도구 Figma의 경우.

물론 이것은 매우 새로운 것이며, 장기적으로 유용하고 유익한 것으로 입증된다면 향후 소프트웨어 및 애플리케이션 개발에 중대한 영향을 미칠 수 있습니다.

코드가 아직 공개적으로 사용 가능하지 않기 때문에(나중에 자세히 설명) OpenAI 관리 API를 통해 특정 개발자 그룹으로 액세스가 제한됩니다. 올해 XNUMX월 API가 출시된 이후 시, 산문, 보도, 창작 소설 등의 사례가 등장했습니다.

이 기사는 GPT-3가 해를 끼치지 않는다는 점을 우리 인간에게 확신시키려는 매우 설득력 있는 시도를 보여주기 때문에 특히 흥미롭습니다. 비록 사악한 사람들이 밀어붙이면 “나는 인류의 파멸을 피할 수 없다는 것을 알고 있습니다”라고 고백하게 만드는 로봇 같은 정직함에도 불구하고!

GPT-3는 어떻게 작동하나요?

GPT-3는 AI 애플리케이션의 광범위한 범주 측면에서 언어 예측 모델입니다. 이는 단일 언어 조각(입력)을 가져와 알고리즘이 예측하는 언어 조각이 사용자에게 가장 유익한 언어 조각으로 변환하는 알고리즘 프레임워크라는 것을 의미합니다.

이는 "사전 훈련"에 필요한 엄청난 양의 자료에 대해 광범위한 훈련 분석이 수행되었기 때문에 가능합니다. 훈련되지 않은 다른 알고리즘과 비교할 때 OpenAI는 언어가 작동하고 구성되는 방식을 이해하기 위해 GPT-3에 필요한 엄청난 양의 컴퓨팅 리소스를 이미 확장했습니다. OpenAI에 따르면 이를 달성하는 데 필요한 컴퓨팅 시간은 4.6만 달러입니다.

문장과 같은 언어 구성을 생성하는 방법을 배우기 위해 단어와 그 의미뿐만 아니라 텍스트의 다른 단어에 따라 단어의 사용법이 어떻게 달라지는지에 대한 의미 분석을 사용합니다.

지도 학습처럼 훈련 데이터에는 "올바른" 또는 "잘못된" 응답을 구성하는 정보가 포함되어 있지 않기 때문에 비지도 학습이라고도 합니다. 출력이 사용자의 요구 사항을 충족할 확률을 계산하는 데 필요한 모든 정보는 훈련 텍스트에서 직접 획득됩니다.

이는 단어와 문장의 용법을 분석한 후 이를 해체하고 재구성하는 방식으로 수행됩니다.

예를 들어, 알고리즘은 훈련 중에 "집에 빨간 문이 있습니다"라는 문구를 발견할 수 있습니다. 그런 다음 단어를 생략하고 해당 문구를 다시 제공합니다. 예를 들어 "the home has a red X"입니다.

그런 다음 훈련 데이터(의미 있는 언어로 구성된 수천억 개의 단어)의 텍스트를 검사하고 원래 문구를 재현하는 데 사용할 단어를 선택합니다.

우선, 아마도 수백만 번 정도는 틀릴 것이 거의 확실합니다. 그러나 결국에는 올바른 단어가 나올 것입니다. 결과를 원래 입력 데이터와 비교하여 출력이 올바른지 확인하고 올바른 응답을 생성한 알고리즘 단계에 "가중치"가 부여됩니다. 이는 시간이 지남에 따라 어떤 전략이 미래에 적절한 대응을 할 가능성이 가장 높은지를 "학습"한다는 의미입니다.

이러한 동적 "가중치" 프로세스의 규모는 GPT-3를 세계 최대의 인공 신경망으로 구별하는 요소입니다. 이미 언급한 바와 같이, 언어 예측의 변형 모델이 수년 동안 존재해 왔기 때문에 이것이 달성하는 것은 어떤 면에서는 새로운 것이 아닙니다. 그러나 시스템은 동적으로 저장하고 사용합니다. 175억 무게 각 쿼리를 처리하는 속도는 Nvidia가 구축한 가장 가까운 경쟁업체보다 XNUMX배 더 많습니다.

두 AI가 인간이 되는 것에 대해 이야기합니다. (GPT-3)

GPT-3와 관련된 어려움은 무엇입니까?

GPT-3의 언어 생성 능력은 인공 지능에서 볼 수 있는 것 중 최고로 칭찬을 받았습니다. 그러나 고려해야 할 몇 가지 중요한 사항이 있습니다.

OpenAI의 샘 알트만(Sam Altman) CEO는 “GPT-3의 과대평가는 지나치다”고 말했다. AI는 세상을 근본적으로 변화시킬 것이지만 GPT-3는 단지 일면일 뿐입니다.”

우선, 작업을 수행하는 데 필요한 엄청난 양의 컴퓨팅 성능으로 인해 현재 사용하기에는 매우 비싼 도구입니다. 이는 이를 구현하는 비용이 소규모 기업의 경우 엄청나게 비싸다는 것을 의미합니다.

게다가 폐쇄형 또는 블랙박스 시스템입니다. OpenAI는 알고리즘이 어떻게 작동하는지에 대한 모든 사실을 공개하지 않았기 때문에 쿼리에 응답하거나 귀중한 제품을 만들기 위해 OpenAI에 의존하는 사람은 누구나 알고리즘이 어떻게 생성되었는지 완전히 확신할 수 없습니다.

셋째, 시스템의 출력이 아직 이상적이지 않습니다. 간단한 메시지와 간단한 소프트웨어를 생성할 수 있지만 더 길거나 더 정교한 것을 생성하도록 요청하면 출력이 덜 유용해집니다(실제로 "횡설수설"이라고 설명됨).

컴퓨팅 성능 비용이 지속적으로 하락하고, 개방형 AI 플랫폼을 중심으로 표준화가 구축되고, 더 큰 데이터 볼륨에 맞게 알고리즘이 미세 조정됨에 따라 이러한 문제는 시간이 지나면 해결될 의심할 여지가 없습니다.

전반적으로 GPT-3가 이전에 관찰된 것보다 몇 광년 앞선 결과를 생성한다고 결론을 내리는 것이 합리적입니다. AI 언어의 결과를 본 사람은 누구나 그것이 얼마나 가변적일 수 있는지 이해하며, GPT-3의 출력은 의심할 여지 없이 한발 앞서 있는 것처럼 보입니다.

대중의 손에 적절하게 배치되고 모든 사람이 접근할 수 있게 되면 그 성능은 더욱 향상될 것입니다.

또한 읽기 : 

지텐드라 바스와니
이 작성자는 BloggersIdeas.com에서 확인되었습니다.

Jitendra Vaswani는 디지털 마케팅 실무자이자 전 세계를 여행하면서 디지털 유목민 라이프스타일을 수용한 유명한 국제 기조 연설자입니다. 그는 두 개의 성공적인 웹사이트를 설립했습니다. BloggerIdeas.com & 디지털 마케팅 대행사 DigiExe 그 중 그의 성공 사례는 "Inside A Hustler's Brain: In Pursuit of Financial Freedom"(전 세계적으로 20,000부 판매)을 집필하고 "Growth Hacking Book 2의 국제 베스트셀러 작가"에 기고하는 것으로 확대되었습니다. Jitendra는 대륙 전체에 걸쳐 디지털 마케팅 분야의 10000명 이상의 전문가를 위한 워크숍을 설계했습니다. 궁극적으로 사람들이 온라인에서 꿈의 비즈니스를 구축할 수 있도록 지원함으로써 영향력 있는 변화를 창출하려는 의도를 갖고 있습니다. Jitendra Vaswani는 다음을 포함하는 인상적인 포트폴리오를 갖춘 강력한 투자자입니다. 이미지스테이션. 그의 투자에 대해 더 자세히 알아보려면 다음에서 그를 찾아보세요. 링크드 인, 트위터, & 페이스북.

제휴사 공개: 완전한 투명성 - 당사 웹사이트의 일부 링크는 제휴사 링크입니다. 귀하가 이를 사용하여 구매하면 추가 비용 없이 커미션을 받을 수 있습니다(아무것도 없습니다!).

코멘트 남김