OpenAI днес обяви общата наличност на GPT-4, неговия най-нов модел за генериране на текст, чрез неговия API.
От този следобед всички съществуващи OpenAI API разработчици с история на успешни плащания имат достъп до GPT-4. Компанията планира да отвори достъп за нови разработчици до края на този месец и след това да започне да повишава лимитите за наличност след това в зависимост от наличността на компютъра.
Милиони разработчици са поискали достъп до GPT-4 API от март насам и гамата от иновативни продукти, използващи GPT-4, нараства всеки ден, пише OpenAI в блог пост . Ние си представяме бъдеще, в което базираните на чат модели могат да поддържат всеки случай на употреба.
chromecast близо до мен
GPT-4 може да генерира текст (включително код) и да приема въвеждане на изображения и текст – подобрение спрямо GPT-3.5, неговия предшественик, който приемаше само текст – и се представя на човешко ниво при различни професионални и академични показатели. Подобно на предишните GPT модели от OpenAI, GPT-4 беше обучен с помощта на публично достъпни данни, включително от публични уеб страници, както и данни, лицензирани от OpenAI.
Възможността за разбиране на изображения все още не е достъпна за всички клиенти на OpenAI. OpenAI го тества с един единствен партньор, Be My Eyes, за начало. Но не е посочено кога ще го отвори за по-широка клиентска база.
Струва си да се отбележи, че както и при най-добрите генеративни AI модели днес, GPT-4 не е перфектен. Халюцинира факти и прави грешки в разсъжденията, понякога с увереност. И не се учи от опита си, като се проваля при тежки проблеми като въвеждане на уязвимости в сигурността в кода, който генерира.
В бъдеще OpenAI казва, че ще позволи на разработчиците да прецизират GPT-4 и GPT-3.5 Turbo, един от другите скорошни, но по-малко способни модели за генериране на текст (и един от оригиналните модели, захранващи ChatGPT), с техните собствени данни, както отдавна е възможно с няколко други модели за генериране на текст на OpenAI. Тази възможност трябва да се появи по-късно тази година, според OpenAI.
От разкриването на GPT-4 през март конкуренцията за генериране на AI стана по-ожесточена. Наскоро Anthropic разшири прозореца на контекста за Claude – неговият водещ AI модел за генериране на текст, все още в предварителен преглед – от 9 000 токена на 100 000 токена. (Прозорецът на контекста се отнася до текста, който моделът разглежда, преди да генерира допълнителен текст, докато токените представляват необработен текст — например думата фантастично ще бъде разделена на токените fan, tas и tic.)
GPT-4 държеше предишната корона по отношение на прозореца на контекста, с тегло от 32 000 токена във високия клас. Най-общо казано, моделите с малки контекстни прозорци са склонни да забравят съдържанието дори на много скорошни разговори, което ги кара да се отклоняват от темата.
В свързано съобщение днес OpenAI каза, че прави своите DALL-E 2 и Whisper API общодостъпни – DALL-E 2 е моделът за генериране на изображения на OpenAI, а Whisper се отнася до модела на компанията за преобразуване на реч в текст. Компанията същоказа, че планира да отмени старите модели, достъпни чрез своя API, за да оптимизира [своя] изчислителен капацитет. (През последните няколко месеца, до голяма степен благодарение на експлозивната популярност на ChatGPT, OpenAI направи мъчеше за да бъде в крак с търсенето на своите генеративни модели.)
От 4 януари 2024 г. определени по-стари модели OpenAI — по-специално GPT-3 и неговите производни — вече няма да бъдат налични и ще бъдат заменени с нови базови модели GPT-3, които биха се предположили, че са по-ефективни при изчисленията.Разработчиците, използващи старите модели, ще трябва ръчно да надстроят своите интеграции до 4 януари, а тези, които желаят да продължат да използват фино настроени стари модели след 4 януари, ще трябва да настроят фино замени върху новите базови модели GPT-3.
Ние ще предоставим поддръжка на потребители, които преди това са прецизирали модели, за да направят този преход възможно най-плавен, пише OpenAI. През следващите седмици ще се свържем с разработчици, които наскоро са използвали тези по-стари модели, и ще предоставим повече информация, след като новите модели за завършване са готови за ранно тестване.