ElevenLabs , вирусната базирана на AI платформа за създаване на синтетични гласове, днес стартира своята платформа от бета версия с поддръжка на повече от 30 езика.
Използвайки нов AI модел, разработен вътрешно, ElevenLabs казва, че неговите инструменти вече са в състояние автоматично да идентифицират езици, включително корейски, холандски и виетнамски, и да генерират емоционално богата реч на тези езици.
В комбинация с новия модел, клиентите на ElevenLabs могат да използват инструмента за гласово клониране на платформата, за да говорят на почти 30 езика, без първо да се налага да въвеждат текст.
messagebird
ElevenLabs стартира с мечтата да направи цялото съдържание универсално достъпно на всеки език и с всеки глас, каза в изявление главният изпълнителен директор и съосновател на ElevenLabs Мати Станишевски. С тази версия ние сме една стъпка по-близо до това да превърнем тази мечта в реалност и да направим AI гласове с човешко качество налични на всеки диалект. Нашите инструменти за генериране на текст към говор помагат за изравняване на игралното поле и предоставят висококачествени говорими аудио възможности на всички създатели там.
Основана от Staniszewski, който преди това е работил в Palantir, и неговия приятел от детството Piotr Dabkowski, бивш служител на Google, ElevenLabs направи заглавия през последните няколко месеца поради причини, както добре и отвратителен . Вдъхновени от посредствения дублаж на американски филми, които Станишевски и Дабковски гледаха да растат в Полша, двамата се заеха да проектират платформа, която може да се справи по-добре – разбира се, използвайки AI.
ElevenLabs стартира в бета версия в края на януари и набра скорост доста бързо — благодарение на високото качество на генерираните гласове и щедрото безплатно ниво. Но както споменахме по-рано, публичността не е постоянно положителна – особено след като лоши актьори експлоатират платформата за собствените си цели.
Скандалното табло за съобщения 4chan, известно с конспиративното си съдържание, използвани Инструментите на ElevenLabs за споделяне на омразни съобщения, имитиращи знаменитости като актьора Ема Уотсън. На друго място, Джеймс Винсент от The Verge успя да докосне ElevenLabs, за да клонира гласовете на мишените за секунди, генериране аудио проби, съдържащи всичко - от заплахи за насилие до изрази на расизъм и трансфобия.
В отговор ElevenLabs каза, че ще въведе набор от нови предпазни мерки, като ограничаване на клонирането на глас до платени акаунти и предоставяне на нов инструмент за откриване на AI.
ElevenLabs обаче тепърва ще се бори с другото противоречие, което назрява около нейната платформа и други платформи като нея: тяхната заплаха за индустрията за гласови актьори.
Дънна платка пише за това как от гласовите актьори все повече се иска да подписват права върху гласовете си, така че клиентите да могат да използват AI за генериране на синтетични версии, които в крайна сметка биха могли да ги заменят. Междувременно вътрешни имейли видяно от The New York Times показват, че Activision Blizzard, един от най-големите издатели на игри в света, работи върху инструменти за клониране на глас с помощта на AI.
Изглежда, че ElevenLabs вижда това като естествено развитие на нещата, рекламирайки работата си с издатели като Storytel; медийни платформи като TheSoul Publishing и MNTN за аудиокниги и радио съдържание; и издатели като Embark Studios и Paradox Interactive за видео игри (Storytel и TheSoul Publishing са стратегически инвеститори). Компанията твърди, че има повече от един милион регистрирани потребители в творческите, развлекателните и издателските пространства, които са създали аудио съдържание за 10 години.
харесва ти
ElevenLabs, която наскоро събра 19 милиона долара от инвеститори, включително Andreessen Horowitz и съоснователя на DeepMind Мустафа Сюлейман при оценка от 99 долара, планира в крайна сметка да разшири своите AI модели до гласов дублаж – следвайки стъпките на стартиращи фирми като Papercup и Deepdub и изграждайки това, което нарича основа, за да може да прехвърля емоции и интонация от един език на друг.
Отвъд това, ElevenLabs го казвапланира да въведе механизъм, който ще позволи на потребителите да споделят гласове в платформата, въпреки че подробностите остават неясни.