Nézze meg, és sírjon (vagy mosolyogjon): A Synthesia mesterséges intelligencia-videoavatarjai immár érzelmeket is tartalmaznak

Nézze meg, és sírjon (vagy mosolyogjon): A Synthesia mesterséges intelligencia-videoavatarjai immár érzelmeket is tartalmaznak

A generatív mesterséges intelligencia megragadta a közvélemény fantáziáját, és verbális felszólításokból kidolgozott, hihetően valós szövegeket és képeket hoz létre. De a bökkenő – és gyakran van egy bökkenő – az, hogy az eredmények gyakran távolról sem tökéletesek, ha kicsit közelebbről megnézzük.

Az emberek rámutatnak furcsa ujjak , padlólapok elcsúszik és matematikai feladatok pontosan ezek: problémás, hogy néha nem adnak össze.



A Synthesia – az egyik ambiciózus, videóban dolgozó AI startup – kifejezetten egyéni avatarok, amelyeket üzleti felhasználóknak terveztek promóciós, képzési és egyéb vállalati videotartalmak létrehozására – kiad egy frissítést, amely reményei szerint segít átugrani néhány kihívást. adott területen. Legújabb verziója avatarokat tartalmaz – a stúdiójukban rögzített tényleges emberek alapján –, amelyek több érzelmet, jobb ajkak követését és kifejezőbb természetes és emberi mozdulatokat biztosítanak, amikor szöveget táplálnak be videók létrehozásához.



A kiadás a cég eddigi lenyűgöző fejlődésének nyomán jött létre. Ellentétben más generatív mesterséges intelligencia-játékosokkal, mint például az OpenAI, amely kétirányú stratégiát épített fel – a nagyközönség tudatosságának felkeltése olyan fogyasztói eszközökkel, mint a ChatGPT, miközben B2B-kínálatot is kiépít, amelynek API-it független fejlesztők és óriásvállalatok is használják –, a Synthesia hajlik. abba a megközelítésbe, amelyet néhány más prominens AI startup alkalmaz.

Hasonló A zavarodottság a generatív mesterséges intelligencia keresésre összpontosít, a Synthesia pedig arra összpontosít, hogyan készítse el a lehető legemberibb generatív videó avatarokat. Pontosabban, erre törekszik csak üzleti piacra és olyan felhasználási esetekre, mint a képzés és a marketing.



Ez a hangsúly segített a Synthesiának kitűnni a nagyon zsúfolt mesterségesintelligencia-piacon, ahol fennáll annak a veszélye, hogy áruvá válik, amikor a hírverés olyan hosszú távú problémákba rendeződik, mint az ARR, az egységgazdaságosság és a mesterséges intelligencia megvalósításához kapcsolódó működési költségek.

A Synthesia a csütörtökön megjelenő új Expressive Avatarok leírása szerint az első a maga nemében: a világ első, teljesen mesterséges intelligenciával generált avatarja. A nagyméretű, előképzett modellekre épülő Synthesia azt állítja, hogy áttörése az volt, hogy hogyan kombinálják ezeket a multimodális eloszlásokat, amelyek jobban utánozzák az emberek beszédét.

Ezek menet közben jönnek létre, mondja Synthesia, ami azt a célt szolgálja, hogy közelebb álljon ahhoz a tapasztalathoz, amit átélünk, amikor beszélünk vagy reagálunk az életben. Ez ellentétben áll azzal, ahogy manapság sok, az avatarokon alapuló AI-videóeszköz működik: ezek általában sok videódarab, amelyeket gyorsan összeillesztve olyan arcreakciókat hoznak létre, amelyek többé-kevésbé összhangban vannak a bevitt szkriptekkel. őket. A cél az, hogy kevésbé robotikusnak és élethűbbnek tűnjön.



Előző verzió:

Új verzió:

Amint az a két példában látható, az egyik a Synthesia régebbi verziójából és a csütörtökön megjelenő, még mindig van mit tenni, amit maga Victor Riparbelli vezérigazgató is elismer.

Természetesen még nem 100%, de nagyon-nagyon hamarosan, az év végére. Annyira észbontó lesz, mondta a Gadget Insidernek. Azt hiszem, azt is láthatja, hogy ennek az AI része nagyon finom. Az embereknél rengeteg információ rejlik a legapróbb részletekben, az arcizmok legapróbb mozgásaiban is. Azt hiszem, soha nem tudnánk leülni és leírni: 'Igen, így mosolyogsz, amikor boldog vagy, de ez hamis, nem igaz?' mély tanulási hálózatok. Valójában képesek kitalálni a mintát, majd kiszámítható módon megismételni. Hozzátette, a következő, amin dolgozik, a kezek.

A kezek nagyon kemények, mondta.

A B2B-re való összpontosítás abban is segít, hogy a Synthesia jobban rögzítse üzeneteit és termékeit a biztonságos mesterséges intelligencia használatához. Ez alapvető fontosságú, különösen a mai hamisítások és a mesterséges intelligencia rosszindulatú célokra, például félretájékoztatás és csalás miatti óriási aggodalma miatt. Ennek ellenére a Synthesia-nak nem sikerült teljesen elkerülnie a vitákat ezen a fronton. A Synthesia technológiája korábban volt dolgokat propagandát gyártani Venezuelában és hamis Kína-barát közösségi média fiókok által népszerűsített híradások.

A vállalat megjegyezte, hogy további lépéseket tett a használat lezárására. Múlt hónap , frissítette irányelveit, hogy korlátozza az emberek által készíthető tartalom típusát, befektetve a rosszhiszemű szereplők korai felismerésébe, növelve a mesterséges intelligencia biztonságán dolgozó csapatokat, és kísérletezve a tartalom hitelesítési technológiákkal, például a C2PA-val.

A kihívások ellenére a cég tovább fejlődött.

vegas twitchcon

A Synthesia értéke legutóbb 1 milliárd dollár volt, amikor 90 millió dollárt gyűjtött. Nevezetesen, hogy az adománygyűjtés majdnem egy éve, 2023 júniusában történt.

Riparbelli a hónap elején egy interjúban elmondta, hogy jelenleg nem terveznek több emelést, bár ez nem igazán ad választ arra a kérdésre, hogy a Synthesia-t proaktívan megkeresik-e. (Megjegyzés: Nagyon izgatottak vagyunk, hogy a tényleges emberi Riparbelli felszólal egy májusi londoni rendezvényünkön, ahol minden bizonnyal újra fel fogok kérdezni erről. Kérem, jöjjön el, ha a városban tartózkodik.)

Amit biztosan tudunk, az az, hogy az AI felépítése és működtetése sok pénzbe kerül, a Synthesia pedig sokat épít és fut.

A csütörtöki verzió megjelenése előtt mintegy 200 000 ember több mint 18 millió videoprezentációt készített mintegy 130 nyelven a Synthesia 225 örökölt avatarja segítségével. (Nem derül ki, hogy hány felhasználó van a fizetős szintjein, de sok nagynevű ügyfél van, köztük a Zoom, a BBC, a DuPont és még sok más, és a vállalatok fizetnek.) Az induló vállalkozás reménye természetesen az, hogy az új verzió kiszorításával ezek a számok még jobban növekedni fognak.