A generatív mesterséges intelligencia megragadta a közvélemény fantáziáját, és verbális felszólításokból kidolgozott, hihetően valós szövegeket és képeket hoz létre. De a bökkenő – és gyakran van egy bökkenő – az, hogy az eredmények gyakran távolról sem tökéletesek, ha kicsit közelebbről megnézzük.
Az emberek rámutatnak furcsa ujjak , padlólapok elcsúszik és matematikai feladatok pontosan ezek: problémás, hogy néha nem adnak össze.
A Synthesia – az egyik ambiciózus, videóban dolgozó AI startup – kifejezetten egyéni avatarok, amelyeket üzleti felhasználóknak terveztek promóciós, képzési és egyéb vállalati videotartalmak létrehozására – kiad egy frissítést, amely reményei szerint segít átugrani néhány kihívást. adott területen. Legújabb verziója avatarokat tartalmaz – a stúdiójukban rögzített tényleges emberek alapján –, amelyek több érzelmet, jobb ajkak követését és kifejezőbb természetes és emberi mozdulatokat biztosítanak, amikor szöveget táplálnak be videók létrehozásához.
A kiadás a cég eddigi lenyűgöző fejlődésének nyomán jött létre. Ellentétben más generatív mesterséges intelligencia-játékosokkal, mint például az OpenAI, amely kétirányú stratégiát épített fel – a nagyközönség tudatosságának felkeltése olyan fogyasztói eszközökkel, mint a ChatGPT, miközben B2B-kínálatot is kiépít, amelynek API-it független fejlesztők és óriásvállalatok is használják –, a Synthesia hajlik. abba a megközelítésbe, amelyet néhány más prominens AI startup alkalmaz.
Hasonló A zavarodottság a generatív mesterséges intelligencia keresésre összpontosít, a Synthesia pedig arra összpontosít, hogyan készítse el a lehető legemberibb generatív videó avatarokat. Pontosabban, erre törekszik csak üzleti piacra és olyan felhasználási esetekre, mint a képzés és a marketing.
Ez a hangsúly segített a Synthesiának kitűnni a nagyon zsúfolt mesterségesintelligencia-piacon, ahol fennáll annak a veszélye, hogy áruvá válik, amikor a hírverés olyan hosszú távú problémákba rendeződik, mint az ARR, az egységgazdaságosság és a mesterséges intelligencia megvalósításához kapcsolódó működési költségek.
A Synthesia a csütörtökön megjelenő új Expressive Avatarok leírása szerint az első a maga nemében: a világ első, teljesen mesterséges intelligenciával generált avatarja. A nagyméretű, előképzett modellekre épülő Synthesia azt állítja, hogy áttörése az volt, hogy hogyan kombinálják ezeket a multimodális eloszlásokat, amelyek jobban utánozzák az emberek beszédét.
Ezek menet közben jönnek létre, mondja Synthesia, ami azt a célt szolgálja, hogy közelebb álljon ahhoz a tapasztalathoz, amit átélünk, amikor beszélünk vagy reagálunk az életben. Ez ellentétben áll azzal, ahogy manapság sok, az avatarokon alapuló AI-videóeszköz működik: ezek általában sok videódarab, amelyeket gyorsan összeillesztve olyan arcreakciókat hoznak létre, amelyek többé-kevésbé összhangban vannak a bevitt szkriptekkel. őket. A cél az, hogy kevésbé robotikusnak és élethűbbnek tűnjön.
Előző verzió:
Új verzió:
Amint az a két példában látható, az egyik a Synthesia régebbi verziójából és a csütörtökön megjelenő, még mindig van mit tenni, amit maga Victor Riparbelli vezérigazgató is elismer.
Természetesen még nem 100%, de nagyon-nagyon hamarosan, az év végére. Annyira észbontó lesz, mondta a Gadget Insidernek. Azt hiszem, azt is láthatja, hogy ennek az AI része nagyon finom. Az embereknél rengeteg információ rejlik a legapróbb részletekben, az arcizmok legapróbb mozgásaiban is. Azt hiszem, soha nem tudnánk leülni és leírni: 'Igen, így mosolyogsz, amikor boldog vagy, de ez hamis, nem igaz?' mély tanulási hálózatok. Valójában képesek kitalálni a mintát, majd kiszámítható módon megismételni. Hozzátette, a következő, amin dolgozik, a kezek.
A kezek nagyon kemények, mondta.
A B2B-re való összpontosítás abban is segít, hogy a Synthesia jobban rögzítse üzeneteit és termékeit a biztonságos mesterséges intelligencia használatához. Ez alapvető fontosságú, különösen a mai hamisítások és a mesterséges intelligencia rosszindulatú célokra, például félretájékoztatás és csalás miatti óriási aggodalma miatt. Ennek ellenére a Synthesia-nak nem sikerült teljesen elkerülnie a vitákat ezen a fronton. A Synthesia technológiája korábban volt dolgokat propagandát gyártani Venezuelában és hamis Kína-barát közösségi média fiókok által népszerűsített híradások.
A vállalat megjegyezte, hogy további lépéseket tett a használat lezárására. Múlt hónap , frissítette irányelveit, hogy korlátozza az emberek által készíthető tartalom típusát, befektetve a rosszhiszemű szereplők korai felismerésébe, növelve a mesterséges intelligencia biztonságán dolgozó csapatokat, és kísérletezve a tartalom hitelesítési technológiákkal, például a C2PA-val.
A kihívások ellenére a cég tovább fejlődött.
vegas twitchcon
A Synthesia értéke legutóbb 1 milliárd dollár volt, amikor 90 millió dollárt gyűjtött. Nevezetesen, hogy az adománygyűjtés majdnem egy éve, 2023 júniusában történt.
Riparbelli a hónap elején egy interjúban elmondta, hogy jelenleg nem terveznek több emelést, bár ez nem igazán ad választ arra a kérdésre, hogy a Synthesia-t proaktívan megkeresik-e. (Megjegyzés: Nagyon izgatottak vagyunk, hogy a tényleges emberi Riparbelli felszólal egy májusi londoni rendezvényünkön, ahol minden bizonnyal újra fel fogok kérdezni erről. Kérem, jöjjön el, ha a városban tartózkodik.)
Amit biztosan tudunk, az az, hogy az AI felépítése és működtetése sok pénzbe kerül, a Synthesia pedig sokat épít és fut.
A csütörtöki verzió megjelenése előtt mintegy 200 000 ember több mint 18 millió videoprezentációt készített mintegy 130 nyelven a Synthesia 225 örökölt avatarja segítségével. (Nem derül ki, hogy hány felhasználó van a fizetős szintjein, de sok nagynevű ügyfél van, köztük a Zoom, a BBC, a DuPont és még sok más, és a vállalatok fizetnek.) Az induló vállalkozás reménye természetesen az, hogy az új verzió kiszorításával ezek a számok még jobban növekedni fognak.